2023-04-17 stonedb-X100引擎-聚合-思考

news/2025/1/16 1:53:29/

摘要:

最近在分析将X100引擎的处理做更为精细化的处理, 一个非常经典的场景以及算子便是聚合的处理。

本文对聚合要面临的问题做思考. 其中将视角切换为将mysql列存储的聚合做X100引擎的处理。

X100引擎:

2023-04-13 MonetDB/X100: Hyper-Pipelining Query Execution_禅定悟世的博客-CSDN博客

mysql列存储的聚合处理:

面临问题:

对列数据的访问方式导致难以在多线程切片时做到线程安全
聚合使用的hash表的key, 直接数据拷贝grouping的列
采用了经典的火山模型

导致的困境:

列数据横向切片的困难, 导致了无法做到线程并行
突入表现在
1. 线程安全, 临界区界定模糊, 导致在访问数据时的错误
2. 一些数据类型在访问时候计算, 比如decimal, 导致多个线程同时修改同一份数据
聚合的hahs表使用grouping列的值当作key, 最突出的问题就是导致了性能和内存占用
火山模型则导致了向量化的问题
1. 火山模型的iterator导致了数据的访问非向量化
2. 不利于CPU的cache
3. 在火山模型的访问的过程中生成聚合hash导致多流水线分支预测的生效

数据存储的方式:

<

http://www.ppmy.cn/news/300402.html

相关文章

dolphinscheduler 3.0.1数据质量

dolphinscheduler 3.0.1数据质量

dolphinscheduler 3.0.1数据质量 🐬环境配置🐬定义质量节点测试🐠运行失败 🐬源码其它(spark-submit)20221114补充 🔼上一集：dolphinscheduler 3.0.1 资源中心 *️⃣主目录：dolphinscheduler 3.…

阅读更多...

【FT2000/4+X100】调试记录

【FT2000/4+X100】调试记录

硬件环境FT2000/4X100，单板结构，对外显示，运行银行麒麟操作系统。 ## 一生成UEFI.BIN，烧写在FT2000-4的QSPI Flash中下载源文件 edk2-for-support.tar； 参考文件 ft2004c&D2000编译打包说明V1.0.5； …

阅读更多...

枭龙智能眼镜 XLOONG X100 Glass拆解

枭龙智能眼镜 XLOONG X100 Glass拆解

↓这里只拆到主板过，首先需要对带Glass的可拆卸配件进行壳体加热，主机外壳有密封胶，吹风机对主机外壳的接缝处进行加热，可以从下侧的点开始用撬棒拆 ↑拆开一个角之后沿着边慢慢打开，如果还是有阻尼感打不开 &#xff…

阅读更多...

Hbase---hfile

Hbase---hfile

逻辑数据组织格式 Scanned block section：表示顺序扫描HFile时（包含所有需要被读取的数据）所有的数据块将会被读取，包括Leaf Index Block和Bloom Block；Non-scanned block section：HFile顺序扫描的时候该…

阅读更多...

测试真的会被ChatGPT代替一文告诉你

测试真的会被ChatGPT代替一文告诉你

送走最后一车货，最后三个工人，老王吃力的关上大铁门。左手从口袋摸出一盒烟，轻轻一颠，滑落一根，右手娴熟的夹住。掏出打火机，点燃，一丝青烟腾起，萦绕在指头。夕阳穿过玻璃&#xf…

阅读更多...

Git教程笔记

Git教程笔记

概念 Git是一个分布式版本控制工具，主要用于管理开发过程中的源代码文件（Java类、xml文件、html页面等）在软件开发过程中被广泛使用。 Git常用命令 Git全局设置获取Git仓库工作区、暂存区、版本库概念 Git工作区中文件的状态工作区中…

阅读更多...

Kubernetes StatefulSet之volumeClaimTemplates

Kubernetes StatefulSet之volumeClaimTemplates

在 Kubernetes 中，StatefulSet 是用于管理有状态应用的控制器对象。它确保每个 Pod 都有唯一的标识符和稳定的网络标识，并按照顺序进行部署和终止。StatefulSet 还提供了一种方便的方式来管理这些有状态应用所需的持久化存储。 volumeClaimTemplates 是…

阅读更多...

实时检测Aruco标签坐标及位姿opencv-python4.6和4.7版本

实时检测Aruco标签坐标及位姿opencv-python4.6和4.7版本

先说opencv-contrib-python4.7.0.72时，aruco下面带曲线，但是程序也能跑，可以跑检测的，对比4.6版本需要改三个函数 4.6装opencv-contrib-python 4.7装opencv-contrib-python 1 cv2.aruco.Dictionary_get() cv2.aruco.getPredef…

阅读更多...

最新文章