Starrocks 存算分离 VS Trino 性能测试

embedded/2025/1/21 0:06:46/

Starrocks 存算分离 VS Trino 性能测试

集群规模

  • Starrocks :存算分离 ON HDFS;8C 48G * 4 个 compute_nodes 1 个 FE 节点 4C8G;开启 datacache
  • Trino : 13C 60G * 56 WORKER ; 整个公司公用,测试时负载较低;

测试结果记录

公司数仓生产数据,Trino 直连 Hive; Starrocks 使用 Hive catalog 外表进行查询:

  • 测试1 : select count(1) from prd_ods.test_tb where dt >='20240101'

    数据量:145661928137

    Trino耗时:2m6s

    Starrocks耗时: 1m30s

  • 测试2: select min(dt),max(dt) from hive.prd_ods.test_tb where dt >='20240101';

    数据: 145661928137

    Trino耗时:1m 40s

    Starrocks耗时: 4s

  • 测试3:select count(1) from hive.prd_ods.test_tb where dt ='20240131';

    数据: 2376708461

    Trino耗时:31s

    Starrocks耗时: 5s

  • 测试5 :

    select  good_code,address_code,sum(money),sum(qty)
    from hive.prd_ods.test_tb  where dt  ='20240131'
    group by good_code,address_code ;
    

    数据: 2376708461

    Trino耗时:累计使用内存达到 22T 查询失败(控制程序 KILL 大查询)

    Starrocks耗时: 13s

  • 测试 6 :

    select *
    from hive.prd_ods.test_tb where dt  ='20240131' and good_code = 'xxxx' and address_code = 'xxxx';
    

    数据: 2376708461

    Trino耗时:19s

    Starrocks耗时: 9s

总结

此次分别从 聚合, 点查,分组等各种SQL进行测试;数据量都在 10 亿级别;综合性能 SR 领先 Trino。测完 下班 !!!


http://www.ppmy.cn/embedded/155623.html

相关文章

(2)Elasticsearch8.17的web管理工具:kibana

上篇我们按照了ES-head web管理工具; 多个请求不能同时的清晰的显示,只会在历史栏种看到。 本次介绍kibana 1、下载地址,可以看到中间有版本好8.17,需要说明:kibana的版本号必须和elasticsearch的版本号相同 https…

《手写Mybatis渐进式源码实践》实践笔记(第九章 细化XML语句构建器)

文章目录 第九章 细化XML 语句构建器背景技术背景迪米特法则1. 通俗解释:2. 迪米特法则的要点:3. 举例:违反迪米特法则的代码:改进后的代码(符合迪米特法则): 业务背景 目标设计实现工程代码类图…

使用Python爬虫获取1688网站item_get_company API接口的公司档案信息

一、引言 在当今的商业环境中,获取供应商的详细信息对于采购决策、市场分析和供应链管理至关重要。1688作为中国领先的B2B电子商务平台,提供了丰富的供应商档案信息。通过使用1688的item_get_company API接口,我们可以方便地获取这些信息。本…

【机器学习】鲁棒(健壮)回归-RANSAC(Random Sample Consensus)算法

RANSAC算法 RANSAC(Random Sample Consensus)是一种用于估计数据中包含异常值时的模型参数的迭代算法,特别适用于数据包含噪声或离群点的情况。 核心思想 RANSAC通过随机采样和一致性验证来找到能够最大化拟合数据模型的参数,重…

网络协议基础--协议分层

一.协议概述 1.TCP/IP 传输协议概述 TCP/IP 传输协议,即传输控制 / 网络协议,也被称作网络通讯协议。它是网络中使用的最基本通信协议,对互联网中各部分进行通信的标准和方法予以规定。通常所说的 TCP/IP 协议并非仅指 TCP 和 IP 两个协议&a…

【书生大模型实战营】Git 基础知识-L0G3000

本文是书生大模型实战营系列的第三篇文章,本文的主题是:Git基础知识点。 原始教程链接:Tutorial/docs/L0/git/readme.md at camp4 InternLM/Tutorial 1.Git总览 什么是Git? Git是一个分布式版本控制系统,广泛用于…

Java 高级工程师面试高频题:JVM+Redis+ 并发 + 算法 + 框架

前言 在过 2 个月即将进入 3 月了,然而面对今年的大环境而言,跳槽成功的难度比往年高了很多,很明显的感受就是:对于今年的 java 开发朋友跳槽面试,无论一面还是二面,都开始考验一个 Java 程序员的技术功底…

去哪儿kafka优化案例

一、背景介绍 集群概况 去哪儿旅行当前KAFKA日志集群节点145台。单机配置:3TSSD盘,40核,128G内存。 业务背景 日志KAFKA集群承载了全司的APPCODE日志,比如我们常用的QTRACE日志,以及实时离线数仓数据。体量非常大。…