阿里云数据库 SelectDB 版全面商业化,开启现代化实时数据仓库的全新篇章

devtools/2024/10/23 12:27:09/

2024 年 5 月 21 日,由阿里云联合飞轮科技共同举办的「阿里云数据库 SelectDB 版商业化产品发布会」于线上召开。阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞宣布,阿里云数据库 SelectDB 版在中国站及国际站全面发布,正式开启商业化的全新篇章!

Banner.jpeg

阿里云数据库 SelectDB 版是专为现代企业量身定制的实时数仓解决方案,植根于开源 Apache Doris 的坚实基础,却不止于此——深度融合云随需而用的特性,依托阿里云基础设施,构建起云原生存算分离的全新架构,面向企业海量数据的实时分析需求,提供极速实时、湖仓融合统一、简单易用的云上数仓服务。

早在 2023 年初,阿里云与飞轮科技开启战略合作,围绕实时数据仓库这一方向不断深耕,探索符合现代化实时数据仓库的新标准。在一年多的时间中,双方的战略合作不断加深:

<a class=阿里云数据库 SelectDB 版.PNG" height="720" src="https://img-blog.csdnimg.cn/img_convert/ea660243239b6567ee93c54f75a8bb9a.png" width="1200" />

在历经近一年的邀测及公测阶段后,直至今日,阿里云 SelectDB 已赢得数百家企业的信赖与大规模应用实践。

发布会上,阿里云数据库产品事业部负责人李飞飞开场,正式宣布 SelectDB 已准备好迎接全球范围内客户在海量数据实时分析领域的挑战,与服务大型企业级市场的实力与决心!

随后,飞轮科技首席执行官、Apache Doris 创始人马如悦介绍了现代化实时数据仓库 SelectDB 的四大核心特性:

  • 实时极速: 数据延迟和查询延迟是衡量实时分析的两个核心指标,SelectDB 以实时的数据导入和数据存储确保分析数据的新鲜性,以极速高并发的数据查询满足响应的及时性。
  • 融合统一SelectDB 作为现代化统一的数据仓库,单一系统支持多种数据源、多种数据类型和多种数据分析场景。All-In-One 的分析平台,更加易于使用和管理,让企业精力从管理复杂的数据基础设施转为关注上层的数据应用。
  • 弹性架构SelectDB 极致的弹性架构依托三种分离:计算与计算分离,实现了更细粒度的计算资源的管理;不同热度的数据分层存储,在不损失存储性能的情况下实现存储成本的大幅下降;存储计算分离,让存储和计算实现真正的独立扩缩容。
  • 开放生态SelectDB 基于 Apache Doris 构建,与 Apache Doris 100% 兼容;采用开放的 SQL 和广泛使用的 MySQL 协议,确保系统学习和对接下游应用成本极低;同时提供开放的数据读写 API,让大数据生态产品可以自由访问,防止数据被锁定在单一系统中、形成数据孤岛。

现代化实时<a class=数据仓库 SelectDB 的四大核心特性.PNG" height="590" src="https://img-blog.csdnimg.cn/img_convert/62fccab29495e702ddba0d82647ec87a.png" width="1200" />

接着,阿里云数据库产品专家艾乐强SelectDB的核心能力进行了解读。

  • 高吞吐数据写入及实时更新: 支持主键表(Unique Key)进行高效的数据更新,并对 Upsert、条件更新/条件删除、部分列更新、分区覆盖等各类更新提供了完备的支持,不仅满足高效灵活的数据更新需求,还可以对海量可变的数据更新提供支持。
  • 极致的查询性能: 采取更先进的 Cascades 框架,实现更智能化的自适应调优;采取 MPP 并行执行模型,引入了自适应的 Pipeline 执行模型,提升了SelectDB对于 CPU 多机多核的资源利用率;实现了全面向量化,并对执行算子进行了优化;支持多种索引结构进行查询时数据剪枝优化。
  • 基于Multi-Catalog 的湖仓一体能力: 自动同步数据目录的数据库和表,元数据自动刷新,并采用高效数据缓存和Native Reader ,较 Presto/ Trion 性能提高 3-5倍。
  • 高性价比日志分析方案:利用倒排索引快速精准定位匹配的数据,结合时序存储模型特点和 TopN 查询的动态剪枝算法,相较于传统方案能够实现 4.2 倍的写入性能提升和 2.3 倍的查询性能提升。

<a class=SelectDB 云原生存算分离系统架构.PNG" height="466" src="https://img-blog.csdnimg.cn/img_convert/f46c0e7f1b9cc606a048f9f435ddf347.png" width="1200" />

其次,飞轮科技云原生研发负责人周飞分享了 SelectDB 云原生存算分离系统架构背后的设计与思考,并介绍了最新版本能力。SelectDB 内核基于 Apache Doris 最新发布的 2.1 版本打造,引入了自适应的 Pipeline 并行执行框架、异步物化视图、基于 Arrow Flight 的高速读取接口、自增列、自动分区以及服务端攒批等一系列重磅特性,在 TPC-H 1TB 测试数据集上获得超过 100% 的性能提升,查询性能居于业界领先地位。

此外,雅迪和编程猫作为典型客户,分享了在阿里云数据库 SelectDB 企业版上的应用实践经验。

  • 北极星平台作为雅迪内部的核心数据分析系统,通过实时监控营销指标,帮助管理者即时洞察市场动态。在升级阿里云 SelectDB 后,面对海量数据高并发、多维度、多指标的查询需求,查询耗时从原有的平均 7 秒缩短至 1 秒以内,极大提升用户查询数据的效率和满意度,增强了决策支持的及时性。在相同业务负载下,所需服务器资源降低至原先的 1/3-1/4,硬件成本也大幅降低
  • 编程猫曾围绕 Hadoop 生态构建了大数据系统,并引入了 Hive、Spark、Presto、HBase、ClickHouse 等多个大数据组件。在数据开发过程中,繁杂的技术栈带来了庞大的维护压力,不同组件 SQL 语法不统一、学习成本高,同时数据中间结果依赖 Hive 进行计算、数据分析时需要等待。基于以上需求,编程猫选择基于 SelectDB 作为数据仓库底座进行升级。 在架构升级完成后,SelectDB 真正做到了集存储、计算、查询服务为一体,大大简化了系统架构,加快了开发速度,使得数据的持续部署、持续开发、持续集成变得更简单。

雅迪和编程猫的宝贵实践经验分享以及所收获的显著成效,无疑是对 SelectDB 强大功能与卓越价值的最佳注解。

最后,飞轮科技技术副总裁肖康介绍了日志系统的典型架构和面临的挑战,并分享了如何基于 SelectDB 打造新一代日志分析平台。相较于典型的 ELK 架构,阿里云 SelectDB 实现了 3-5 倍的写入吞吐提升、存储空间降低 80%、查询性能得到 2-3 倍,综合性价比提升达十倍

限时优惠大放送

限时优惠大放送.PNG

为了庆祝阿里云数据库 SelectDB 版的正式商业化,新用户首月首购、尊享 0.1-0.5 折震撼优惠 8 核 64GB + 400GB 缓存,仅需 84.29 元/月,更有 500GB 存储低至 0.6 元/月,立即点击产品页,解锁专属优惠,开启下一代实时数仓新篇章!

快来关注

  1. 点击观看发布会直播回放
  2. 点击了解更多产品详细信息
  3. 点击填写调研问卷赢取精美礼品​

http://www.ppmy.cn/devtools/43325.html

相关文章

【代码随想录——回溯算法——三周目】

1. 子集2 这题需要先进行排序&#xff0c;和候选人那题类似。防止出现重复的子集。 func subsetsWithDup(nums []int) [][]int {path : make([]int, 0)res : make([][]int, 0)sort.Ints(nums)var dfs func(nums []int, start int)dfs func(nums []int, start int) {res app…

element ui 的el-input输入一个字后失去焦点,需重新点击输入框才能再次输入!

解决方案&#xff1a; 我是form表单嵌套表格&#xff0c;里面的el-input输入框&#xff0c;输入第一个值的时候会突然失去焦点&#xff0c;需要再次点击输入框才能正常输入&#xff0c;原因是table的key值&#xff0c;需要改成正常的index即可&#xff0c;如果你是循环的&…

Spring Boot集成rss快速入门demo

1.什么是rss&#xff1f; RSS 的全称是「简易内容聚合」&#xff08;Really Simple Syndication&#xff09;&#xff0c;是一个能让你在一个地方订阅各种感兴趣网站的工具。 一个网站支持 RSS&#xff0c;就意味着每当它新发布一篇新文章&#xff0c;就会往一个位于特定网址的…

BioTech - 使用 循环(Recycle)迭代的蛋白质结构预测 获取 高精度结构

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/139239077 高精度的蛋白质结构对于理解生物问题具有极其重要的意义。蛋白质是生物体内执行多种功能的基本分子,其结构决定了其功能。蛋白质的三维结构可以帮…

Git命令之江湖百晓生

Git 命令大全 第一章&#xff1a;Git 简介 Git 是一个开源的分布式版本控制系统&#xff0c;由 Linus Torvalds 于 2005 年创建&#xff0c;用于有效、高速地处理从小到大的项目。它是一个命令行工具&#xff0c;用于跟踪和管理源代码历史记录。 第二章&#xff1a;Git 的 1…

【MySQL精通之路】全文搜索(9)-全文解析器-MeCab

主博客&#xff1a; 【MySQL精通之路】全文搜索功能-CSDN博客 目录 1.介绍 2.安装MeCab Parser插件 3.创建使用MeCab分析器的FULLTEXT索引 4.MeCab Parser空间处理 5.MeCab分析程序停止字处理 6.MeCab Parser术语搜索 7.MeCab分析程序通配符搜索 8.MeCab语法分析器短语…

设计模式——概述

1.设计模式定义 ​ 设计模式是软件设计中常见问题的典型解决方案,可用于解决代码中反复出现的设计问题。设计模式的出现可以让我们站在前人的肩膀上&#xff0c;通过一些成熟的设计方案来指导新项目的开发和设计&#xff0c;以便于我们开发出具有更好的灵活性和可扩展性&#…

重新安装 Windows 10/11 后如何恢复丢失的数据?

“嗨&#xff0c;我的 Windows 10/11 崩溃了&#xff0c;所以我不得不重新安装它。我使用 USB 可启动驱动器重新安装了操作系统。但是&#xff0c;重新安装后&#xff0c;C 盘上的所有先前文件都丢失了。有什么方法可以恢复丢失的文件吗&#xff1f;” - 孙雯 在大多数情况下&…