HBase(17):表空间设计之数据压缩

news/2024/10/18 7:58:07/

1 压缩算法

在HBase可以使用多种压缩编码,包括LZO、SNAPPY、GZIP。只在硬盘压缩,内存中或者网络传输中没有压缩。

压缩算法压缩后占比压缩解压缩
GZIP13.4%21 MB/s118 MB/s
LZO20.5%135 MB/s410 MB/s
Zippy/Snappy22.2%172 MB/s409 MB/s

  • GZIP的压缩率最高,但是其实CPU密集型的,对CPU的消耗比其他算法要多,压缩和解压速度也慢;
  • LZO的压缩率居中,比GZIP要低一些,但是压缩和解压速度明显要比GZIP快很多,其中解压速度快的更多;
  • Zippy/Snappy的压缩率最低,而压缩和解压速度要稍微比LZO要快一些
  • 本案例采用GZ算法,这样可以确保的压缩比最大化,更加节省空间

2 查看表数据压缩方式

通过以下输出可以看出,HBase创建表默认是没有指定压缩算法的


http://www.ppmy.cn/news/701384.html

相关文章

MATLAB里conv(x1,x2)函数使用注意事项

MATLAB提供卷积运算的函数,一维信号卷积函数是conv(x1,x2),其中x1和x2分别是参与卷积的两个信号。 如果x1和x2是连续函数,那么在表达这两个信号的时候,需要一个采样的过程,举例:t10:0.01:1,x1fu…

微信小程序搜索

js: data: { // 数据源 source:[ "vivo x7", "vivo x9", "vivo x21", "vivo s7", "vivo s9", "vivo s21", "vivo s29" ], // 搜索结果 ret:[], // 延时标识 timer:null }, // 输入搜索词 searc…

python做一个销售管理系统_python实现手机销售管理系统

本文实例为大家分享了python实现手机销售管理系统的具体代码,供大家参考,具体内容如下 要求如下: 手机销售系统 手机品牌 手机价格 库存数量 vivoX9 2798 25 iphone7(32G) 4888 31 iphone7(128G) …

回归-多项式回归

1、什么是多项式回归 线性回归适用于数据呈线性分布的回归问题.如果数据样本呈明显非线性分布,线性回归模型就不再适用(下图左),而采用多项式回归可能更好(下图右).例如: 2、模型定义 与线性模…

Python手机销售系统

手机销售系统手机品牌 手机价格 库存数量vivoX9 2798 25iphone7(32G) 4888 31iphone7(128G) 5668 22iphone7P(128G) 6616 29iphone6(16G) 3858 14............ 功能要求:四个选项:1.查看所有手机品牌1.vivoX92.iphon…

Python数据拟合:线性、多项式和对数拟合

Python数据拟合:线性、多项式和对数拟合 在数据分析中,拟合是一种常用的方法,可以通过将数据点与一个特定类型的函数进行匹配来预测未来的趋势。Python提供了多种拟合方法,包括线性、多项式和对数拟合。 一. 线性拟合 线性拟合是将数据点拟合成一条直线的过程。在Python…

基于python的-手机销售系统

# 手机销售系统 # 手机品牌 手机价格 库存数量 # vivoX9 2798 25 # iphone7(32G) 4888 31 # iphone7(128G) 5668 22 # iphone7P(128G) 6616 29 # iphone6(16G) 3858 14 # .... # ..…

MATLAB-多项式曲线回归拟合

利用多项式函数拟合数据点 ,多项式函数的形式如下: 令 ,