Hive 1

news/2024/11/30 18:51:06/

简介

hive是使用SQL完成大数据统计分析的工具。

hive是facebook公司开源的工具，用来解决海量的结构化日志的统计问题。

hive是构建在hadoop之上的数据仓库。

HDFS: hive的数据是放在HDFS (distributed storge)，元数据(metadata)存在对应的底层关系型数据库，一般是MySQL

MR(计算引擎): hive的作业(SQL)是通过hive的框架翻译成MR作业

Yarn: hive的作业是提交到Yarn.上去运行的

hive其实就是一一个客户端，没有集群的概念，提交作业到集群的Yarn.上面去运行(没有感情的提交机器)

SQL ==> Hive ==> MR ==> Yarn

distributed storge

HDFS， AWS S3，各种云OOS COS

这些系统，hive都可以对接，只要有对应的jar包，本地的文件系统(file开头)也可以对接

metadata

统一的元数据管理

元数据：描述数据的数据

Hive适用场景

批处理/离线处理

Hive的优缺点

优点:易上手，比MR使用起来简单多了

缺点:延时性高

作业

1.MPP数据库的概念以及有哪些？

MPP (Massively Parallel Processing)，即大规模并行处理。简单来说，MPP是将任务并行的分散到多个服务器和节点上，在每个节点上计算完成后，将各自部分的结果汇总在一起得到最终的结果(与Hadoop相似)。

常见的MPP数据库GreenPlum、Vertica、Sybase IQ、TD Aster Data

2.在hive建表时,metastore哪些表会有改动？

TBLS、TABLE_PARAMS

3.优势洗牌

class Solution {public int[] advantageCount(int[] a, int[] b) {int i,j,k,n,temp;n=a.length;//将数组a从小到大排序for(i=0;i<n-1;i++){for(j=0;j<n-i-1;j++){if(a[j]>a[j+1]){temp = a[j];a[j]=a[j+1];a[j+1]=temp;}}}for(i=0;i<n-1;i++){for(j=i;j<n;j++){if(a[i]>b[i]) break;if(a[j]>b[i]){//将a[j]移到a[i],中间的依次后移一位temp = a[j];for(k=j;k>i;k--){a[k]=a[k-1];}a[i]=temp;}}}return a;}
}

http://www.ppmy.cn/news/757873.html

相关文章

python第三方库pygame的使用

python第三方库pygame的使用

作用：pygame一般用来做游戏注意：1.在使用pygame提供的功能之前，需要调用init方法 2.在游戏结束前需要调用 quit 方法 pygame中的各个函数： 1.pygame.init()：该函数在使用pygame时进行初始化，只有引用了该…

阅读更多...

BUU[SCTF2019]Who is he

BUU[SCTF2019]Who is he

unity 用dnspy打开Assembly-CSharp.dll，分析主要加密分析加密函数，DES加密（key和vi一样），和Base64 根据已知数据解密 ，但是在C#中，字符串默认是Unicode字符串，所以转成字节数组&am…

阅读更多...

Qt自定义控件-坐标原点位置变化

Qt自定义控件-坐标原点位置变化

1、qt界面默认绘制坐标是从左上角为原点进行绘制的，如下图所示： 2、重新设置原点位置利用painter.translate函数将原点位置控制到指定位置例如：先绘制一个矩形，然后将矩形的中心点作为原点再画直线 void paintEvent(QPaintEve…

阅读更多...

ROS：工作空间覆盖

ROS：工作空间覆盖

目录一、概念二、示例2.1操作2.2原因三、存在的问题一、概念所谓工作空间覆盖，是指不同工作空间中，存在重名的功能包的情形。 ROS 开发中，会自定义工作空间且自定义工作空间可以同时存在多个，可能会出现一种情况: 虽然特定工…

阅读更多...

解决Github下载速度慢的问题

解决Github下载速度慢的问题

分享两款github加速插件来解决Github资源下载速度慢的问题。这两款脚本使用方法相同，都需要使用脚本管理工具来运行，首先要给你的浏览器安装Tampermonkey（油猴脚本管理器），安装油候脚本管理器后，直接打开这…

阅读更多...

git官网下载太慢解决方法

git官网下载太慢解决方法

下载传送门 https://npm.taobao.org/mirrors/git-for-windows/ 选择版本进入后，选择你想要的版本，它里面是降序排序。我想下载新版本怎么做？：拉到最底部，如下图所示： 2. 我想下载旧版本怎么做&#…

阅读更多...

git下载速度慢解决方案汇总（git慢，亲测第二种方法简单贼快）

git下载速度慢解决方案汇总（git慢，亲测第二种方法简单贼快）

如果是文件本身过大的话，可以考虑使用: 一. 使用git shallow clone来下载 git clone https://github.com/xxx --depth 1 cd xxx git fetch --unshallow 解释一下这两条命令: git clone --depth 1 本身会让clone下来的是最近的一个commit的文件夹状态&#xff0c…

阅读更多...

flutter下载慢

flutter下载慢

这里是下载慢 maven { url "https://storage.googleapis.com/download.flutter.io" }maven { url https://maven.aliyun.com/repository/google }maven { url https://maven.aliyun.com/repository/jcenter }maven { url https://maven.aliyun.com/nexus/content/gro…

阅读更多...

最新文章