Hive 1

news/2024/11/30 18:51:06/

简介

hive是使用SQL完成大数据统计分析的工具。

hive是facebook公司开源的工具,用来解决海量的结构化日志的统计问题。

hive是构建在hadoop之上的数据仓库。

        HDFS: hive的 数据是放在HDFS (distributed storge), 元数据(metadata)存在对应的底层关系型数据库,一般是MySQL

MR(计算引擎): hive的作 业(SQL)是通过hive的框架翻译成MR作业

Yarn: hive的 作业是提交到Yarn.上去运行的

hive其实就是一一个客户端,没有集群的概念,提交作业到集群的Yarn.上面去运行(没有感情的提交机器)

SQL ==> Hive ==> MR ==> Yarn

distributed storge

HDFS, AWS S3,各种云OOS COS

这些系统,hive都可以对接,只要有对应的jar包,本地的文件系统(file开头)也可以对接

metadata

统一的元数据管理

元数据:描述数据的数据

Hive适用场景

批处理/离线处理

Hive的优缺点

优点:易上手,比MR使用起来简单多了

缺点:延时性高

作业

1.MPP数据库的概念以及有哪些?

MPP (Massively Parallel Processing),即大规模并行处理。简单来说,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果(与Hadoop相似)。

常见的MPP数据库GreenPlum、Vertica、Sybase IQ、TD Aster Data

2.在hive建表时,metastore哪些表会有改动?

TBLS、TABLE_PARAMS

3.优势洗牌

class Solution {public int[] advantageCount(int[] a, int[] b) {int i,j,k,n,temp;n=a.length;//将数组a从小到大排序for(i=0;i<n-1;i++){for(j=0;j<n-i-1;j++){if(a[j]>a[j+1]){temp = a[j];a[j]=a[j+1];a[j+1]=temp;}}}for(i=0;i<n-1;i++){for(j=i;j<n;j++){if(a[i]>b[i]) break;if(a[j]>b[i]){//将a[j]移到a[i],中间的依次后移一位temp = a[j];for(k=j;k>i;k--){a[k]=a[k-1];}a[i]=temp;}}}return a;}
}


http://www.ppmy.cn/news/757873.html

相关文章

python第三方库pygame的使用

作用&#xff1a;pygame一般用来做游戏 注意&#xff1a;1.在使用pygame提供的功能之前&#xff0c;需要调用init方法 2.在游戏结束前需要调用 quit 方法 pygame中的各个函数&#xff1a; 1.pygame.init()&#xff1a;该函数在使用pygame时进行初始化&#xff0c;只有引用了该…

BUU[SCTF2019]Who is he

unity 用dnspy打开Assembly-CSharp.dll&#xff0c;分析主要加密 分析加密函数&#xff0c;DES加密&#xff08;key和vi一样&#xff09;&#xff0c;和Base64 根据已知数据解密 &#xff0c;但是在C#中&#xff0c;字符串默认是Unicode字符串&#xff0c;所以转成字节数组&am…

Qt自定义控件-坐标原点位置变化

1、qt界面默认绘制坐标是从左上角为原点进行绘制的&#xff0c;如下图所示&#xff1a; 2、重新设置原点位置 利用painter.translate函数将原点位置控制到指定位置 例如&#xff1a;先绘制一个矩形&#xff0c;然后将矩形的中心点作为原点再画直线 void paintEvent(QPaintEve…

ROS:工作空间覆盖

目录 一、概念二、示例2.1操作2.2原因 三、存在的问题 一、概念 所谓工作空间覆盖&#xff0c;是指不同工作空间中&#xff0c;存在重名的功能包的情形。 ROS 开发中&#xff0c;会自定义工作空间且自定义工作空间可以同时存在多个&#xff0c;可能会出现一种情况: 虽然特定工…

解决Github下载速度慢的问题

分享两款github加速插件来解决Github资源下载速度慢的问题。 这两款脚本使用方法相同&#xff0c;都需要使用脚本管理工具来运行&#xff0c;首先要给你的浏览器安装Tampermonkey&#xff08;油猴脚本管理器&#xff09;&#xff0c;安装油候脚本管理器后&#xff0c;直接打开这…

git官网下载太慢解决方法

下载传送门 https://npm.taobao.org/mirrors/git-for-windows/ 选择版本 进入后&#xff0c;选择你想要的版本&#xff0c;它里面是 降序排序。 我想下载新版本怎么做&#xff1f;&#xff1a;拉到最底部&#xff0c;如下图所示&#xff1a; 2. 我想下载旧版本怎么做&#…

git下载速度慢解决方案汇总(git慢,亲测第二种方法简单贼快)

如果是文件本身过大的话&#xff0c;可以考虑使用: 一. 使用git shallow clone来下载 git clone https://github.com/xxx --depth 1 cd xxx git fetch --unshallow 解释一下这两条命令: git clone --depth 1 本身会让clone下来的是最近的一个commit的文件夹状态&#xff0c…

flutter下载慢

这里是下载慢 maven { url "https://storage.googleapis.com/download.flutter.io" }maven { url https://maven.aliyun.com/repository/google }maven { url https://maven.aliyun.com/repository/jcenter }maven { url https://maven.aliyun.com/nexus/content/gro…