大数据课程-学习十九周总结

news/2025/2/11 22:42:48/

4.2.8.修改表

4.2.8.1.表重命名
基本语法:
alter table old_table_name rename to new_table_name;

– 把表score3修改成score4
alter table score3 rename to score4;

4.2.8.2.增加/修改列信息
– 1:查询表结构
desc score4;
– 2:添加列
alter table score4 add columns (mycolx string, myscoy string);
– 3:查询表结构
desc score4;
– 4:更新列
alter table score4 change column myscox mysconew int;
– 5:查询表结构
desc score4;

4.2.8.3.删除表
drop table score4;

4.2.8.4.清空表数据
只能清空管理表,也就是内部表
truncate table score4;

4.2.9.hive表中加载数据
4.2.9.1.直接向分区表中插入数据
通过insert into方式加载数据
create table score3 like score;
insert into table score3 partition(month =‘202007’) values (‘001’,‘002’,100);

通过查询方式加载数据
create table score4 like score;
insert overwrite table score4 partition(month = ‘202006’) select sid,cid,sscore from score;

4.2.9.2.通过查询插入数据
通过load方式加载数据
create table score5 like score;
load data local inpath ‘/export/data/hivedatas/score.txt’ overwrite into table score5 partition(month=‘202006’);

4.2.9.2.1.多插入模式
常用于实际生产环境当中,将一张表拆开成两部分或者多部分
给score表加载数据
load data local inpath ‘/export/data/hivedatas/score.txt’ overwrite into table score partition(month=‘202006’);

创建第一部分表:
create table score_first( sid string,cid string) partitioned by (month string) row format delimited fields terminated by ‘\t’ ;

创建第二部分表:
create table score_second(cid string,sscore int) partitioned by (month string) row format delimited fields terminated by ‘\t’;

分别给第一部分与第二部分表加载数据
from score insert overwrite table score_first partition(month=‘202006’) select sid,cid insert overwrite table score_second partition(month = ‘202006’) select cid,sscore;

4.2.9.2.2.查询语句中创建表并加载数据(as select)
将查询的结果保存到一张表当中去
create table score5 as select * from score;

4.2.9.2.3.创建表时通过location指定加载数据路径
1)创建表,并指定在hdfs上的位置

create external table score6 (sid string,cid string,sscore int) row format delimited fields terminated by ‘\t’ location ‘/myscore6’;

2)上传数据到hdfs上
hadoop fs -mkdir -p /myscore6
hadoop fs -put score.txt/myscore6;

3)查询数据
select * from score6;


http://www.ppmy.cn/news/74089.html

相关文章

【模电实验】基本放大电路的研究实验

实验四 基本放大电路的研究实验(2小时) —、实验目的 (1)充分认识分压式偏置放大电路的电压放大作用,了解其静态工作点的调节、测量,认识截止失真和饱和失真现象,了解消除截止失真和饱和失真…

redis变慢解决梳理

使用层面 1、操作复杂比如聚合等操作不要再server上做 2、操作bigKey内存释放与申请都影响 3、redis过期策略有关,如果某一个时间有大量过期,过期也是主线程操作,这个也会影响客户端的响应,可以使用命令查看,可以把过期…

10-双令牌实现登录升级

我们需要实现三个接口: > 双令牌登录,返回两个token,accessToken和refreshToken。 > 退出账号 就是去数据库中把refreshToken删掉。 > 刷新accessToken, accessToken过期后,返回前端异常,然后前端需要刷新。就是通过refreshToken 查询数据库获取userid 在生成…

ArduPilot开源代码之AP_Param

ArduPilot开源代码之AP_Param 1. 源由2. AP_Param类3. AP_Param主要方法3.1 AP_Param3.2 setup3.3 initialised3.4 group_id3.5 copy_name_info3.6 copy_name_token3.7 find3.8 set_default_by_name3.9 set_defaults_from_table3.10 set_by_name3.11 get3.12 set_and_save_by_n…

【UE4】从零开始制作战斗机(上:准备模型、定义函数和变量)

资源连接:(链接) 步骤: 1. 下载完资源并解压,资源内容如下: 2. 将上图中所有的.fbx文件导入ue 使用默认的导入设置就行,直接点击导入所有 导入后内容如下: 将资源中的textures也导…

面试:BFC(块级格式上下文)

BFC的概念 BFC 是 Block Formatting Context 的缩写,即块级格式化上下文。BFC是CSS布局的一个概念,是一个独立的渲染区域,规定了内部box如何布局, 并且这个区域的子元素不会影响到外面的元素,其中比较重要的布局规则有…

基于postman测试接口(整套接口测试)(附视频教程加源码)

目录 可以解决的问题 开启控制台 单个测试尝试 使用请求结果当参数 打印结果(JSON) 自定义可视化结果 随机参数 测试用例连接 一键测试接口集合 从swagger导入接口 自定义全局变量 可以解决的问题 几百个接口人工测试接口过于繁杂大多测试无法使用请求结果当参数可以…

webpack基础

1. 当面试官问Webpack的时候他想知道什么 前言 在前端工程化日趋复杂的今天,模块打包工具在我们的开发中起到了越来越重要的作用,其中webpack就是最热门的打包工具之一。 说到webpack,可能很多小伙伴会觉得既熟悉又陌生,熟悉是…