大数据:
2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试
文章目录
- 大数据:
- @[TOC](文章目录)
- 大数据:hive数据操作
- hive数据表操作
- 内部表操作
- 外部表
- hive 数据加载和导出
- 总结
文章目录
- 大数据:
- @[TOC](文章目录)
- 大数据:hive数据操作
- hive数据表操作
- 内部表操作
- 外部表
- hive 数据加载和导出
- 总结
大数据:hive数据操作
create database if not exists myhive;use myhive;
和sql类似的show database;desc database myhive;
create database myhive2 location '/myhive2';
自定义文件夹,放自己的地方
删除同样是drop
drop database myhive;
cascade;强制删除相关的表
create table test(id int);
建表之后就不能随便删除了
hive数据表操作
与sql类似
create table test(id int, name string, gender string);跟sql一样
drop table 表名;
easy
内部表操作
元数据和本身的数据,内部表,直接干掉
外部表值删除元数据,还没发删除数据本身
没有external,就是内部表
关键字修饰才外部
terminated by以,,,分割
delimited fields限定列字段
外部表
表和数据是独立的
链接
\t分隔符最好是设计好的
美滋滋
外部表有了,但是没用数据
我们可以上传数据进去
现有表,再有数据
表和数据是独立的,没有关联。
先创建数据
再建表,它链接
hive会主动链接和关联表和数据
反正就是说,外部表和数据是独立的
删除表,不影响数据本身哦,它只是去关联。
alter table 表名字 set tblproperties('EXTERNAL'='TRUE/FALSE');true就是外部
false就是内部
不能小写哦
只能大写哦
hive 数据加载和导出
local是Linux本地
覆盖数据
从表2中查数据,插入表1
普通插入
可以覆盖
好说
从文件到表
从表到表
数据加载的两种方式
只不过跟导入数据方向相反
导出到不同的地方,用词不同哦
总结
提示:重要经验:
1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。