大数据:诞生大数据,概述、大数据软件生态,Apache Hadoop概述

news/2025/3/4 6:56:52/

大数据:

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试
在这里插入图片描述


文章目录

  • 大数据:
    • @[TOC](文章目录)
  • 大数据
  • 大数据的诞生
  • 分布式处理技术
  • 大数据概述
  • 大数据软件生态
  • Apache Hadoop概述
  • 总结

大数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
各种操作行为的记录
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
用户是什么样的人?
他想要购啥物品,基本根据数据就可以拿下
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

大数据的诞生

在这里插入图片描述
在这里插入图片描述
计算机发明之前,是用纸来记录的
后来就是计算机记录
上世纪
都是独立的计算机
在这里插入图片描述
在这里插入图片描述
后来小规模互联互通
在这里插入图片描述
后来全球互联
在这里插入图片描述
在这里插入图片描述
随着全球互联网发展,用户越来越多
数据越来越大
很猛

就是大数据
太多了,你顶得住吗?
一个计算机解决不了这个问题

在这里插入图片描述
在这里插入图片描述

分布式处理技术

数据量大,用大规模服务器解决
要存
要算
传输
在这里插入图片描述
在这里插入图片描述
2008年前
小企业玩不了
大企业才有的

后来阿里云出现了
开源
Hadoop出现了
开源

在这里插入图片描述
牛逼
在这里插入图片描述
在这里插入图片描述
逐步开花结果
牛逼
在这里插入图片描述
核心就是分布式计算
存储和资源调度

Apache的Hadoop超级吊

大数据概述

在这里插入图片描述
在这里插入图片描述
本质就是分布式
海量数据的处理
背后的价值,挖掘
数字化时代
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
volume大体量,
variety数据种类来源多样化
value低价值密度,需要挖掘
velocity增长速度快,获取快,用得快,高性能
veracity数据的质量,准确,可信,结论靠谱才行
在这里插入图片描述
在这里插入图片描述
海量的、高增长的、多类别的、低信息密度的大数据中挖掘出有用高质量的结果
说白了,要计算
先存储
算的过程中,需要传输和调度
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

大数据软件生态

在这里插入图片描述
在这里插入图片描述
这波就是考网警所考的理论重点了
在这里插入图片描述
在这里插入图片描述
这点2023年网警特招就考了
HDFS,是分布式存储技术
HBase是nosql数据库技术
HBase就是基于HDFS的

在这里插入图片描述
存储技术

下面即计算技术
技术核心就是MapReduce
Hive就是基于MapReduce的数据库计算技术

在这里插入图片描述
特招网警考试必考这个
在这里插入图片描述

数据传输呢?
在这里插入图片描述
在这里插入图片描述

存储,计算,传输
仨都很丰富哦

在这里插入图片描述
在这里插入图片描述
Apache
是公司
在这里插入图片描述

Apache Hadoop概述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Apache软件基金会
分布式存储、计算、资源调度

在这里插入图片描述
大道至简,简单又重要

大数据:诞生大数据,概述、大数据软件生态,Apache Hadoop概述

在这里插入图片描述
资源调度就是传输数据

各种调来调去的
YARN的前瞻性功能,很重要。

在这里插入图片描述
GFS中的分布式存储
MapReduce就是分布式计算
它根据这仨论文,直接设计了Hadoop,开源了
牛逼
牛逼
牛逼

大佬
大佬
大佬

在这里插入图片描述
开源社区版本
商业发型版本
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Google还是牛逼的
它本身有这个技术


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。


http://www.ppmy.cn/news/106260.html

相关文章

MySQL 数值函数

文章目录 数值函数1. abs(num)2. ceil(num)3. floor(num)4. mod(num1,num2)5. rand()6. round(num,n)7. truncate(num,n)8. sqrt(num) 数值函数 数值函数用来处理数值方面的运算,能够提高用户的工作效率。常用的数值函数如下表所示,函数括号内为输入的参…

TortoiseGit的安装及使用, 并配合Gitee码云使用

Windows10下, TortoiseGit的安装及使用, 并配合Gitee码云使用! 1) 安装TortoiseGit 官网, 32位, 64位, 自选 Download – TortoiseGit – Windows Shell Interface to Git 2) 点击下载, 安装, 我选择的是64位, 中文安装包(说明: 中文安装包也分32, 64位), 这两个下载. Tips:…

在ubuntu上安装splint

lint lint是最著名的C语言工具之一,是由贝尔实验室SteveJohnson于1979在PCC(PortableC Compiler)基础上开发的静态代码分析,一般由UNIX系统提供。 工具介绍 与大多数C语言编译器相比,lint可以对程序进行更加广泛的错误分析,是一…

港联证券|散户为什么会追涨杀跌?如何避免?

股市是一个充满机会的地方,每天都有大量投资者在里面寻求财富。然而股市中很多散户都是亏损的,一个重要原因就是喜欢追涨杀跌。那么散户为什么会追涨杀跌?如何避免?港联证券也为大家准备了相关内容,以供参考。 散户为什…

【完整项目开发】Springboot+vue教学材料管理系统定制开发

Springbootvue 的专业建建设材料管理系统。 **大家好,今天分享最近做的一套系统。**起因源于小伙伴的需求 文末有的获取方式,如需定制系统,需求发来,我为你分忧,搞起 一、 项目介绍 基于各个专业,对教…

docker容器化编译C/C++程序

docker容器化编译C/C程序 文章目录 docker容器化编译C/C程序C/C程序为什么需要再容器内编译如何制作ubuntu下C/C编译镜像第一步,找一个基础镜像第二步,配置一下基础环境第三步:安装调试工具第四步:安装依赖库第五步: 安…

【T+】畅捷通T+设置收入成本配比结转

【问题需求】 收入成本配比原则是指: 取得的销售收入应与为取得该收入所发生的成本相匹配, 即先出库后销货时需要等收到销售发票才能确认成本, 先销货后出库时要先确认虚拟成本。 【解决方案】 重点:业务流程选择【单据立账】的情…

近代中国的三次思想文化运动

1、戊戌变法中维新派顽固派论战 第一次思想解放潮流是1898年维新派与顽固势力的论战。论战的内容有:要不要变法,要不要兴民权、实行君主立宪,要不要提倡西学、改变教育制度。此次论争是资本主义思想同封建主义思想的正面交锋,此后…