大数据:分布式计算,MapReduce,hadoop的计算组件,hive是sql分布式计算框架,底层就是基于MapReduce的

news/2024/11/9 0:59:20/

大数据:分布式计算,MapReduce,hadoop的计算组件,hive是sql分布式计算框架,底层就是基于MapReduce的

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • 大数据:分布式计算,MapReduce,hadoop的计算组件,hive是sql分布式计算框架,底层就是基于MapReduce的
    • @[TOC](文章目录)
  • 大数据:分布式计算
  • MapReduce
  • 总结

大数据:分布式计算

在这里插入图片描述
在这里插入图片描述
分布式存储hdfs【hadoop存储机制】
分布式计算MapReduce【hive是基于这个东西的】
yarn就是资源调度的好东西

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
数量取胜
主要是分开玩
一个机子顶不住
数据太大了,你一个人搞得定吗??????????

在这里插入图片描述

算了几年你也算不完啊
在这里插入图片描述
在这里插入图片描述
这就是分布式计算
多分开很多机子算
这样速度快点

多个机子很多,需要调度,统一管理,中央集权
这样方便,高效
在这里插入图片描述
分散汇总:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
每个省事查自己的人口,
中央汇总统计即可

美滋滋

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这里复杂就是数据可能需要交换
在这里插入图片描述
公司管理都是这么玩的
经常
MapReduce就是分散汇总
spark和flink就是中心调度模式

在这里插入图片描述

MapReduce

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
映射分散
聚合汇总
这就是MapReduce

在这里插入图片描述
在这里插入图片描述
分part123
在这里插入图片描述
各自统计自己的任务
得到任务结论
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
MapReduce是非常简单的算法原理
easy

它是核心,和根基
后面的hive框架,是很火
hive是分布式sql的计算框架
底层就是MapReduce

在这里插入图片描述


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。


http://www.ppmy.cn/news/141391.html

相关文章

Java学习笔记——CookieSession

文章目录 今日内容 会话技术CookieJSP入门学习Session案例:验证码 今日内容 1、会话技术 1、Cookie 2、Session 2、JSP:入门学习 会话技术 1、会话:一次会话中包含多次请求和响应。 一次会话:浏览器第一次给服务器资源发送请求…

设计模式之~迭代器模式

迭代器模式: 迭代器(Iterator)模式,又叫做游标(Cursor)模式。GOF 给出的定义为:提供一种方法顺序访问一个容器(container)对象中各个元素,而又不需暴露该对象…

【LeetCode】HOT 100(3)

题单介绍: 精选 100 道力扣(LeetCode)上最热门的题目,适合初识算法与数据结构的新手和想要在短时间内高效提升的人,熟练掌握这 100 道题,你就已经具备了在代码世界通行的基本能力。 目录 题单介绍&#…

【大模型系列】分布式训练相关技术记录

一,显存管理: 激活显存:nvidia-smi 失活显存:fuser -v /dev/nvidia* 二,分布式管理: 1,当前分布式使用deepspeed进行tensor并行 2,使用deepspeed时,不可以使用os.env…

python 算符优先分析法的设计实现 编译原理

本文内容&#xff1a; 1、给出文法如下: G[E] E->T|ET; T->F|T*F; F->i|(E); 可以构造算符优先表如下: *()i><<><*>><><(<<<<)>>>i>>> 2、计算机中表示上述优先关系&#xff0c;优先关系的机内存放…

01-项目介绍

1、特色与亮点 千万级流量的大型分布式系统架构设计。 高性能、高并发、高可用场景解决方案。 2、项目安排 架构搭建&#xff0c;使用前后端分离架构。 功能开发&#xff0c;实现基本的选座排队购票功能。 引入高并发技术&#xff0c;实现高性能抢票。 3、项目收获 学习…

RAMSUN分享家用冰箱压缩机变频驱动方案

方案概述 MCU型号 MM32SPIN05TUOP 方案规格 方案特色 •单无感FOC恒转速高精度控制&#xff0c;低成本/低噪音高效率 •背压与平衡压重载启动 •兼容SPMSM与IPMSM的弱磁控制与MTPA •多种保护&#xff1a;堵转&#xff0c;过压欠压&#xff0c;过流&#xff0c;缺相&#xf…

电冰箱原理

目前常见的家用空调和电冰箱的制冷原理是完全一样的,属于蒸气压缩式制冷. 蒸汽压缩式制冷系统由压缩机、冷凝器、毛细管、蒸发器组成,用管道将它们连接成一个密封系统.制冷剂液体在蒸发器内以低温与被冷却对象发生热交换,吸收被冷却对象的热量并气化,产生的低压蒸汽被压缩机吸入…