【spark(零)】spark技术概览

devtools/2024/9/25 23:24:22/

文章目录

  • 一. Spark入门
  • 二. Spark RDD与 Spark core
  • 三. Spark SQL
  • 四. Spark Streaming
  • 五. Spark内核原理

一. Spark入门

Spark基础知识
Spark部署模式、
Spark运行流程

【概述】spark(一):spark特点、知识范畴、spark架构、任务提交流程、支持哪些运行环境

 

二. Spark RDD与 Spark core

RDD基础
常用的RDD算子
RDD函数传递
RDD依赖关系
RDD缓存与检查点
数据的存储与读取
RDD编程进阶

【理论】(spark 二)spark core之RDD:基础概念、特点、stage任务划分与hello spark

【算子1】spark(三):spark core:trans算子中value类型的算子使用说明

【算子2】spark(四):spark core:trans算子中key-value类型的算子使用说明

【算子3】spark(五):spark core:控制算子(cache、persist)、action算子和检查点

【变量】spark(六)变量共享:累加器和广播变量

三. Spark SQL

Spark SQL基础
Spark SQL创建
RDD DataFrame DataSet转换
IDEA创建Spark SQL程序
用户自定义函数
Spark SQL数据源

spark sql】spark(八)sparkSQL概述:dataFrame、DataSet、UDF、SparkSQL数据源

 

四. Spark Streaming

基本介绍
WordCount案例实操
DStream创建
从Kafka中采集数据
DStream转换
window函数

spark streaming】spark(九)Spark Streaming Programming Guide:概述、wordcount、数据源、trans(常见算子、window)、输出源

 

五. Spark内核原理

【shuffle/内存模型】spark(七)超详细mareduce shuffle和spark Shuffle讲解、以及spark比mapreduce快在哪些方面

 


http://www.ppmy.cn/devtools/37140.html

相关文章

JavaScript 中的 Class 类

🔥 个人主页:空白诗 文章目录 🔥 引言🎯 基础知识🏗️ 构造函数 (Constructor)🔐 私有字段 (Private Fields)🔐 私有方法 (Private Methods)🧬 继承 (Inheritance)📦 静态…

线性滤波和预测理论的新成果【1961.Kalman】翻译

线性滤波和预测理论的新成果 New Results in Linear Filtering and Prediction TheoryR. 线性滤波与预测理论的新结果[j]。 E. KALMAN Study, Baltimore, MarylandResearch Institute for AdvancedR. E.卡尔曼研究,巴尔的摩,马里兰州高级研究所。 S. …

从简单逻辑到复杂计算:感知机的进化与其在现代深度学习和人工智能中的应用(下)

文章目录 第一章:感知机的局限性1.1 异或门的挑战1.2 线性与非线性问题 第二章:多层感知机2.1 已有门电路的组合2.2 实现异或门 第三章:从与非门到计算机 文章文上下两节 从简单逻辑到复杂计算:感知机的进化与其在现代深度学习和人…

Kafka应用Demo:按主题订阅消费消息

安装环境 Kafka安装可参考官方网站的指导(https://kafka.apache.org/quickstart), 按步骤解压压缩包,修改配置。然后再启动zookeeper和kafka-server即可。 需要注意的一点:如果是在VMware虚拟机上启动的kafka, 需要修改一下server.properties配置文件&am…

商城系统秒杀功能设计思想

业务特点 1、瞬时并发量大,秒杀时会有大量用户在同一时间进行抢购,瞬时并发访问量突增几倍、甚至几十倍以上 2、库存量少,一般秒杀活动商品量很少,这就导致了只有极少量用户能成功购买到。 3、业务和流程较为常见,一般…

ros安装cartographer

安装 当然是先去看cartograpger官方文档了,照着说明一步步下来。 执行以下语句会报错, wstool merge -t src https://raw.githubusercontent.com/cartographer-project/cartographer_ros/master/cartographer_ros.rosinstall wstool update -t src参看…

Redis(Redis配置和订阅发布)

文章目录 1.Redis配置1.网络配置1.配置文件位置 /etc/redis.conf2.bind(注销支持远程访问)1.默认情况bind 127.0.0.1 只能接受本机的访问2.首先编辑配置文件3.进入命令模式输入/bind定位,输入n查找下一个,shift n查找上一个&…

机器学习项目实践-基础知识部分

环境建立 我们做项目第一步就是单独创建一个python环境,Python新的隔离环境 创建:python -m venv ml 使用:.\Scripts\activate python -m venv ml 是在创建一个名为 ml 的虚拟环境,这样系统会自动创建一个文件夹ml,…