【spark(零)】spark技术概览

ops/2024/10/18 9:18:31/

文章目录

  • 一. Spark入门
  • 二. Spark RDD与 Spark core
  • 三. Spark SQL
  • 四. Spark Streaming
  • 五. Spark内核原理

一. Spark入门

Spark基础知识
Spark部署模式、
Spark运行流程

【概述】spark(一):spark特点、知识范畴、spark架构、任务提交流程、支持哪些运行环境

 

二. Spark RDD与 Spark core

RDD基础
常用的RDD算子
RDD函数传递
RDD依赖关系
RDD缓存与检查点
数据的存储与读取
RDD编程进阶

【理论】(spark 二)spark core之RDD:基础概念、特点、stage任务划分与hello spark

【算子1】spark(三):spark core:trans算子中value类型的算子使用说明

【算子2】spark(四):spark core:trans算子中key-value类型的算子使用说明

【算子3】spark(五):spark core:控制算子(cache、persist)、action算子和检查点

【变量】spark(六)变量共享:累加器和广播变量

三. Spark SQL

Spark SQL基础
Spark SQL创建
RDD DataFrame DataSet转换
IDEA创建Spark SQL程序
用户自定义函数
Spark SQL数据源

spark sql】spark(八)sparkSQL概述:dataFrame、DataSet、UDF、SparkSQL数据源

 

四. Spark Streaming

基本介绍
WordCount案例实操
DStream创建
从Kafka中采集数据
DStream转换
window函数

spark streaming】spark(九)Spark Streaming Programming Guide:概述、wordcount、数据源、trans(常见算子、window)、输出源

 

五. Spark内核原理

【shuffle/内存模型】spark(七)超详细mareduce shuffle和spark Shuffle讲解、以及spark比mapreduce快在哪些方面

 


http://www.ppmy.cn/ops/37285.html

相关文章

力扣热题100刷题笔记[python]

letcode100 题录地址: https://leetcode.cn/studyplan/top-100-liked/ 注:另外有记忆精简版 [LeetCode热题100_记忆版.md](file:///D:/yingl/文件/notes_-yl/技术精品文章/编程基本功/算法资料汇总/LeetCode热题100_记忆版.md) 哈希 两数之和 思路: 0、用 hash_table =…

整体安全保障服务方案包括哪些方面?

整体安全保障服务方案是一套综合性的措施,旨在保护企业的网络、数据和资源免受各种威胁。主要包含检测、加固、应急保障、安全运营、攻防演练等多项核心能力与服务。 ​安全狗通过专业团队、工具以及专业运营流程,提出了新一代整体安全保障思路&#xff…

Linux——mysql运维篇

回顾基本语句: 数据定义语言 ( DDL ) 。这类语言用于定义和修改数据库的结构,包括创建、删除和修改数据库、表、视图和索引等对象。主要的语句关键字包括 CREATE 、 DROP 、 ALTER 、 RENAME 、 TRUNCATE 等。 create database 数据库 &…

提供 DISC性格测试报告的全新 API接口,带给你惊喜的发现!

简介 DISC个性测验由24组描述个性特质的形容词构成,每组包含四个形容词,这些形容词是根据支配性(D)、影响性(I)、服从性(C)、 稳定性(S)和四个测量维度以及一…

简要介绍MATLAB的背景和重要性,以及它在数据分析与可视化领域的广泛应用

**标题**:MATLAB在数据分析与可视化中的应用 **引言**(约200字) 简要介绍MATLAB的背景和重要性,以及它在数据分析与可视化领域的广泛应用。强调本文旨在探讨MATLAB在这两个领域的具体应用案例、技术特点和发展趋势。 **一、MAT…

你对氟橡胶油封的基本知识了解多少?

在机械和工程领域,氟橡胶油封在确保平稳运行和防止泄漏方面发挥着至关重要的作用。了解这些密封件的基本知识对于任何参与制造、维护或维修过程的人来说都是至关重要的。 1.组成与结构: 氟橡胶油封主要由氟、碳和氢原子组成,因此得名氟弹性…

第六代移动通信介绍、无线网络类型、白皮书

关于6G 即第六代移动通信的介绍, 图解通信原理与案例分析-30:6G-天地互联、陆海空一体、全空间覆盖的超宽带移动通信系统_6g原理-CSDN博客文章浏览阅读1.7w次,点赞34次,收藏165次。6G 即第六代移动通信,6G 将在5G 的基…

分布式锁概述

什么是分布式锁 分布式锁是一种在分布式计算环境中用于同步访问共享资源的机制。它的主要目的是在一个分布式系统中,当多个进程或服务需要同时访问同一个资源时,确保任一时刻只有一个进程或服务能够执行涉及该资源的关键操作。这类似于传统单体应用中的…