spark任务运行

ops/2025/2/20 20:06:02/

运行环境

在这里插入代码片
[root@hadoop000 conf]# java -version
java version "1.8.0_144"
Java(TM) SE Runtime Environment (build 1.8.0_144-b01)
[root@hadoop000 conf]# echo $JAVA_HOME
/home/hadoop/app/jdk1.8.0_144
[root@hadoop000 conf]# vi spark-env.sh
[root@hadoop000 conf]# mv slaves.template slaves
[root@hadoop000 conf]# vi slave

步骤

/home/hadoop/app/spark-2.2.0-bin-2.6.0-cdh5.7.0/bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://192.168.2.111:7077 \
--executor-memory 1G \
--total-executor-cores 2 \
/home/hadoop/app/spark-2.2.0-bin-2.6.0-cdh5.7.0/examples/jars/spark-examples_2.11-2.2.0.jar

sparkshell_30">spark-shell

[root@hadoop000 bin]# /home/hadoop/app/spark-2.2.0-bin-2.6.0-cdh5.7.0/bin/spark-shell \
> --master spark://192.168.2.111:7077 \
> --executor-memory 2G \
> --total-executor-cores 2
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
25/02/15 16:45:37 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
25/02/15 16:45:43 WARN ObjectStore: Failed to get database global_temp, returning NoSuchObjectException
Spark context Web UI available at http://192.168.2.111:4040
Spark context available as 'sc' (master = spark://192.168.2.111:7077, app id = app-20250215164538-0002).
Spark session available as 'spark'.
Welcome to____              __/ __/__  ___ _____/ /___\ \/ _ \/ _ `/ __/  '_//___/ .__/\_,_/_/ /_/\_\   version 2.2.0/_/Using Scala version 2.11.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_144)
Type in expressions to have them evaluated.
Type :help for more information.
scala> sc.textFile("hdfs://192.168.2.102:9000//user/spark/input/word.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).saveAsTextFile("hdfs://192.168.2.102:9000//user/spark/out")
scala> sc.textFile("hdfs://192.168.2.102:9000/user/spark/out/*").collect().foreach(println)
(orange,1)
(queen,1)
(rabbit,1)
(fish,1)
(dog,1)
(apple,1)
(pig,1)
(umbrella,1)
(snake,1)
(lion,1)
(juice,1)
(cat,1)
(tiger,1)
(banana,1)
(monkey,1)
(nose,1)
(kite,1)
(elephant,1)
(ice,1)
(goat,1)
(horse,1)

http://www.ppmy.cn/ops/159720.html

相关文章

电力交易员需要哪些证书

电力交易员职业资格证书 电力交易员国家职业资格证书 :这是电力交易员的从业资格证书,由国家职业资格鉴定机构颁发,分为初级、中级、高级和高级技师四个等级。该证书是电力交易员专业技能和职业素养的重要证明,有助于提升就业竞争…

常见的缓存更新策略

Cache Aside Pattern(旁路缓存模式) Cache Aside Pattern 是我们平时使用比较多的一个缓存读写模式,比较适合读请求比较多的场景。 读写步骤 写: 更新DB删除缓存 读: 缓存读数据,读到直接返回未读取到直接从db读取db读取的数据同…

深入理解 fnmatch 函数的实现

0、背景 fnmatch 函数是 C 标准库和 POSIX 中用于匹配文件路径的工具,它使得我们能够根据模式字符串对文件名进行模式匹配。常见的用途包括在文件系统中查找符合某种模式(如通配符)的文件。例如,fnmatch(“.txt", “file1.t…

DeepSeek VS OpenAI:AI巨头应用对比

DeepSeek 和 OpenAI 都是领先的 AI 公司,具备各自的优势。这两天我读了一篇很棒的文章,作者Da-vinci对这两家AI巨头做了很直观的介绍比较。以下是来自原创的部分内容: DeepSeek、ChatGPT 比较表 DeepSeek、ChatGPT 比较表 | 来源于Da-vinci …

高速硬件电路设计

高速PCB 设计三大原则 3W原则 **1.定义:**线和线之间的距离保持3倍线宽。 2.作用:减少线间的串扰,可以保证70%的线间电场不互相干扰 3.总结:高速信号3W规则走,低速信号最低2W 20H 原则 1.图1,电源层和地…

Unity 打开摄像头 并显示在UI

需求: 打开相机并显示在UI上 效果: 注意: 电脑可能有多个摄像头,注意名称 代码: using System; using System.Linq; using UnityEngine; using UnityEngine.UI; using System.Collections.Generic; #if UNITY_EDITOR using UnityEditor; #endifname…

【Scrapy】Scrapy教程5——第一个Scrapy项目

文章目录 Scrapy目录结构第一个爬虫运行爬虫必要说明start_requests()和start_urls如何关闭allowed_domains的限制通过前几节的学习,我们已经了解了Scrapy的基本操作,下面我们开始第一个项目,我以本人的 网址为例进行爬虫讲解,之所以用我自己的网站,是因为我这个网站本来…

idea日常报错之UTF-8不可映射的字符

目录 一、UTF-8不可映射的字符的解决 1、出现这种报错的情形 2、具体解决办法 前言: 在我们日常代码编写的时候可能会遇到各式各样的错误,有时候并不是你改动了代码,而是莫名其妙就出现的报错,今天我就遇到一个在maven编译的时候…