不想搭集群，直接用spark

不想搭集群，直接用spark

embedded/2024/12/23 4:44:17/

为了完成布置的作业，需要用到spark的本地模式，根本用不到集群，就不想搭建虚拟机，hadoop集群啥的，很繁琐，最后写作业还用不到集群（感觉搭建集群对于我完成作业来说没有什么意义），所以才想办法在windows环境下，直接安装jdk、scala、spark等，使用spark的本地模式来写作业

步骤：

1. 安装jdk

检查了，发现我自己电脑（windows）上已经安装过jdk了，环境变量也配置好了,

path路径中也设置好了jdk的路径

2. 下载安装scala

检查自己电脑上有没有安装scala

很好，没有安装scala，那就从官网上下载2.11.12版本，官网：

The Scala Programming Language (scala-lang.org)

路径是在E盘下：

配置环境变量：

进入cmd，scala的路径下，输入scala，如下图所示，即为成功安装scala

3. 下载maven

maven已经下载好了，新建一个文件夹Localwarehouse，用来保存下载的依赖文件

配置maven的系统环境配置

cmd下验证，已经成功

配置maven: 记得修改完文件之后保存！

继续添加如下代码用来配置jdk版本

4. 验证idea是否安装好了

输出hello world 证明安装成功

idea的一些使用方法：

字体设置：file–>settings–>输入font–>设置字体样式以及字号大小；
快捷生产main方法：psvm；
快速生产System.out.println()：sout；
删除一行：选中需要删除的那一行，ctrl+y；

5. 将maven加载到idea中

6. 安装scala插件

由于我的idea在plugins里搜索不到scala插件，所以可以官网上下载跟自己idea版本对应的scala插件，在idea安装目录下的plugins下，然后重启idea，就可以搜索到scala插件已经安装上了。

7.下载安装hadoop

Index of apache-local/hadoop/core/hadoop-3.2.2https://repo.huaweicloud.com/apache/hadoop/core/hadoop-3.2.2/环境变量配置好后，执行 hadoop version 出现以下异常

解决办法：

都修改完之后，执行hadoop version成功

8.Spark 安装和配置

安装的是3.0.2的版本

下载地址：

https://archive.apache.org/dist/spark/spark-3.0.2/

解压spark安装包，解压到E:\spark-3.0.2-bin-hadoop3.2

在系统环境变量中添加SPARK_HOME，并将SPARK_HOME添加到系统环境变量的Path中。

cmd中执行spark-shell，出现如下警告

解决办法：

到这里 GitHub - cdarlint/winutils: winutils.exe hadoop.dll and hdfs.dll binaries for hadoop windows 下载和你的 Hadoop 版本对应的工具所在的整个目录，比如 hadoop-3.2.0

把下载的文件中的 winutils.exe 拷贝到上述文件夹中

重新运行spark-shell，执行成功

可通过http://DESKTOP-O202EN9:4040来查看web UI界面

9. idea里配置spark

新建maven项目、配置pom.xml文件等主要参考的是：

在IDEA运行spark程序（搭建Spark开发环境）_idea spark-CSDN博客

http://www.ppmy.cn/embedded/50128.html

相关文章

Ps：脚本事件管理器

Ps：脚本事件管理器

Ps菜单：文件/脚本/脚本事件管理器 Scripts/Script Events Manager 脚本事件管理器 Script Events Manager允许用户将特定的事件（如打开、存储或导出文件）与 JavaScript 脚本或 Photoshop 动作关联起来，以便在这些事件发生时自动触…

阅读更多...

深度学习笔记: 最详尽估算送达时间系统设计

深度学习笔记: 最详尽估算送达时间系统设计

欢迎收藏Star我的Machine Learning Blog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star, 有问题可以随时与我交流, 谢谢大家！ 估算送达时间 1. 问题陈述构建一个模型来估算在给定订单详情、市场条件和交通状况下的总送达时间。为…

阅读更多...

鸿蒙HarmonyOS $r(““)与$rawfile(““)的区别

鸿蒙HarmonyOS $r(““)与$rawfile(““)的区别

在鸿蒙（HarmonyOS）开发中，$r(“”) 和 $rawfile(“”) 是两种不同的资源引用方式，它们分别用于引用不同的资源类型。 1、$r(“”) $r 函数通常用于引用字符串、颜色、尺寸、样式等定义在资源文件（如 strings.json, c…

阅读更多...

架构设计 - MySQL 插入数据性能优化策略

架构设计 - MySQL 插入数据性能优化策略

mysql 数据库提高数据插入效率主要可以考虑以下方面： 使用批量插入数据的 SQL 语句，避免使用 for 循环逐条记录插入。所有插入语句共用一个事务，避免1条SQL语句开1个事务，所有操作都完成后再提交事务。尽量按照索引递增顺序插入…

阅读更多...

Ubuntu20.04配置qwen0.5B记录

Ubuntu20.04配置qwen0.5B记录

环境简介 Ubuntu20.04、 NVIDIA-SMI 545.29.06、 Cuda 11.4、 python3.10、 pytorch1.11.0 开始搭建 python环境设置创建虚拟环境 conda create --name qewn python3.10预安装modelscope和transformers pip install modelscope pip install transformers安装pytorch co…

阅读更多...

docker-ce 和 docker-ee介绍版本介绍

docker-ce 和 docker-ee介绍版本介绍

1 docker-ce 和 docker-ee介绍版本介绍 •Docker-CE指Docker社区版，由社区维护和提供技术支持，为免费版本，适合个人开发人员和小团队使用。•Docker-EE指Docker企业版，为收费版本，由售后团队和技术团队提供技术支持&am…

阅读更多...

实战 | 基于YOLOv10的车辆追踪与测速实战【附源码+步骤详解】

实战 | 基于YOLOv10的车辆追踪与测速实战【附源码+步骤详解】

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ 👍感谢小伙伴们点赞、关注！ 《------往期经典推…

阅读更多...

ListView的使用

ListView的使用

📖ListView的使用 ✅1. 创建ListView✅2. 创建适配器Adapter✅3. 开始渲染数据主要3步骤： 创建ListView 创建适配器Adapter，和Adapter对应的视图开始渲染数据效果图： ✅1. 创建ListView 例如现有DemoActivity页面&#xf…

阅读更多...

最新文章