大数据技术——使用IDEA开发Scala程序

news/2024/10/30 23:23:05/

目录

一、使用IDEA开发WordCount程序... 3

二、实验目的... 3

三、实验要求... 3

四、实验环境... 3

五、实验步骤... 3

4.1.1启动IDEA并创建一个新项目WordCount 3

4.1.2为WordCount项目添加Scala框架支持... 7

4.1.3数据准备... 8

4.1.4设置项目目录... 9

4.1.5新建Scala代码文件... 10

4.1.6配置pom.xml文件... 12

4.1.7更新Maven的依赖文件... 12

4.1.8运行WordCount程序... 13

4.1.9打包WordCount程序生成JAR包... 14

4.10提交到Spark中运行... 17

六、使用IDEA开发读写MySQL数据库程序... 18

七、实验目的... 18

八、实验要求... 18

九、实验环境... 19

十、实验步骤... 19

4.1.1创建MySQL数据库... 19

4.1.2在spark-shell交互式环境中读写MySQL数据库... 20

4.1.3编写独立应用程序读写MySQL数据库... 23

4.1.4新建项目... 23

4.1.5设置依赖包... 24

4.1.6新建Scala代码文件... 25

4.1.8配置pom.xml文件... 25

4.1.9编译运行程序... 27

4.2.0生成应用程序JAR包... 27

十一、出现问题及解决办法... 29


一、使用IDEA开发WordCount程序

二、实验目的

掌握使用IntelliJ IDEA开发Spark应用程序。

三、实验要求

使用IntelliJ IDEA开发本地Spark应用程序。
部署分布式Spark应用程序。   

四、实验环境

x86_64 ubuntu 16.04

JDK1.8

Spark-2.1.0

Hadoop-2.7.1

IntelliJ IDEA-3.7

scala-2.11.8

五、实验步骤

4.1.1启动IDEA并创建一个新项目WordCount

启动IntelliJ IDEA

cd /usr/local/idea

./bin/idea.sh

 通过菜单“File-->New-->Project”打开一个新建项目对话框

 单击左侧的“Maven”项,右侧将出现“Create from_archetype”复选框,不要选择,直接单击窗口底部的“Next”按钮

 在弹出的窗口中,在“GroupId”对话框中填入“dblab”,在“ArtifactId”对话框中填入“WordCount”,然后,单击“Next”按钮

 

出现提示框需要单击底部的“Maven projects need to be imported”区域的“Enable Auto-Import”。这样,IDEA就可以自动连接网络下载Maven相关的依赖文件,以后每次修改项目中的pom.xml内容时,IDEA都会自动连接网络下载相关的依赖文件。

选中如下Maven的配置文件

 4.1.2为WordCount项目添加Scala框架支持

 Spark程序开发和运行,需要依赖Spark相关的jar包。按下图中所示依次选择,手动导入spark的jar包到项目中。

 4.1.3数据准备

打开终端,在/usr/local/spark/mycode/目录下创建文件word.txt

cd /usr/local/spark/mycode/wordcount/

sudo vi word.txt

 

 4.1.4设置项目目录

 在界面左侧的项目栏中,在“src”目录的“main”子目录上,单击鼠标右键,在弹出的菜单中选择“New”菜单项,然后,子菜单中选择“Directory”菜单项,创建一个新目录。

 

在弹出的对话框中,输入目录名称“Scala”,单击“OK”按钮

在scala子目录上,单击鼠标右键,在弹出的菜单中选择“Mark Directory as”菜单项,再在子菜单中选择“Sources Root”菜单项,把“scala”目录设置为源代码目录。

在“java”子目录上,单击鼠标右键,在弹出的菜单中单击“Delete...”菜单项,删除这个目录

 4.1.5新建Scala代码文件

在scala目录上单击鼠标右键,在弹出的菜单中单击“New”,然后在子菜单中选择“Scala Class”菜单项,新建一个Scala代码文件。

在弹出的窗口中,在“Name”对话框中输入“WordCount”,在“Kind”的下拉选项框中选择“Object”,单击“OK”按钮

 4.1.6配置pom.xml文件

 具体详情请点击以下链接查看文档:

https://download.csdn.net/download/qq_53142796/87866506icon-default.png?t=N4P3https://download.csdn.net/download/qq_53142796/87866506


http://www.ppmy.cn/news/230753.html

相关文章

一篇博客教会你怎么使用Docker安装Redis

文章目录 1、搜索镜像2、拉取镜像3、下载配置文件4、修改配置文件5、启动容器 今天我们学习使用 Docker 安装 Redis。 1、搜索镜像 docker search redis2、拉取镜像 docker pull redis3、下载配置文件 wget http://download.redis.io/redis-stable/redis.conf下载的配置文件…

qmake 手册

文章目录 qmake 手册:概述描述项目构建项目使用第三方图书馆 入门简单起步: 创建项目构建普通项目运行qmake平台备忘录qmake 语言高级用法使用预编译头配置qmake参考变量替换函数内置替换功能 测试函数内置测试函数测试函数库 预编译标头 qmake 手册&…

“中信碳账户”开户量突破350万,发布首支低碳生活主题音乐故事片

来源 | 镭射财经(leishecaijing) 6月5日,世界环境日设立50周年之际,中信银行发布首支以低碳生活为主题的原创音乐故事——《绿色的向往》,以清新、明快的阿卡贝拉音乐风格,呈现了低碳达人与“中信碳账户”…

深入理解深度学习——切面距离(Tangent Distance)、正切传播(Tangent Prop)和流形正切分类器

分类目录:《自然语言处理从入门到应用》总目录 许多机器学习通过假设数据位于低维流形附近来克服维数灾难。一个利用流形假设的早期尝试是切面距离(Tangent Distance)算法 (Simard。它是一种非参数的最近邻算法,其中使用的度量不是…

通过jsp实现省市区县四级联动菜单

【所要达到的效果如下】 【代码如下】 Area.jsp <% page language"java" contentType"text/html; charsetutf-8"pageEncoding"utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www…

汽车电子AUTOSAR之EcuM模块

目录 前言 正文 EcuM模块总体介绍 主要功能 总状态机&#xff08;Flexible 与 Fixed&#xff09; Startup Sequence STARTUP I STARTUP II RUN Sequence RUN II RUN III ShutDown Sequence ShutDown Target Go Sleep Go OFF I Go OFF II Sleep Sequence Sleep…

计算机视觉:转置卷积

转置卷积 文章目录 转置卷积基本操作填充、步幅和多通道性质 转置卷积&#xff08;Transposed Convolution&#xff09;&#xff0c;也称为反卷积&#xff08;Deconvolution&#xff09;&#xff0c;是卷积神经网络&#xff08;CNN&#xff09;中的一种操作&#xff0c;它可以将…

SELD2022:(一)数据集收集与组织详解

前言&#xff1a;声音事件检测与定位&#xff08;SELD&#xff09;作为DCASE挑战赛的子任务&#xff0c;从2019年开始已经举办了好几届。该子任务的目标也从2022年开始由原来的在仿真数据集上设计更优声学模型&#xff0c;过渡到了在真实数据集上进行模型优化。相对而言&#x…