sqoop的安装与简单使用

server/2024/9/25 4:33:04/

文章目录

  • 一、安装
    • 1、上传,解压,重命名
    • 2、修改环境变量
    • 3、修改配置文件
    • 4、上传驱动包
    • 5、拷贝jar包
  • 二、import命令
    • 1、将mysql的数据导入到hdfs上
    • 2、将mysql的数据导入到hive
    • 3、增量导入数据
  • 三、export命令


在这里插入图片描述

一、安装

1、上传,解压,重命名

sqoop下载地址
提起码:1234

cd /opt/modules
# 上传
# 解压
tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt/installs
# 重命名
mv /opt/modules/sqoop-1.4.7.bin__hadoop-2.6.0 /opt/modules/sqoop

2、修改环境变量

export SQOOP_HOME=/opt/installs/sqoop
export PATH=$PATH:$SQOOP_HOME/bin

3、修改配置文件

# 重命名配置文件
mv sqoop-env-template.sh sqoop-env.sh#添加如下配置:
export HADOOP_COMMON_HOME=/opt/installs/hadoop
export HADOOP_MAPRED_HOME=/opt/installs/hadoop
export HIVE_HOME=/opt/installs/hive
export HCAT_HOME=/opt/installs/hive/hcatalog

4、上传驱动包

mysql8.0的驱动包放入 sqoop 的 lib 目录下

5、拷贝jar包

cp /opt/installs/hive/lib/commons-lang-2.6.jar /opt/installs/sqoop/lib/
cp /opt/installs/hive/lib/hive-common-3.1.2.jar /opt/installs/sqoop/lib/

二、import命令

mysqlhdfs_48">1、将mysql的数据导入到hdfs上

sqoop import  \--connect jdbc:mysql://node01:3306/数据库的名字  \--username root  \--password 123456 \--table emp \  # 有query 不用指定--target-dir /hdfs上的路径  \--delete-target-dir  \  #如果hdfs上存在该文件夹就删除--query 'select * from emp where empno < 7788 and $CONDITIONS'  \  # sqoop也支持sql语句--split-by empno  -m 1  

有query的时候sql语句中必须有$CONDITIONS、后面参数必须有split-by或者-m 1

mysqlhive_64">2、将mysql的数据导入到hive

sqoop import \--connect jdbc:mysql://node01:3306/数据库的名字 \--username root \--password 123456 \--table emp \--hive-import \--hive-overwrite \--hive-table emp \--hive-database hive数据库的名字  \-m 1

3、增量导入数据

两种方式:
1、sql语句加where条件
2、last-value

  sqoop import \--connect jdbc:mysql://node01:3306/数据库的名字\--username root \--password 123456 \--table emp \--target-dir /sqoop/dt=20240903 \-m 1 \--check-column empno \  # 必须写,指定检出的列--incremental append \  # 增量--last-value 0 \--fields-terminated-by '\t'  #指定导入数据的分隔符

三、export命令

mysql_99">1、从hdfs导出到mysql

mysql中的表需要提前创建出来

  sqoop export \--connect jdbc:mysql://node01:3306/mydb01 \--username root \--password 123456 \--table user \--export-dir '/sqoop/aaa.txt' \--input-fields-terminated-by ',' \--columns 'id,age'  \  # 指定mysql中的列,要与hdfs文件内容对应-m 1

hivemysql_114">2、从hive导出到mysql

sqoop export \
--connect jdbc:mysql://node01:3306/mydb01 \
--username root \
--password 123456 \
--table user \  # mysql的表
--hcatalog-database mydb01 \  # hive的数据库
--hcatalog-table par3 \  #hive的表
-m 1

sqoopjob_128">四、sqoop的job任务

sqoop job --create jjoobb --sqoop import \
# 编写import代码sqoop job --exec jjoobb
# 执行job任务sqoop job --delete jjoobb
# 删除job任务sqoop job --list
# 查看所有的job任务

http://www.ppmy.cn/server/121658.html

相关文章

Linux之实战命令02:shred应用实例(三十六)

简介&#xff1a; CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布&#xff1a;《Android系统多媒体进阶实战》&#x1f680; 优质专栏&#xff1a; Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a; 多媒体系统工程师系列【…

canvas练习画太阳花

// file name: demo.html <!DOCTYPE html> <html><head><meta charset"UTF-8"><title>练习</title><style>#myCanvas {box-shadow: 6px 9px 80px 13px rgba(0,0,0,.65);margin: 50px 400px;}</style></head>&…

Python数据分析案例60——扩展变量后的神经网络风速预测(tsfresh)

案例背景 时间序列的预测一直是经久不衰的实际应用和学术研究的对象&#xff0c;但是绝大多数的时间序列可能就没有太多的其他的变量&#xff0c;例如一个股票的股价&#xff0c;还有一个企业的用电量&#xff0c;人的血糖浓度等等&#xff0c;空气的质量&#xff0c;温度这些…

AI Native平台,跨越AI应用从创新到生产的鸿沟

2024年是AI应用的元年&#xff0c;以大模型为中心的 AI Native 应用大爆发正在从理想变成现实。云计算带来的应用创新潮&#xff0c;经历了虚拟机时代和云原生时代&#xff0c;正在全面拥抱以大模型为核心的 AI Native 阶段&#xff0c;推动大数据与AI的工作流前所未有地紧密结…

Cryptopp进行RSA加密解密

因最近工作需要&#xff0c;要与一个java服务器进行部分数据交互&#xff0c;其中用户名、密码的加密方式为RSA非对称加密&#xff0c;故研究了一下使用Cryptopp库进行RSA的公钥加密。 搜索了很多资料&#xff0c;其中觉得十分有用的一句话是&#xff1a; 客户端使用RSA加密通…

设计模式七大原则

设计模式的七大原则是指导软件设计和架构的基本准则&#xff0c;帮助开发者创建更灵活、可维护和可扩展的系统。以下是这七大原则的详细介绍&#xff1a; 1. 单一职责原则 (SRP: Single Responsibility Principle) 定义 一个类&#xff0c;应当只有一个引起它变化的原因&…

git笔记之重置本地仓库所有分支和远程保持一致、工作区恢复干净,像刚clone下来一样

git笔记之重置本地仓库所有分支和远程保持一致、工作区恢复干净&#xff0c;像刚clone下来一样 code review! 文章目录 git笔记之重置本地仓库所有分支和远程保持一致、工作区恢复干净&#xff0c;像刚clone下来一样1.实现该功能的 Bash 脚本示例2.改进版&#xff1a;增加了gi…

关于 NLP 应用方向与深度训练的核心流程

文章目录 主流应用方向核心流程&#xff08;5步&#xff09;1.选定语言模型结构2.收集标注数据3.forward 正向传播4.backward 反向传播5.使用模型预测真实场景 主流应用方向 文本分类文本匹配序列标注生成式任务 核心流程&#xff08;5步&#xff09; 基本流程实现的先后顺序…