Spark;scp命令,rsync命令,ssh命令

server/2025/3/15 3:03:38/

hadoop的运行模式

本地运行:在一台单机上运行,没有分布式文件系统,直接读写本地操作系统的文件系统。特点:不对配置文件进行修改,Hadoop 不会启动 

分布式:也是在一台单机上运行,但用不同的 Java 进程模仿分布式运行中的各类节点,特点:Hadoop 启动的这些守护进程都在同一台机器上运行,是相互独立的 Java 进程。

完全分布式数据存储在HDFS,多台服务器工作,企业中大量使用

scp命令

scp命令 :可实现服务器与服务器之间的数据拷贝

-r 表示递归拷贝

$pdir/$fname :要拷贝的文件路径 / 名称

$user@host:$pdir/$fname :目的地用户@主机:目的地路径 / 名称 

eg命令:scp -r /opt/module/jdk1.8.0_212/ root@hadoop102:/opt/module/jdk1.8.0_212/

rsync命令

rsync 主要用于备份和镜像

rsync和scp的区别是rsync只对差异文件做更新,而scp是把所有文件都复制过去。故rsync效率更高

-a :归档拷贝,尽可能让拷贝的

-v :显示拷贝过程

$pdir/$fname :要拷贝的文件路径 / 名称

命令:rsync -av /opt/conf/1.txt root@roothadoop102:/opt/conf/
 

xsync脚本集群之间的同步

(1)在/root/bin目录下创建xsync文件。

(2)在该文件中编写如下代码。这个部分的代码不需要会写,能看懂,了解即可。

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
thenecho Not Enough Arguement!exit;
fi
#2. 遍历集群所有机器
for host in hadoop100 hadoop101 hadoop102
doecho ====================  $host  ====================#3. 遍历所有目录,挨个发送for file in $@do#4. 判断文件是否存在if [ -e $file ]then#5. 获取父目录pdir=$(cd -P $(dirname $file); pwd)#6. 获取当前文件的名称fname=$(basename $file)ssh $host "mkdir -p $pdir"rsync -av $pdir/$fname $host:$pdirelseecho $file does not exists!fidone
done

 (3)修改执行权限。此时,我们去查看文件,可以看到它的颜色是灰色的,不具备执行权限(如下图)。

接下来要通过命令: chmod +x xsync(或者是chmod 777 xsync)

重新查看它的颜色,绿色即可执行,它现在已经变成执行的脚本了(如上右图)。

(4)测试使用。把这个脚本同步到其他的机器中。

[root@hadoop100 ~]$ xsync /root/bin/

ssh命令

ssh命令无需密码也可登录

eg:目标:hadoop100通过ssh访问hadoop101,hadoop102时不需要密码,其他两台设备也类似。

具体操作如下:

1.在hadoop100中生成公钥和密码。ssh-keygen -t rsa 三次回车

2.在hadoop100中,把自己的公钥传递给hadoop101,hadoop102。命令如下

        ssh-copy-id hadoop101

        ssh-copy-id hadoop102

hadoop101 无密登录 hadoop100,hadoop102 与(1)类似

hadoop102 无密登录 hadoop100,hadoop101 与(1)类似

eg:从hadoop100进入hadoop101的命令就是

        ssh root@hadoop102

        退出命令就是:exit


http://www.ppmy.cn/server/175042.html

相关文章

DeepSeek本地接口调用(Ollama)

前言 上篇博文,我们通过Ollama搭建了本地的DeepSeek模型,本文主要是方便开发人员,如何通过代码或工具,通过API接口调用本地deepSeek模型 前文:DeepSeek-R1本地搭建_deepseek 本地部署-CSDN博客 注:本文不仅…

go GRPC学习笔记

本博文源于笔者正在学习的gprc,相关配套书籍素材来源是《Go编程进阶实战》,博文内容主要包含了RPC模式讲解,RPC通过htttp访问、拦截器、提高服务端与客户端容错的内容配置 在此之前需要下载protoc,这里不做下载过程 1、RPC模式 …

架构思维:高性能架构_01基础概念

文章目录 概述基础概念性能指标利特尔法则(O T L)系统优化策略1. 降低耗时(L↓)2. 增加容量(O↑)3. 增加时延(L↑) 场景化指标选择响应时间优先吞吐量/容量优先平衡策略 概述 一个…

python web开发django库安装与使用

下面我将指导您如何安装 Django 库以及基本的使用方法。Django 是一个高级的 Python Web 框架,它鼓励快速开发和干净、实用的设计。以下是详细的步骤: 1. 安装 Django 首先,确保您的系统上已经安装了 Python 和 pip(Python 的包…

[Linux] Not enough free space to extract *.zip or file

原因分析: 导致该错误的主要原因是,虽然你的主分区确实有足够的可用空间,但很多图形解压工具在解压时会默认先把文件写到一个较小的临时文件系统(tmpfs),比如这里只显示 1.6 GB。ZIP 文件在解压过程中会产…

解决git fetch 成功后还是不能checkout到fetch分支

错误记录 当代码仓里分支信息非常多时,如果每次都用git pull更新信息,会耗费很长时间,因此可以用git fetch把我们要checkout的分支线fetch下来,再去checkout。但是,我遇到一个问题,这个看起来已经fetch到指…

框架源码私享笔记(02)Mybatis核心框架原理 | 一条SQL透析核心组件功能特性

最近在思考一个问题:如何能够更好的分享主流框架源码学习笔记(主要是源码部分)?让有缘刷到的同学既可以有所收获,还能保持对相关技术架构探讨学习热情和兴趣。以及自己也保持较高的分享热情和动力。 今天尝试用一个SQL查询作为引…

fpga系列 HDL:ModelSim 波形绘制tips

Stop Drawing 按钮 暂停波形更新: 点击“Stop Drawing”按钮时,ModelSim 会暂停将仿真结果实时绘制到波形窗口中。仿真继续运行,波形窗口不会实时更新显示新的仿真数据。 提高仿真速度: 在大规模设计或长时间仿真的情况下&#x…