大数据笔记之 Hadoop 常用 Shell 命令(一)

devtools/2024/10/21 1:02:57/

文章目录

  • 前言
  • 一、HDFS上的操作
    • 1.1 查看文件或文件夹
    • 1.2 修改文件或目录权限
    • 1.3 创建或删除文件夹
    • 1.4 移动或创建文件
    • 1.5 信息统计
    • 1.6 设置 hdfs 中文件的副本数量
  • 二、在本地上传或下载的操作
    • 2.1 从本地上传文件到HDFS
    • 2.2 从HDFS下载文件到本地
  • 总结


前言

前无言


一、HDFS上的操作

操作HDFS上的shell命令,与Linux命令使用方法类似

1.1 查看文件或文件夹

shell"># -ls 显示目录信息
hdfs dfs -ls /# 显示文件内容
hdfs dfs -cat /tmp/k.txt# 显示文件末尾 1kb 的数据
hdfs dfs -tail /tmp/x.txt

1.2 修改文件或目录权限

shell"># 修改文件或目录权限
hadoop fs -chmod 777 /a.txt# 修改文件或目录所有者和所属的组
hadoop fs -chown hadoop:hadoop /a# 修改文件或目录所属组
hadoop fs -chgrp hadoop /a.txt

1.3 创建或删除文件夹

shell"># 创建文件夹
hdfs dfs -mkdir /a# 递归创建文件夹
hdfs dfs -mkdir -p /a/b/c# 删除文件
hdfs dfs -rm /a/b/k.txt# 递归删除目录及目录里的内容(慎用)
hdfs dfs -rm -r /a

1.4 移动或创建文件

shell"># 移动文件
hdfs dfs -mv /a/k.txt /b# 创建文件
hdfs dfs -touch /m/w.txt

1.5 信息统计

shell"># 统计文件夹的大小信息
hdfs dfs -du -s -h /a
hdfs dfs -du -h /a

1.6 设置 hdfs 中文件的副本数量

shell">hdfs dfs -setrep 5 /a/k.txt

二、在本地上传或下载的操作

2.1 从本地上传文件到HDFS

shell"> # 从本地剪切粘贴到HDFS
hdfs dfs -moveFromLocal tmp.txt /tmp# 从本地文件系统中拷贝文件到HDFS上去
hdfs dfs -copyFromLocal tmp.txt /tmp# 从本地文件系统中拷贝文件到HDFS上去(常用)hdfs dfs -put tmp.txt /tmp# 追加一个文件到已经存在的文件末尾
hdfs dfs -appendToFile tmp.txt /tmp/b.txt

2.2 从HDFS下载文件到本地

shell"># 从HDFS拷贝到本地
hdfs dfs -copyToLocal /tmp/b.txt /home# 等同于copyToLocal (常用)
hdfs dfs -get /tmp/b.txt /home

总结

没了。。。


http://www.ppmy.cn/devtools/127427.html

相关文章

探索人工智能在数学教育上的应用——使用大规模语言模型解决数学问题的潜力和挑战

概述 论文地址:https://arxiv.org/abs/2402.00157 数学推理是人类智能的重要组成部分,人工智能界不断寻求应对数学挑战的方法,而在这一过程中,人工智能的能力需要进一步提高。从文本理解到图像解读,从表格分析到符号操…

数据库->库的操作

目录 一、查看数据库 1.显示所有的数据库 二、创建数据库 1.创建数据库 2.查看警告信息 3.创建一个名为database的数据库 三、字符集编码和校验(排序)规则 1.查看数据库⽀持的字符集编码 2.查看数据库⽀持的排序规则 3.一条完整创建库的语句 4. 不同的字串集与排序规…

Swagger+Knife4j

Springboot使用Swagger应注意版本问题,否则可能会有一些兼容性问题,如常见的报错: 1、“org.springframework.context.ApplicationContextException: Failed to start bean ‘documentationPluginsBootstrapper’; nested exception is java…

Web前端高级工程师培训:函数式编程

函数式编程 前置知识 js 基础js面向对象 函数式编程含义 函数式编程是一种强调以函数使用为主的软件开发风格 ,也是一种范式。 某些函数式编程语言Haskell、lisp、Scheme等。 js中函数式编程 数学中函数 f(x) y; js中的函数 let factor 3;let totalNum …

常见的内网渗透思路及方法(包含示例)

内网渗透是指在企业或组织的内部网络中进行安全测试,以发现和利用网络中的安全漏洞。 以下是一些常见的内网渗透思路和方法,包含具体示例: 1. 信息收集 1.1 网络扫描 目的:识别内网中的活跃主机和开放端口。 工具:…

剖析DNS劫持攻击原理及其防御措施

DNS劫持可导致用户访问到虚假网站,还可能使攻击者获取用户的敏感信息或利用受感染的计算机进行其他恶意活动。了解清楚DNS劫持攻击的原理有助于我们提升安全意识,避免个人信息泄露及财产损失。 1. 基础概念 DNS劫持是一种网络攻击,通过修改域…

第十五周:机器学习

目录 摘要 abstrct 一、HW3——食物图片分类CNN 二、GAN计算推导 1、引入 2、最大似然估计 3、divergence的计算 4、总结 三、GAN的架构——fGAN 1、f-divergence 2、共轭函数 3、connetction with GAN 总结 摘要 本周进一步学习了GAN基本原理,主…

rootless模式下istio ambient的流量管理测试

接上一篇rootless模式下istio ambient鉴权策略,本次测试管理流量的功能。 服务流量分割 Bookinfo应用程序有三个版本的reviews服务,接下来对这些版本进行分配流量控制测试。 longtdsubuntu:~$ kubectl get pod |grep reviews reviews-v1-746f96c9d4-2…