大数据操作第二天

embedded/2024/9/23 7:32:13/

文章目录

  • 大数据命令的方式
      • 现在有三个命令的方式
  • 启动一个计算圆周率的jar包方式
  • 什么是文件系统
    • 数据
    • 元数据
    • 传统的存储方式
    • 分布式存储方式
    • 元数据记录文件位置信息
    • 副本机制的方式
  • hafs 存储方式
  • shell 操作大数据的方式
        • 创建目录
        • 查看文件目录下的方式
        • 上传文件的方式

大数据命令的方式

现在有三个命令的方式

在hadoop中创建文件夹的方式

hadoop fs -mkdir /tiamtian

我们将本地文件上传到hadoop中的方式

hadoop fs -put test.out /tiamtian

查看我们上传的文件信息

hadoop fs -ls /

在这里插入图片描述

启动一个计算圆周率的jar包方式

cd /export/server/hadoop-3.3.0/share/hadoop/mapreduce

这个是启动hadoop jar包的方式,但是我不知道的付出
pi 2 4 是什么的方式,又没有大哥说一下

hadoop jar hadoop-mapreduce-examples-3.3.0.jar pi 2 4

在这里插入图片描述

什么是文件系统

文件系统是之前的文件存储需要知道具体的文件路径,知道需在的盘符在哪里,现在文件系统,相当于文件存储在文件夹中,只需要知道=具体文档路径和名称就可以找到文件

数据

数据是存储的本身

元数据

是数据修改时间,数据修改内容

传统的存储方式

传统的存储方式是存储是存储,计算是计算,需要把数据移动过来才可以完成计算的方式,io差,性能低的问题

分布式存储方式

支持横向扩展,支持纵向扩展的方式

元数据记录文件位置信息

文件存储在不同的机器上不方便寻找,我们通过元数据记录文件袋位置,可以迅速找到文件

副本机制的方式

防止数据丢失的问题

hafs 存储方式

解决分布式存储问题,横跨多台计算器
高度容错的方式
提供统一接口的访问方式
移动计算比移动数据成本低
hdfs是一个主从架构的方式,name 是一个主节点,datanode是一个从节点,俩个相互协调的方式完成数据存储方式

shell 操作大数据的方式

创建目录
hadoop fs -mkdir   /test
查看文件目录下的方式
hadoop fs -ls   /

有俩个参数的方式
-h 显示文件size
-R 显示文件目录和子目录
/ 是目录文件可以更换

hadoop fs -ls   -h /
上传文件的方式
hadoop fs -put 2.txt /test

有俩个参数

  • f 覆盖原来的文件
  • p 保存目录文件
hadoop fs -put -f 2.txt /test

http://www.ppmy.cn/embedded/16073.html

相关文章

高频SQL 判断三角形

题目信息 表:Triangle ------------------- | Column Name | Type | ------------------- | x | int | | y | int | | z | int | ------------------- 在 SQL 中,(x, y, z)是该表的主键列。 该表的每一行包含三个线段…

Python 将PowerPoint (PPT/PPTX) 转为HTML格式

PPT是传递信息、进行汇报和推广产品的重要工具。然而,有时我们需要将这些精心设计的PPT演示文稿发布到网络上,以便于更广泛的访问和分享。本文将介绍如何使用Python将PowerPoint文档转换为网页友好的HTML格式。包含两个示例: 目录 Python 将…

SNETCracker--超级弱口令检查工具简介

一、简介 SNETCracker 超级弱口令检查工具是一款Windows平台的弱口令审计工具,支持批量多线程检查,可快速发现弱密码、弱口令账号,密码支持和用户名结合进行检查,大大提高成功率,支持自定义服务端口和字典。 二、SNE…

Linux 静态IP地址修改与报错处理

目录 查看网卡信息 Ubuntu 16.04.5 LTS、Ubuntu 20.04.6 LTS Ubuntu 18.04.6 LTS Centos 8.0 修改IP地址 将IP地址置空 确认修改是否生效 查看网卡信息 ifconfig ifconfig -a Ubuntu 16.04.5 LTS、Ubuntu 20.04.6 LTS 修改配置 vim /etc/network/interfaces # This …

压力测试caliper/java-sdk

通过Caliper进行压力测试程序 第一步. 配置基本环境 部署 Caliper 的计算机需要有外网权限; 操作系统版本需要满足以下要求: Ubuntu > 16.04 、 CentOS > 7 或 MacOS > 10.14 ; 部署 Caliper 的计算机需要安装有以下软件&#x…

【后端】python2和python3的安装与配置

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、python是什么二、python环境的安装与配置Python 2的安装与配置Python 3的安装与配置注意事项 三、总结 前言 随着开发语言及人工智能工具的普及&#xff0…

【C++】学习笔记——类和对象_3

文章目录 二、类和对象11. 析构函数(补)12. 拷贝构造函数13. 运算符重载 未完待续 二、类和对象 11. 析构函数(补) 析构函数并不是销毁对象,对象的销毁是由编译器完成的,析构函数的作用是清理&#xff0c…

Sping源码(七)—context: component-scan标签如何扫描、加载Bean

序言 简单回顾一下。上一篇文章介绍了从xml文件context component-scan标签的加载流程到ConfigurationClassPostProcessor的创建流程。 本篇会深入了解context component-scan标签底层做了些什么。 component-scan 早期使用Spring进行开发时,很多时候都是注解 标…