解决hadoop使用put上传报错问题

news/2024/12/19 2:02:42/

hadoop使用put上传报错

WARN hdfs.DataStreamer: DataStreamer Exception
org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /input/yxqzdata.COPYING could only be replicated to 0 nodes instead of minReplication (=1). There are 0 datanode(s) running and no node(s) are excluded in this operation.

原因是多次格式化了Hadoop或者hdfs。因为id不一致。

停止集群

在hadoop的sbin目录下操作

./stop-all.sh

删除HDFS中的文件

查看Hadoop配置，hadoop安装目录下的ect下的hadoop下的core-size.xml

删除tmp文件

tmp中存储的是hdfs文件

我的配置是将数据存储在/opt/hadoop-2.9.2/tmp下的

<configuration><property><name>fs.defaultFS</name><value>hdfs://master:8020</value></property><property><name>hadoop.tmp.dir</name><value>/opt/hadoop-2.9.2/tmp</value></property><property><name>io.file.buffer.size</name><value>8192</value></property><property><name>ha.zookeeper.quorum</name><value>master:2181</value></property>
</configuration>

可以通过ub系统界面，直接删除tmp目录，也可以使用rm-f删除数据

删除id文件

这里是个大坑，网上很多照抄的某人的，都没有提到删除找个id文件。找到hadoop的安装目录下的dfs目录下的data，其实是删除的data下的文件是hadoop更目录下的dfs下的文件，某些人抄着别人的博客，就抄成了删除从core-size.xml配置文件中的hdfs的数据data文件了。也是醉了严重误导了我这种小白，所以最好这两个data文件都删除，删除后执行下面的格式化删除后执行下面的格式化删除后执行下面的格式化