首页 > 其他分享 >Hadoop的hdfs云服务器配置踩坑记录

Hadoop的hdfs云服务器配置踩坑记录

时间:2023-07-17 23:56:18浏览次数:48  
标签:tmp hdfs 文件 Hadoop hadoop 主机名 datanode 服务器

本章更多的是通过hdfs的API接口问题角度记录坑点

坑点记录

一、能够远程访问和通过web端访问hdfs

  1. 在java代码中添加或更改如下:
Configuration conf = new Configuration();
conf.set("dfs.client.use.datanode.hostname", "true");//添加此配置信息即可
FileSystem fs = FileSystem.get(new URI("hdfs://host:9000"), conf, "root");
  1. 查找hadoop datanode的主机名

hadoop dfsadmin -report

  1. 1 在本机的主机映射进行修改

C:\Windows\System32\drivers\etc\hosts

3.2 外网IP和主机名

3.3 在虚拟机hosts文件配置:

内网IP和主机名

3.4 在hadoop的etc下的works文件配置:

外网IP和主机名

  1. hadoop的hdfs配置文件更改:

    <!-- 将内部datanode能够和namenode进行通信 -->
        <property>
            <name>dfs.client.use.datanode.hostname</name>
            <value>true</value>
        </property>
    
    <property>
        <name>dfs.datanode.use.datanode.hostname</name>
        <value>true</value>
    </property>
    
  2. 开放50700、9000和9866端口,以及对应的服务器的安全组

  3. 当有datanode启动不了时,将hadoop的tmp文件夹下的name fds文件删除即可。(学习环境,仓库没存储重要数据可操作,否则6-8慎做!)

  4. 通过core-site.xml文件查看tmp目录的路径:

<!-- 指定hadoop数据的存储目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop-3.0.0/data</value>
</property>

  1. 删除后,使用指令hadoop namenode -format

  2. 启动hadoop start-all.sh,结束stop-all.sh

二、通过hdfs的API,在本地windows环境中无法下载

  1. windows中通过hdfs的API远程下载文件,还需要下载winutils文件下的hadoop.dll和winutils.exe文件,并将它们移至C:\Windows\System32下。

下载地址winutils

标签:tmp,hdfs,文件,Hadoop,hadoop,主机名,datanode,服务器
From: https://www.cnblogs.com/duuuuu17/p/17561664.html

相关文章

  • python实现跨域代理服务器
    准备环境python3.7+依赖:aiohttp代码实现(代理服务器,返回响应体和进行跨域处理后的headers)importaiohttpfromfunctoolsimportwrapsfromaiohttpimportwebcorscode={'Access-Control-Allow-Origin':'*','Access-Contr......
  • 云服务器的使用
    朋友推荐了一个免费云服务器,想着用一下测一下自己的应用吧毕竟现在有自己在本地搭的服务器然后评测一下吧"免费虚拟主机"“免费云服务器”评测内容。一些评测与记录我们呢进入这个https://www.sanfengyun.com进入网站就可以了......
  • 阿贝云服务器使用感受
    推荐一下阿贝云的免费服务器,没有流量限制,一个机还免费给一个IP,免费可以续期。系统也是可以免费装windows(这比三丰要好,三丰装windows居然要给一块钱)。总结一下,很适合初学者和中小站长。赞,希望做的更好给大家分享一个可以永久免费试用的云电脑。 废话不多说,就是阿贝云这款免费虚......
  • 给你三百台服务器,你怎么对他们进行管理
    现在给你三百台服务器,你怎么对他们进行管理原创 六便士IT 六便士IT 2023-07-1510:45 发表于陕西收录于合集#Linux运维19个管理三百台服务器是一个庞大的任务,需要有效的组织和规划。下面是一种详细的方法来对这些服务器进行管理:1.自动化配置管理:使用工具如Ansible、......
  • 对安装Linux的服务器进行缓存清除
    对安装Linux的服务器进行缓存清除原创 二河小鱼 人文历史与科学技术 2023-07-1118:10 发表于江西收录于合集#服务器99个#Linux运维101个#清除缓存1个安装Linux的服务器缓存过高导致服务器运行速度慢第一步,查看当前服务器中Linux系统的状态。命令:free-h编......
  • sc._jvm.org.apache.hadoop.fs.FileSystem
    如何实现"sc._jvm.org.apache.hadoop.fs.FileSystem"1.理解目标在开始编写代码之前,我们首先需要理解我们的目标是什么。我们的目标是实现"sc._jvm.org.apache.hadoop.fs.FileSystem"。这个目标可以分为以下几个步骤来完成。2.确定步骤按照提示要求,我们将采用表格的形式展示......
  • return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask
    HadoopHive和SparkTask中的错误代码30041解析在使用HadoopHive进行数据处理时,有时会遇到错误代码30041,该错误代码来自于org.apache.hadoop.hive.ql.exec.spark.SparkTask。本篇文章将解释这个错误代码的含义,并提供一些可能的解决方案。错误代码30041的含义错误代码30041表示在......
  • Java-Day-32( 多用户即时通信系统 —— 文件传输 + 服务器推送新闻 + 离线留言 )
    Java-Day-32多用户即时通信系统文件传输思路:客户端里先把文件读取到客户端为字节数组,把文件对应的字节数组封装到message对象,内含文件内容、sender、getter,将message对象发送给服务端拆解message对象获取getterid,获取客户端被指定的接收用户的通信线程,把message转......
  • 界面怎么查看hadoop yarn某个任务日志
    在HadoopYARN中,要查看某个任务的日志,可以通过Web界面来实现。下面将介绍如何通过界面查看HadoopYARN某个任务的日志,并附有相应的代码示例。首先,YARN提供了一个Web界面,可以通过浏览器访问。默认情况下,该界面的URL为:http://<ResourceManager的主机名>:8088/cluster。可以通过修改y......
  • 服务器笔记之nginx安装SSL证书
    服务器笔记之安装SSL证书参考腾讯云服务器官方文档进行配置SSL证书Nginx服务器SSL证书安装部署-证书安装-文档中心-腾讯云(tencent.com)【一】前提条件已经注册并备案过的域名已获取证书【二】下载证书SSL证书Nginx服务器SSL证书安装部署-证书安装-文......