首页 > 其他分享 >3. 从0到1搭建DeltaLake大数据平台 - 安装配置Hadoop

3. 从0到1搭建DeltaLake大数据平台 - 安装配置Hadoop

时间:2024-10-22 11:13:04浏览次数:5  
标签:HDFS hdfs hadoop dfs Hadoop local DeltaLake 搭建

要在你的 Spark 集群上安装和配置 HDFS(Hadoop 分布式文件系统),可以按照以下步骤进行:

1. 安装 Hadoop

1.1 下载 Hadoop

选择一个合适的 Hadoop 版本(例如 Hadoop 3.x),下载并解压缩:

wget https://downloads.apache.org/hadoop/common/hadoop-x.y.z/hadoop-x.y.z.tar.gz
tar -xzf hadoop-x.y.z.tar.gz
sudo mv hadoop-x.y.z /usr/local/hadoop

1.2 设置环境变量

编辑 ~/.bashrc/etc/profile 文件,添加以下行:

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

然后执行:

source ~/.bashrc

2. 配置 Hadoop

在所有节点上,修改 Hadoop 配置文件。进入 Hadoop 配置目录:

cd /usr/local/hadoop/etc/hadoop

2.1 core-site.xml

编辑 core-site.xml,配置 HDFS 的基本信息:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value> <!-- 将 master 替换为实际的 Master 节点 IP 或主机名 -->
    </property>
</configuration>

2.2 hdfs-site.xml

编辑 hdfs-site.xml,设置 HDFS 的数据存储位置:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>2</value> <!-- 根据需要设置副本数 -->
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:///usr/local/hadoop/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:///usr/local/hadoop/dfs/data</value>
    </property>
</configuration>

2.3 修改权限(可选)

确保 Hadoop 目录权限正确:

sudo mkdir -p /usr/local/hadoop/dfs/name
sudo mkdir -p /usr/local/hadoop/dfs/data
sudo chown -R $(whoami):$(whoami) /usr/local/hadoop

3. 启动 HDFS

3.1 格式化 NameNode

在 Master 节点上格式化 NameNode:

hdfs namenode -format

3.2 启动 HDFS 服务

在 Master 节点上启动 NameNode:

start-dfs.sh

 

4. 检查 HDFS 状态

你可以通过访问以下地址查看 HDFS 的状态:

http://master:9870

 

5. 测试 HDFS

在 HDFS 中创建目录和文件,确保它们能够在 Worker 节点上访问。

hdfs dfs -mkdir /test
hdfs dfs -put /path/to/local/file /test
hdfs dfs -ls /test

 

6. 集成 Spark 和 HDFS

确保 Spark 可以访问 HDFS。你可以在 Spark 提交作业时使用 HDFS 路径,例如:

spark-submit --master spark://master:7077 --class your.main.Class hdfs://master:9000/test/yourfile

 

标签:HDFS,hdfs,hadoop,dfs,Hadoop,local,DeltaLake,搭建
From: https://www.cnblogs.com/xgc521/p/18492184

相关文章

  • 校园交友平台源码搭建手册/校园交友系统搭建全攻略
    本文在为有意搭建校园交友平台的开发者提供一套详尽的指南,从需求分析、环境准备、源码选择、搭建步骤到后期运营,全方位覆盖校园交友系统搭建的全过程。一、需求分析目标用户:明确你的目标用户群体,如大学生、研究生等,了解他们的交友需求和偏好。功能需求:根据目标用户,列出所需功......
  • Typecho 博客系统搭建
      本次服务器规划旨在为Typecho部署提供稳定、安全、高效的环境,以满足网站访问需求和后续扩展要求。2.服务器需要一台linux服务器2.1物理服务器数量:1台配置:CPU:IntelXeonE5-2620(6核)内存:2GBRAM存储:500GBSSD(用于存储网站文件和数据库)2.2虚拟化环境 ......
  • hadoop_hdfs详解
    HDFS秒懂HDFS定义HDFS优缺点优点缺点HDFS组成架构NameNodeDataNodeSecondaryNameNodeClientNameNode工作机制元数据的存储启动流程工作流程SecondaryNameNode工作机制checkpoint工作流程DataNode工作机制工作流程数据完整性文件块大小块太小的缺点块太大的缺点文......
  • springcloud入门-项目搭建
    本文主要供小白使用,详述springcloud项目在实战环境中如何搭建以及常见问题的解决方法,各微服务组件的具体使用及原理,后续我会逐步补充。本文后续论述均以如下环境为前提:jdk:1.8spring-boot:2.6.0spring-cloud:2021.0.9一、公共组件搭建1.parent项目搭建1)pom.xml文......
  • nfs服务器搭建
    1.dpkg-snfs-kernel-server 查看是否已经安装了nfs服务器2.若未安装sudoapt-getinstallnfs-kernel-server3.sudovi/etc/exports修改nfs服务配置文件4.增加一行/nfsdir*(rw,sync,no_subtree_check,no_root_squash)  这一行的意思就是把/nfsdir作为nfs工作目录  ......
  • MongoDB 5 安装&副本集搭建&集群搭建
    单节点安装需要一个数据目录地址,一个日志文件地址,配置文件##数据目录地址--dapath=##日志文件--logpath=##配置文件--config=***.conf下载https://fastdl.mongodb.org/osx/mongodb-macos-x86_64-5.0.27.tgz启动命令/data/dba/yanhao/application/mongodb/bin/mong......
  • cubemx modbus从机搭建
    目录1.硬件准备2.CubeMX配置步骤3.集成Modbus协议栈步骤:4.编写应用代码5.测试通信代码示例6.进一步优化使用CubeMX实现Modbus丛集(Slave)的开发主要涉及到以下几个步骤:1.硬件准备你需要一块支持Modbus通信的STM32开发板,建议使用带有USART外设的......
  • 运维-Vbox-虚拟机搭建私有局域网
    ubuntuhttps://blog.csdn.net/xtydtc/article/details/108804738centoshttps://blog.csdn.net/shijiujiu33/article/details/90677019centos设置端口转发https://jingyan.baidu.com/article/4e5b3e19840c4cd1911e242d.html总结:1、不用占用真实的IP地址,可以防止搬家后,IP地......
  • 开发-Hadoop-配置Hadoop
    最终效果   首先你得有一个Centos7的环境我直接用VirtualBox虚拟了一个Centos7(mini包)   #连接ssh#替换yum库curl-o/etc/yum.repos.d/CentOS-Base.repohttp://mirrors.aliyun.com/repo/Centos-7.repoyummakecache#升级renguanyuvim/etc/sudoers#如果是......
  • Vue3 + TypeScript:从环境搭建到组件通信的完整前端开发教程
    在前端开发领域,Vue3与TypeScript的组合备受青睐。Vue3带来高效灵活的开发体验,TypeScript则提供强大的类型安全和可维护性。本文将详细介绍如何使用Vue3和TypeScript进行开发,文章内容将按照以下顺序展开:一、环境准备1.安装Node.js:从Node.js官方网站下载并安装适合......