首页 > 其他分享 >开源大数据集群部署(一)集群实施规划

开源大数据集群部署(一)集群实施规划

时间:2024-01-10 16:11:46浏览次数:32  
标签:实施规划 zookeeper hadoop 开源 集群 namenode data 目录

作者:櫰木

本次集群规划信息

本次实际生产业务体量存在巨大差异,但集群规划内容相同,因此建议实际生产环境按照按照一定比例扩展即可。

主机操作系统要求

软件信息 参数
配置 8C16G
操作系统版本 CentOS Linux release 7.8.2003 (Core)
java版本 java version "1.8.0_281"
hadoop版本 hadoop 3.2.4

集群版本规划

集群组建 版本
HDFS 3.2.4
YARN 3.2.4
MapReduce2 3.2.4
Hive 3.1.2
HBase 2.1.0
ZooKeeper 3.7.1
Trino 389

主机角色规划

服务器 IP 角色
hd1.dtstack.com(管理节点) 172.16.104.226 namenode/resourcemanager/journalnode/zkfc//hive_metastore/hiveserver2
hd2.dtstack.com(管理节点) 172.16.106.252 namenode/resourcemanager/journalnode/zkfc/hamster/ranger
hd3.dtstack.com(数据节点) 172.16.107.127 datanode/nodemanager/journalnode/
hd1.dtstack.com(kerberos节点) 172.16.106.165 freeipaserver

配置目录规划

所有安装包目录为/opt/hadoop 类似

组件 目录名称 目录
HADOOP hadoop datanode目录 /data/hadoop/dfs/data
hadoop namenode目录 /data/hadoop/dfs/name
hadoop临时目录 /data/hadoop/tmp
ZOOKEEPER zookeeper数据目录 /data/zookeeper/data/
zookeeper日志目录 /data/zookeeper/log/

组件系统用户规划

组件 启动用户 所属组
hdfs(namenode/datanode/zkfc/journalnode) hdfs hadoop
yarn(reourcemanager/nodemanager/) yarn hadoop
zookeeper zookeeper zookeeper
hive hive hadoop
hbase hbase hadoop
mysql mysql mysql
ranger ranger ranger
grafana grafana grafana
prometheus prometheus prometheus
trino trino hadoop

标签:实施规划,zookeeper,hadoop,开源,集群,namenode,data,目录
From: https://www.cnblogs.com/yunchekeji/p/17956715

相关文章

  • K8S集群搭建
    K8S各节点环境准备1虚拟机操作系统环境准备参考链接:https://kubernetes.io/zh/docs/setup/production-environment/tools/kubeadm/install-kubeadm/2关闭swap分区2.1临时关闭swapoff-a&&sysctl-wvm.swappiness=02.2基于配置文件关闭sed-ri'/^[^#]*swap/......
  • k8s集群证书过期怎么办
    记录一次集群更新证书过程,因为集群证书已经更新了,以下只记录操作过程了。参考:https://blog.csdn.net/Harry_z666/article/details/1280151751、集群情况版本:v1.23.6部署方式:kubeadm部署由于使用kubeadm部署,证书有效期为一年,到期后证书失效。2、master更新集群证书#1、ma......
  • k8s集群搭建1.22.x (centos)
    版本1.22.xx版本兼容 集群搭建指导https://www.cnblogs.com/Sunzz/p/15184167.html  【1.18】https://blog.csdn.net/qq_34629877/article/details/120234616 【1.22】升级centos内核#导入公钥rpm--importhttps://www.elrepo.org/RPM-GPG-KEY-elrepo.org#安装......
  • 创建单机 PolarDB-X 集群
    https://doc.polardbx.com/quickstart/topics/quickstart-pxd-cluster.html#安装dockercurl-fsSLhttps://get.docker.com-oget-docker.shshget-docker.sh#配置普通用户访问dockersudogroupadddockersudogpasswd-a${USER}dockernewgrpdocker#安装pxdpip......
  • 【开源】EDUCN网站
    EDUCNhttps://scrc.rth1.link/ <!DOCTYPEhtmlPUBLIC"-//W3C//DTDHTML4.0Transitional//EN""http://www.w3.org/TR/REC-html40/loose.dtd"><!--<script>//警告框window.alert("成功验证IP信息!");</script>-->......
  • Elasticsearch分片大小设定和集群容量规划
    本文以Elasticsearch7.9.2为准。分片大小日志类:单个分片不超过50G搜索类:单个分片不超过20G先估算总数据量,再根据分片大小,确定分片数。容量规划容量规划时要考虑的因素:机器的软硬件配置单个文档的尺寸,文档总数,索引大小,分片个数,副本个数文档写入方式(如bulk的单次数......
  • 【开源项目】轻量元数据管理解决方案——Marquez
    大家好,我是独孤风。又到了本周的开源项目推荐。最近推荐的元数据管理项目很多,但是很多元数据管理平台的功能复杂难用。那么有没有轻量一点的元数据管理项目呢?今天为大家推荐的开源项目,就是一个轻量级的元数据管理工具。虽然轻量,但是元数据的收集、展示、数据血缘等功能都是支......
  • redis 高可用 二 (主从复制、哨兵和集群Cluster)
    高可用分类主从复制主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。缺陷:故障恢复无法自动化;写操作无法负载均衡;存储能力受到单机的限制。 哨兵在主从复制的基础......
  • 《PySpark大数据分析实战》-10.独立集群模式的代码运行
    ......
  • AI壁纸画展头像表情包流量主微信抖音小程序开源版开发
    AI壁纸画展头像表情包流量主微信抖音小程序开源版开发以下是AI壁纸画展头像表情包流量主微信抖音小程序开源版的开发功能列表:用户注册和登录:实现用户注册和登录功能,包括手机号登录、第三方登录等方式。图片上传和展示:用户可以上传自己的图片或选择系统提供的图片进行展示,支持图片......