首页 > 其他分享 >Hadoop on k8s 快速部署进阶精简篇

Hadoop on k8s 快速部署进阶精简篇

时间:2023-07-10 23:12:12浏览次数:53  
标签:compose 进阶 部署 hadoop Hadoop mysql helm docker k8s

目录

一、概述

前面一篇文章已经很详细的介绍了Hadoop on k8s部署了,这里主要针对部署时可能会调整的地方和注意事项进行讲解,想详细了解详细部署过程可参考我上一篇文章:Hadoop on k8s 编排部署进阶篇

在这里插入图片描述

二、快速部署步骤如下

1)安装 git

yum -y install git

2)部署 mysql

如果小伙伴已经有mysql了,这一步就可以忽略,如果想快速部署mysql可以参考我以下几篇文章:

这里以 docker-compose 部署 mysql 为例:

# 安装 docker-compose
curl -SL https://github.com/docker/compose/releases/download/v2.16.0/docker-compose-linux-x86_64 -o /usr/local/bin/docker-compose

chmod +x /usr/local/bin/docker-compose
docker-compose --version

# 下载部署包
git clone https://gitee.com/hadoop-bigdata/docker-compose-mysql.git

cd docker-compose-mysql

# 创建网络
docker network create hadoop-network
# 部署
docker-compose -f docker-compose.yaml up -d
# 查看
docker-compose -f docker-compose.yaml ps
# 卸载
docker-compose -f docker-compose.yaml down

【温馨提示】这里的 mysql 是 5.7,如果 mysql 是 8 则需要更换 mysql driver 包(即:mysql-connector-java-*-bin.jar)。需要重新构建镜像,如不明白的,可以关注我公众号:大数据与云原生技术分享,进行咨询~

3)创建存储目录(所有节点)

# 这里默认使用hostPath挂载方式,如果使用pv,pvc挂载方式,就不需要在宿主机上创建目录了,非高可用可不用创建jn。根据自己的情况创建目录。如果目录不同,则需要更改编排。下面会讲解。
mkdir -p /opt/bigdata/servers/hadoop/{nn,jn,dn}/data/data{1..3}
chmod 777 -R /opt/bigdata/servers/hadoop/

4)下载 hadoop-on-k8s 部署包

git clone https://gitee.com/hadoop-bigdata/hadoop-on-kubernetes.git

cd hadoop-on-kubernetes

cat values.yaml

nameNode
在这里插入图片描述
dataNode
在这里插入图片描述

5)修改 hadoop configmap

如果需要修改database和 nodemanager 的节点数,记得修改 comfigmap 配置:templates/hadoop-configmap.yaml

在这里插入图片描述

6)修改 hive configmap (MySQL 配置)

如果需要修改hive 配置,记得修改hive comfigmap 配置:templates/hive/hive-configmap.yaml
在这里插入图片描述

7)安装 helm

下载地址:https://github.com/helm/helm/releases

# 下载包
wget https://get.helm.sh/helm-v3.9.4-linux-amd64.tar.gz
# 解压压缩包
tar -xf helm-v3.9.4-linux-amd64.tar.gz
# 制作软连接
ln -s /opt/helm/linux-amd64/helm /usr/local/bin/helm
# 验证
helm version
helm help

8)开始部署

# 安装
helm install hadoop ./ -n hadoop --create-namespace

# 更新
# helm upgrade hadoop ./ -n hadoop

# 卸载
# helm uninstall hadoop -n hadoop

# 查看
kubectl get pods,svc -n hadoop -owide

在这里插入图片描述

【温馨提示】上面还有几个pod没起来,那是因为资源不足导致,如果小伙伴资源足够是不会出现这个问题的。

9)测试验证

hdfs web:http://ip:30870
在这里插入图片描述
yarn web:http://ip:
在这里插入图片描述
通过 hive 创建库表和添加数据验证集群可用性

kubectl exec -it hadoop-hadoop-hive-hiveserver2-0 -n hadoop -- bash

beeline -u jdbc:hive2://hadoop-hadoop-hive-hiveserver2:10000  -n hadoop

# 建表
CREATE TABLE mytable (
  id INT,
  name STRING,
  age INT,
  address STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';

# 添加数据
INSERT INTO mytable VALUES (1, 'Alice', 25, 'F'), (2, 'Bob', 30, 'M'), (3, 'Charlie', 35, 'M');

在这里插入图片描述
到此 Hadoop on k8s 快速部署进阶篇介绍了,有任何疑请关注我公众号:大数据与云原生技术分享,进行问题咨询,进行技术交流,如本篇文章对您有所帮助,麻烦帮忙一键三连(点赞、转发、收藏)~

标签:compose,进阶,部署,hadoop,Hadoop,mysql,helm,docker,k8s
From: https://www.cnblogs.com/liugp/p/17542621.html

相关文章

  • 大数据面试题集锦-Hadoop面试题(四)-YARN
    你准备好面试了吗?这里有一些面试中可能会问到的问题以及相对应的答案。如果你需要更多的面试经验和面试题,关注一下"张飞的猪大数据分享"吧,公众号会不定时的分享相关的知识和资料。目录1、为什么会产生yarn,它解决了什么问题,有什么优势?2、简述hadoop1与hadoop2的架构异同3、H......
  • Hadoop中YARN集群启停命令
    一键启停脚本#一键启动yarn集群start-yarn.sh#一键关闭yarn集群stop-yarn.sh单进程启停start和stop决定启动和停止可控制resourcemanager、nodemanager、proxyserver三种进程yarn--daemonstart|stopresourcemanager|nodemanager|proxyserver历史服务器启动或停止map......
  • K8S简介
    Kubernetes(K8S)是什么它是一个为容器化应用提供集群部署和管理的开源工具,由GoogleDocs开发。kubernetes这个名字源于希腊语,意为“舵手”或“飞行员”。k8s这个缩写就是因为k和s之间有8个字符的关系。GoogleDocs在2014年开源了Kubernetes项目。主要特性高可用,不宕机,自动......
  • 面试进阶齐飞!Github一天万赞的阿里Java系统性能优化有多牛?
    前两天在知乎上看到一个问答,说的是:一个Java程序员具备什么样的素质和能力才可以称得上高级工程师?这个问题也引发了我的一些思考,可能很多人会说,“作为高级工程师,基础得过硬、得熟练掌握一门编程语言、至少看过一个优秀开源项目的源代码、有过高并发/性能优化的工作经验、沟通能力......
  • Hadoop3.3.5完全分布式搭建
    首先在之前的伪分布基础上克隆两台机器这样一共三台虚拟机为这三台虚拟机设置三个不同的静态ip地址和主机名我的是billsaifu192.168.15.130hadoop1192.168.15.131hadoop2192.168.15.132静态IP设置#先进入rootvim/etc/sysconfig/network-scripts/ifcfg-ens33#修改......
  • 硬核!阿里2023版Spring全家桶进阶笔记流出,堪称Java跳槽神器
    最近小伙伴在我后台留言是这样的: 现在就这光景,不比以前,会个CRUD就有人要,即使大部分公司依然只需要做CRUD的事情......现在去面试,只会CRUD还要被吐槽: 面试造火箭,工作拧螺丝,就是现在互联网最真实的写照。很多程序员都是死磕八股文,以应对面试。这种情况无可厚非,但其实最重......
  • Eclipse搭建springBoot进阶篇-SpringBoot+Mybatis
    Eclipse搭建springBoot入门篇 在入门篇了搭建了一个简单的SpringBoot的Demo,在进阶篇将真正引入实战,也就是能支撑基本的企业中小型项目开发。本次通过springBoot+Mybatis+maven等搭建一个适用于开发中小型项目的简单架构pom文件需要更新maven的jar,对java包进行下载。<?xmlversi......
  • gawk 进阶
    gawk进阶原创 饺子泡牛奶 饺子泡牛奶 2023-07-0908:40 发表于四川收录于合集#Linux与Shell18个本章内容:使用变量处理数组使用模式结构化命令格式化打印内建函数自定义函数一、使用变量所有编程语言共有的一个重要特性是使用变量来存取值。gawk 编程......
  • Hadoop on k8s 编排部署进阶篇
    目录一、概述二、k8s部署部署三、开始编排部署Hadoop1)构建镜像Dockerfile2)values.yaml文件配置3)hadoopconfigmapyaml4)hiveconfigmapyaml5)开始安装6)测试验证一、概述Hadoop是一个开源的分布式计算框架,用于处理大规模数据集的存储和处理。它使用了Hadoop分布式文件系统......
  • 安装k8s-1.27.0(二)
    安装软件包[root@k8smaster2~]#yuminstall-ykubelet-1.27.0kubeadm-1.27.0kubectl-1.27.0生成初始化配置文件[root@k8smaster1~]#kubeadmconfigprintinit-defaults>kubeadm.yaml修改初始化文件添加ipvs启动插件apiVersion:kubeproxy.config.k8s.io/v1alpha1kind:......