首页 > 系统相关 >centos7通过CDH部署Hadoop

centos7通过CDH部署Hadoop

时间:2024-09-26 12:54:05浏览次数:3  
标签:scm cloudera CDH Hadoop echo centos7 nginx 6.2 安装

一、角色分配及安装环境准备

资料下载地址:

链接: 百度网盘

1.机器及机器角色规划

centos7通过CDH部署Hadoop_hadoop

2.关闭防火墙及SELinux

3.安装依赖(server)

redhat-lsb-core

4.配置hosts解析

192.168.1.136 hadoop01
192.168.1.137 hadoop02
192.168.1.138 hadoop03

5.配置Cloudera Manager yum仓库(server)

#服务端配置
yum install nginx -y
mkdir -p /usr/share/nginx/html/cm6/
mv *.rpm /usr/share/nginx/html/cm6/
createrepo -pdo /usr/share/nginx/html/cm6/ /usr/share/nginx/html/cm6/

vim /etc/nginx/nginx.conf
   root         /usr/share/nginx/html/cm6/;
   autoindex    on;

systemctl restart nginx
systemctl enable nginx


#客户端配置
vim /etc/yum.repos.d/cm.repo
[cm-repo]
name=cm
baseurl=http://192.168.1.136
gpgcheck=0
enabled=1

yum repolist 
cm-repo                                     cm                                                  6
yum list | grep cloudera

6.创建cloudera-scm用户(server)

useradd cloudera-scm
echo "cloudera-scm" |passwd --stdin cloudera-scm
echo "cloudera-scm ALL=(root)NOPASSWD:ALL" >> /etc/sudoers

7.安装MySQL(集群内安装)

参考:

create database scm DEFAULT CHARACTER SET utf8;
grant all PRIVILEGES on *.* TO 'root'@'%' IDENTIFIED BY 'Qwer@123' WITH GRANT OPTION;
grant all PRIVILEGES on *.* TO 'root'@'localhost' IDENTIFIED BY 'Qwer@123' WITH GRANT OPTION;
grant all PRIVILEGES on *.* TO 'root'@'hadoop01' IDENTIFIED BY 'Qwer@123' WITH GRANT OPTION;
flush privileges;

8.所有节点安装jdk

yum install oracle-j2sdk1.8 -y  #不要自定义安装

二、安装CM Server及Agent服务

1.安装服务

yum install -y enterprise-debuginfo-6.2.1-1426065.el7.x86_64
yum install -y cloudera-manager-server-6.2.1-1426065.el7.x86_64
yum install -y cloudera-manager-server-db-2-6.2.1-1426065.el7.x86_64
cp mysql-connector-java-5.1.40.jar /opt/cloudera/cm/lib
/opt/cloudera/cm/schema/scm_prepare_database.sh -h 192.168.1.136 mysql scm root Qwer@123 # 主机 database类型 数据库名称 账号 密码 
cat /etc/cloudera-scm-server/db.properties #初始后保存连接的相关信息 
systemctl start cloudera-scm-server 
netstat -tnlp #7180端口

2.配置本地parcel包

#必须要在数据库初始化后执行
cp CDH-6.2.1-*  allkeys.asc /opt/cloudera/parcel-repo
mv CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.sha1 CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.sha   #删除结尾1

3.访问控制台

centos7通过CDH部署Hadoop_hadoop_02

4.配置parcel

回到主页

centos7通过CDH部署Hadoop_nginx_03

centos7通过CDH部署Hadoop_hadoop_04

 

centos7通过CDH部署Hadoop_nginx_05

修改更新频率为1分钟,默认1个小时

centos7通过CDH部署Hadoop_cloudera_06

等待一分钟,确保出现torrent文件

centos7通过CDH部署Hadoop_nginx_07

5.创建集群

centos7通过CDH部署Hadoop_nginx_08

centos7通过CDH部署Hadoop_nginx_09

centos7通过CDH部署Hadoop_cloudera_10

根据企业实际情况选择对应的版本,因为实验选择免费版本

centos7通过CDH部署Hadoop_nginx_11

定义集群名称

centos7通过CDH部署Hadoop_nginx_12

定义主机名称

 

centos7通过CDH部署Hadoop_nginx_13

centos7通过CDH部署Hadoop_nginx_14

centos7通过CDH部署Hadoop_cloudera_15

centos7通过CDH部署Hadoop_cloudera_16

centos7通过CDH部署Hadoop_cloudera_17

 其他会自动安装

6.检查集群

centos7通过CDH部署Hadoop_cloudera_18

centos7通过CDH部署Hadoop_hadoop_19

 

centos7通过CDH部署Hadoop_cloudera_20

centos7通过CDH部署Hadoop_nginx_21

 

centos7通过CDH部署Hadoop_hadoop_22

7.修复问题

临时生效:
sysctl -w vm.swappiness=10
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
永久生效:
echo "vm.swappiness=10" >> /etc/sysctl.conf
echo "echo never > /sys/kernel/mm/transparent_hugepage/defrag" >> /etc/rc.local
echo "echo never > /sys/kernel/mm/transparent_hugepage/enabled" >> /etc/rc.local

8.新增主机

centos7通过CDH部署Hadoop_nginx_23

centos7通过CDH部署Hadoop_cloudera_24

 

centos7通过CDH部署Hadoop_hadoop_25

centos7通过CDH部署Hadoop_hadoop_26

 其余步骤与上面类似,不在赘述

centos7通过CDH部署Hadoop_cloudera_27

三、安装CM service服务

 1.CM service服务简介

可作为一组角色实施各种管理功能

1. Activity Monitor:收集关于MapReduce服务运行的活动的信息。默认情况下不添加此角色,实际生产环境也是不需要的。
2. Host Monitor:收集有关主机的运行状况和指标信息。
3. Service Monitor:从YARN和Impala服务中收集关于服务和活动信息的健康和度量信息。
4. Event Server:聚合组件的事件并将其用于警报和搜索。
5. Alert Publisher :为特定类型的事件生成和提供警报,实际情况下用的也少。

2.创建服务所需的相关目录(server)

mkdir -p /var/lib/cloudera-host-monitor
mkdir /var/lib/cloudera-service-monitor

chown -R cloudera-scm:cloudera-scm /var/lib/cloudera-host-monitor
chown -R cloudera-scm:cloudera-scm /var/lib/cloudera-service-monitor/

3.安装

centos7通过CDH部署Hadoop_hadoop_28

centos7通过CDH部署Hadoop_hadoop_29

 

centos7通过CDH部署Hadoop_cloudera_30

 安装,稍等一会查看是否有监控数据

centos7通过CDH部署Hadoop_cloudera_31

四、安装HDFS服务 

centos7通过CDH部署Hadoop_cloudera_32

centos7通过CDH部署Hadoop_cloudera_33

centos7通过CDH部署Hadoop_nginx_34

定义相关配置默认即可

centos7通过CDH部署Hadoop_hadoop_35

 所有步骤执行完成

centos7通过CDH部署Hadoop_cloudera_36

centos7通过CDH部署Hadoop_hadoop_37

centos7通过CDH部署Hadoop_nginx_38

优dfs.permissions化配置否则会因为权限问题不能再hdfs中创建目录和文件

centos7通过CDH部署Hadoop_nginx_39

 

 

centos7通过CDH部署Hadoop_hadoop_40

 

centos7通过CDH部署Hadoop_hadoop_41

 

手动测试写入数据 

centos7通过CDH部署Hadoop_cloudera_42

 

 

 

centos7通过CDH部署Hadoop_nginx_43

 

centos7通过CDH部署Hadoop_cloudera_44

没有问题,安装成功

五、安装YARN服务

 无特殊配置,参考上一步按提示填入对应的内容,其他默认即可

 验证

cd /opt/cloudera/parcels/CDH-6.2.1-1.cdh6.2.1.p0.1425774/lib/hadoop-mapreduce/
hadoop jar  hadoop-mapreduce-examples-3.0.0-cdh6.2.1.jar pi 2 4

六、安装 Hive(选择带需要ZK)

1.数据中创建Hive库

2.拷贝mysql驱动

cp mysql-connector-java-5.1.40.jar /opt/cloudera/parcels/CDH/lib/hive/lib/

3.集群安装服务

centos7通过CDH部署Hadoop_nginx_45

centos7通过CDH部署Hadoop_cloudera_46

centos7通过CDH部署Hadoop_cloudera_47

验证

#验证
hive #执行命令
select from_unixtime(1583781807, 'yyyy-MM-dd');

#UI
http://hadoop01:10002/

 https://docs.cloudera.com/documentation/enterprise/6/6.2/topics/introduction.html

"一劳永逸" 的话,有是有的,而 "一劳永逸" 的事却极少



标签:scm,cloudera,CDH,Hadoop,echo,centos7,nginx,6.2,安装
From: https://blog.51cto.com/u_8901540/12118313

相关文章

  • CentOS7.4安装部署openstack [Liberty版] (一)
    一、OpenStack简介OpenStack是一个由NASA(美国国家航空航天局)和Rackspace合作研发并发起的,以Apache许可证授权的自由软件和开放源代码项目。OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。OpenStack支持几乎所有类型的云环境,项目目标是提供实施简......
  • CentOS7.4安装部署openstack [Liberty版] (二)
    继上一篇博客CentOS7.4安装部署openstack[Liberty版](一),本篇继续讲述后续部分的内容一、添加块设备存储服务1.服务简述:OpenStack块存储服务为实例提供块存储。存储的分配和消耗是由块存储驱动器,或者多后端配置的驱动器决定的。还有很多驱动程序可用:NAS/SAN,NFS,ISCSI,Ceph等等。块存......
  • Hadoop简介
    一、什么是HadoopHadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。 Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设......
  • Hadoop2.6.5集群搭建
    一、 Hadoop的分布式模型Hadoop通常有三种运行模式:本地(独立)模式、伪分布式(Pseudo-distributed)模式和完全分布式(Fullydistributed)模式。安装完成后,Hadoop的默认配置即为本地模式,此时Hadoop使用本地文件系统而非分布式文件系统,而且其也不会启动任何Hadoop守护进程,Map和Reduce......
  • 【计算机毕设-大数据方向】基于Hadoop的车辆管控可视化平台的设计与实现
    ......
  • 【计算机毕设-大数据方向】基于Hadoop的新闻资讯数据分析可视化系统的设计与实现
    ......
  • centos7安装elasticsearch6.3.x集群
    一、环境信息及安装前准备主机角色(内存不要小于1G): 软件及版本(百度网盘链接地址和密码:链接:https://pan.baidu.com/s/17bYc8MRw54GWCQCXR6pKjg提取码:f6w8)  部署前操作:关闭防火墙,关闭selinux(生产环境按需关闭或打开)同步服务器时间,选择公网ntpd服务器或者自建ntpd服务器......
  • Centos7使用pxe安装KVM虚拟机
    Centos7使用pxe安装KVM虚拟机一、安装服务所需的软件[root@localhost~]yuminstallnginxdhcpvsftpdsyslinux-y[root@localhost~]mount-ploop-tiso9660images/CentOS-7-x86_64-DVD-1804.iso/mnt#提前上传镜像[root@localhost~]systemctlstart......
  • centos7安装gitlab并汉化
    一、基础环境准备1.安装依赖包[root@gitlab-server~]#yuminstallcurlpolicycoreutilsopenssh-serveropenssh-clientspostfixwgetgitpatch-y[root@gitlab-server~]#systemctlstartpostfix2.配置yum源(由于网络问题,国内用户,建议使用清华大学的镜像源进行安装)[root@g......
  • 使用dockerfile来构建一个包含Jdk17的centos7镜像
    文章目录1、dockerfile简介2、入门案例2.1、创建目录/opt/dockerfilejdk172.2、上传jdk-17_linux-x64_bin.tar.gz到/opt/dockerfilejdk172.3、在/opt/dockerfilejdk17目录下创建dockerfile文件2.4、执行命令构建镜像:不要忘了后面的那个.2.5、查看镜像是否建立完成2......