首页 > 其他分享 >CDH入门教程2

CDH入门教程2

时间:2023-02-12 23:34:20浏览次数:77  
标签:cloudera parcel 安装 入门教程 CDH usr hadoop102 root

CDH入门教程2

第3章 数据仓库模块安装

3.1 Hive安装

3.1.1 添加服务

3.1.2 添加Hive服务

3.1.3 将 Hive 服务添加到 Cluster 1

3.1.4 配置hive元数据

3.1.5 测试通过后继续

3.1.6 自动启动Hive进程

3.2 Oozie安装

3.2.1 添加Oozie服务

3.2.2 选择集群节点

3.2.3 选择有MySQL的节点安装

3.2.4 链接数据库

3.2.5 一路继续到完成

3.3 Hue安装

3.3.1 Hue概述

1)Hue来源

HUE=Hadoop User Experience(Hadoop用户体验),直白来说就一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用HUE我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。

2)Hue官网及使用者

官网网站:http://gethue.com/

3.3.2 安装前的准备

1)在LoadBalancer节点安装mod_ssl

[root@hadoop102 ~]# yum -y install mod_ssl

2)查看/usr/lib64/mysql下有没有libmysqlclient_r.so.18,如果没有,上传hadoop103主机上的libmysqlclient_r.so.18到/usr/lib64/mysql,并软链接到/usr/lib64/,然后运行ldconfig 命令,让其生效。

[root@hadoop102 ~]# ls /usr/lib64/mysql

[root@hadoop103 mysql]#

scp /usr/lib64/mysql/libmysqlclient.so.18 root@hadoop102:/usr/lib64/mysql/

[root@hadoop102 ~]ln -s /usr/lib64/mysql/libmysqlclient.so.18 /usr/lib64/libmysqlclient_r.so.18

[root@hadoop102 ~]ldconfig

3.3.3 HUE安装步骤

1)添加HUE服务

2)选择集群节点

3)分配角色

4)配置数据库

5)安装完成

6)HUE页面

http://hadoop102:8888(未优化)或http://hadoop102:8889(优化)

第一次开启HUE会出现以下页面,此时输入的用户名和密码可以随意,之后登录页面以第一次输入的账号密码为依据。例如,用户名:admin 密码:admin

3.4 Impala安装

3.4.1 添加服务

3.4.2 选择Impala服务

3.4.3 角色分配

注意:最好将StateStore和CataLog Sever单独部署在同一节点上。

3.4.4 配置Impala

3.4.5 启动Impala

3.4.6 安装成功

3.4.7 配置Hue支持Impala

3.5 Impala基于Hue查询

3.5.1 打开Hue

3.5.2 进入impala查询

第4章 实时模块安装之Spark升级

在CDH5.16.2集群中,默认安装的Spark是1.6版本,这里需要将其升级为Spark2.4版本。经查阅官方文档,发现Spark1.6和2.x是可以并行安装的,也就是说可以不用删除默认的1.6版本,可以直接安装2.x版本,它们各自用的端口也是不一样的。

Cloudera发布Apache Spark 2概述(可以在这里面找到安装方法和parcel包的仓库)

cloudera的官网可以下载相关的parcel 的离线安装包:

https://www.cloudera.com/documentation/spark2/latest/topics/spark2_installing.html

Cloudera Manager版本的介绍:

https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_parcels.html#cmug_topic_7_11_5__section

4.1 Spark升级过程

4.1.1 离线包下载

1)所需软件:http://archive.cloudera.com/spark2/csd/

2)Parcels 包的下载地址:http://archive.cloudera.com/spark2/parcels/2.4.0.cloudera2/

4.1.2 离线包上传

1)上传文件SPARK2_ON_YARN-2.4.0.cloudera2.jar到/opt/cloudera/csd/下面

2)上传文件SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7.parcel和SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7.parcel.sha1 到/opt/cloudera/parcel-repo/

3)将SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7.parcel.sha1重命名为SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7.parcel.sha

[root@hadoop102 parcel-repo]# mv SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7.parcel.sha1 SPARK2-2.4.0.cloudera2-1.cdh5.13.3.p0.1041012-el7.parcel.sha

4.2 页面操作

4.2.1 更新Parcel

在cm首页点击Parcel,再点击检查新Parcel

4.2.2 点击分配

4.2.3 点击激活

4.2.4 回到首页点击添加服务

4.2.5 点击Spark2继续

如果没有Spark2,则重启server:

[root@hadoop102 ~]#

/opt/module/cm/cm-5.16.2/etc/init.d/cloudera-scm-server restart

4.2.6 选择一组依赖关系

4.2.7 角色分配

需要选择Gateway(客户端) 可以都选

4.2.8 部署并启动

注意:这里我报了一个错:主机 hadoop102 (id=3) 上的客户端配置 (id=8) 已使用 1 退出,而预期值为 0。

  1. 问题原因:最后找到原因是因为CM安装Spark不会去环境变量去找Java,需要将Java路径添加到CM配置文件
  2. 解决办法1(需要重启cdh):

找到hadoop102、hadoop103、hadoop104三台机器的配置,配置java主目录

3)解决方法2(无需重启cdh):

查看/opt/module/cm/cm-5.16.2/lib64/cmf/service/common/cloudera-config.sh

找到java8的home目录,会发现cdh不会使用系统默认的JAVA_HOME环境变量,而是依照bigtop进行管理,因此我们需要在指定的/usr/java/default目录下安装jdk。当然我们已经在/opt/module/jdk1.8.0_144下安装了jdk,因此创建一个连接过去即可

[root@hadoop102 ~]# mkdir /usr/java

[root@hadoop102 ~]# ln -s /opt/module/jdk1.8.0_144/ /usr/java/default

[root@hadoop103 ~]# mkdir /usr/java

[root@hadoop103 ~]# ln -s /opt/module/jdk1.8.0_144/ /usr/java/default

[root@hadoop104 ~]# mkdir /usr/java

[root@hadoop104 ~]# ln -s /opt/module/jdk1.8.0_144/ /usr/java/default

4.2.9 命令行查看命令

image_1cdpgf311bm11tl030ab16nt376.png-103.7kB

image_1cdpgfdce1g6b1j6f5ja1lf4134g7j.png-483.3kB

标签:cloudera,parcel,安装,入门教程,CDH,usr,hadoop102,root
From: https://www.cnblogs.com/kkk247843405/p/17115010.html

相关文章

  • CDH入门教程3
    CDH入门教程3第5章卸载CDH(了解)集群出现错误异常时,再按照本章步骤操作。但是卸载CDH,重新安装只可以解决部分报错,一些极个别顽固报错还是有可能解决不了,所以如果同学们在安......
  • 大爽Python入门教程 2-7 *拓展实践,对比与思考
    大爽Python入门公开课教案点击查看教程总目录本文偏难。推荐等第一二三四章上完后,回过来拓展阅读。基础情景思考假设有这样一张成绩表最左边的一列是名字,起名麻......
  • 大爽Python入门教程 2-6 拓展练习
    大爽Python入门公开课教案点击查看教程总目录方位输出第一章有一个思考题,方位变换:小明同学站在平原上,面朝北方,向左转51次之后(每次只转90度),小明面朝哪里?小明转过......
  • 开心档-软件开发入门教程网之Node.js GET/POST请求
    Node.jsGET/POST请求在很多场景中,我们的服务器都需要跟用户的浏览器打交道,如表单提交。表单提交到服务器一般都使用GET/POST请求。本章节我们将为大家介绍Node.jsGET/P......
  • Eolink 入门教程:钉钉 API 对接
    系列文章:Eolink神技之一:基于数据库智能生成API文档Eolink神技之二:API全生命周期管理前言这里我通过Eolink的Webhook功能可以对接企业微信、蓝信、飞书等工......
  • 亚马逊商城入门教程_编程入门自学教程_菜鸟教程-免费教程分享
    教程简介亚马逊商城快速指南-从简单和简单的步骤开始学习亚马逊商城,从基本到高级概念,包括为什么选择亚马逊?,亚马逊优势,帐户类型,销售什么?,产品列表,费用,帐户设置,购买盒,运输......
  • 简易的git命令行入门教程
    一、Git全局设置gitconfig--globaluser.name"用户名"gitconfig--globaluser.email"邮件地址@163.com"二、创建git仓库mkdir项目名cd项目名gitinitt......
  • chunjun同步两个带Kerberos认证的CDH集群数据
        最近在项目中遇到同步两个CDH数据文件的需求,调研了一圈,发现datax不支持两个cdh同时进行kerberos认证,因此切换到chunjun,chunjun在kerberos认证的配......
  • Linux入门,Linux入门教程:Linux文件管理
    一、文件命名规则1、可以使用哪些字符?除了字符“/”之外,所有的字符都可以使用,但是要注意,在目录名或文件名中,不建议使用某些特殊字符,例如,<、>、?、*等,尽量避免使用。如果......
  • 星环科技TDH多模型统一架构VS CDH架构
    CDH是Cloudera的开源平台发行版,通过将Hadoop与其他十几个开源项目集成,为企业大数据业务提供服务。在CDH开源大数据方案中,是通过多个互相独立的组件提供相应的能力,每个场景需......