• 2024-06-20最快方式搭建docker大数据 测试集群
    平时搭建一套测试集群找包找的累死,现在使用docker搭建cdh版本的 1.首先在服务器上安装dockeryuminstalldocker2.配置国内阿里云docker仓库服务 https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors 换成地址,重启docker服务sudomkdir-p/etc/dockers
  • 2024-06-12CDH详解(史上最全)
    工作记录知识研究CDH概览CDH(ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台,简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的核心元素-可伸缩存储和分布式计算-以
  • 2024-03-14CDH - [01] 概述
      一、什么是CDH  CDH是Cloudera'sDistributionIncludingApacheHadoop的缩写,即Cloudera公司发布的Hadoop发行版。它是一个为Hadoop构建的企业级数据平台,提供了Hadoop核心组件的预编译、测试和优化的版本,以及管理这些组件的工具和附加功能。Cloudera提供了易于安装、配
  • 2024-01-28CDH,HDP,CDP介绍
    CDH是Cloudera公司的代表产品,HDP是Hortonworks公司的代表产品,2019年1月进行了合并,形成了新的Cloudera公司,代表产品CDP。在两家公司合并前,Cloudera当时有两个主推的大数据平台产品:CDH5和CDH6。Hortonworks有两个主推的平台产品:HDP2和HDP3。这两家公司的产品分别对应Hadoop2和Ha
  • 2024-01-17docker安装CDH[单机单节点]---大数据
    https://www.cnblogs.com/51record/p/16378663.html 第一步:拉取cdh镜像dockerpullcloudera/quickstart第二步:启动容器dockerrun--namecdh-d--hostname=quickstart.cloudera--privileged=true-t-i-p8888:8888-p8020:8020-p8022:8022-p7180:7180-p21050:
  • 2023-11-24一、Hadoop概述与初步学习
    一、Hadoop的发展史 Google 爬取全球的网站,然后计算页面的PageRank 要解决网站的问题: a:这些网站怎么存放 b:这些网站应该怎么计算 发布了三篇论文 a:GFS(GoogleFileSystem) b:MapReduce(数据计算方法) c:BigTable-->HBase Dougcutting花费
  • 2023-11-16ClouderaManager中Event Server报java.io.IOException: No sub-file with id .fnm found
    晚上9点30:03.266分 ERROR EventCatcherService ErrorstartingEventServerjava.io.IOException:Nosub-filewithid.fnmfound(fileName=_1f9.cfsfiles:[f474fa52c5c7e5cfdc49"resourcemanager(wyx-cdh-,xp,_log_event,_eventwyx-cdh-hadoop01
  • 2023-11-15概述
    目录1、Hadoop是什么2、Hadoop三大发行版本3、Hadoop优势4、Hadoop组成4.1Hadoop1.x、2.x、3.x区别4.2HDFS概述4.3YARN概述4.4MapReduce1、Hadoop是什么1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2)主要解决,海量数据的存储和海量数据的分析计算问题。3)广
  • 2023-10-08Maven 引用CDH 5.4 的zookeeper时报错:Could not find artifact javax.jms:jms:jar:1.1 in cloudera 的解决办法
    错误:Couldnotfindartifactjavax.jms:jms:jar:1.1incloudera由于默认5.4.0的包引用了zookeeper3.3.1版本,进而引用了log4j的某个版本,导致的报错,改为如下即可: pom:使用cloudera的源:<repositories><repository><id>cloudera</id><u
  • 2023-09-15手动装配Hadoop Cloudera CDH4.2版本
    第1章 概要说明41.1 Hadoop是什么?41.2 为什么选择CDH版本?41.3 集群配置环境41.4 网络结构图5第2章 安装hadoop环境62.1 准备安装包62.2 默认用户组root:root62.3 卸载自带的jdk62.4 安装和配置jdk环境62.5 配置/etc/hosts62.6 配置ssh无密码登陆72.7 处理防火墙72.8
  • 2023-08-04cdh4 hadoop,hive,impala,hbase本地库搭建及安装
    --hadoop文件位置:log目录:1 /var/log/hadoop-hdfs2 /var/log/hadoop-mapreduce3 /var/log/hbase4 /var/log/hive5 /var/log/hive6 /var/log/impala安装目录:1 /usr/lib启动命令目录:1 /etc/init.d/配置文件目录:1 /etc/hadoop/conf2 /etc/hbase/conf3 /etc/hive/conf
  • 2023-07-11CDH /var/lib/cloudera-service-monitor和/var/lib/cloudera-host-monitor占用空间过大
    1、/var/lib/cloudera-service-monitor和/var/lib/cloudera-host-monitor这两个是clouderamanagermentservice服务的默认存储路径,最好改掉,换到大的分区下; 2、空间清理/var/lib/cloudera-service-monitor和/var/lib/cloudera-host-monitor占用空间过大时:先停止clouderaman
  • 2023-07-07部署集群出现问题总结
    部署集群出现问题总结1,未在已配置的存储库中找到任何parcel在装cdh的时候遇到了问题,配置完parcel存储库以后页面提示:未在已配置的存储库中找到任何parcel。尝试在更多选项下添加一个自定义存储库。否则,您可能只能继续使用包默认的parcel存储库目录是cd/opt/cloudera/parc
  • 2023-06-08CDH5.X完全卸载步骤
    //CDH5.X完全卸载步骤#bycoco#2015-01-141.关闭集群中的所有服务。 这个可以通过cloudermanger主页关闭集群。2.卸载[root@master~]#/usr/share/cmf/uninstall-cloudera-manager.sh [root@slave1~]#servicecloudera-sc
  • 2023-06-07CDH cm节点高可用方案
        近期因工作需要,对CDHcm管理节点的高可用做了些相关的测试,测试大概分2部分。具体如下,希望有兴趣的同学可以多交流学习。 1.cm节点关于postgres数据库的备用节点高可用。 2.cm节点关于mysql数据库的备用节点高可用。测试需求:因线上cm管理节点是单点,一旦cm管理节点的
  • 2023-06-06postgres数据库简单的使用
    postgres数据库简单的使用 [root@hadoop001cloudera-scm-server]#/usr/bin/psql-Uscm-dscm-p7432用户scm的口令:psql(8.4.20)输入"help"来获取帮助信息.scm=>?scm->\?                      资料库列表  名称
  • 2023-04-28Hadoop概述
    Hadoop概述Hadoop是什么hadoop是一个由Apache基金会所开发的分布式系统基础框架其主要解决,海量数据的存储和海量数据的的分析计算问题广义上,Hadoop通常是指一个更加广泛的概念——Hadoop生态圈Hadoop的发展历史Hadoop创始人DougCutting,为了实现与Google类似的全
  • 2023-04-20maven配置cloudera镜像源
    1、setting.xml配置<mirrors><!--阿里云仓库--><mirror><id>aliyun</id><mirrorOf>central</mirrorOf><name>aliyunmaven</name><url>http://ma
  • 2023-04-04CDH+Hive部署
    CDH介绍:  CDH全称Cloudera’sDistributionIncludingApacheHadoop,是Cloudera公司提供的一个ApacheHadoop发行版。CDH将Hadoop与其他十几个关键的开源项目集成,并且加入了集群自动化安装、中心化管理、集群监控、报警等功能。Hive介绍:  Hive是基于Hadoop的一
  • 2023-03-20centos7通过CDH部署Hadoop
    一、角色分配及安装环境准备资料下载地址:链接:百度网盘1.机器及机器角色规划2.关闭防火墙及SELinux3.安装依赖(server)yuminstall-ycyrus-sasl-plaincyrus-sa
  • 2023-02-23Cloudera Manager和Cloudera Navigator使用的端口
    ¶下图概述了ClouderaManager,ClouderaNavigator和ClouderaManagementService角色使用的某些端口:转载于:https://wiki.amoscloud.com/zh/Bigdata/BigdataPlatform/
  • 2023-02-15Maven配置多数据源
    一、配置文件修改maven配置文件,用户目录下.m2文件夹中的setting.xml,内容如下<?xmlversion="1.0"encoding="UTF-8"?><settingsxmlns="http://maven.apache.org/SETTIN
  • 2023-02-12CDH入门教程1-1
    CDH入门教程1-2采集模块安装第2章数据采集模块安装2.1HDFS、YARN、Zookeeper安装2.1.1选择自定义安装2.1.2选择安装服务2.1.3分配节点2.1.4集群设置全部选默认即可
  • 2023-02-12CDH入门教程2
    CDH入门教程2第3章数据仓库模块安装3.1Hive安装3.1.1添加服务3.1.2添加Hive服务3.1.3将Hive服务添加到Cluster13.1.4配置hive元数据3.1.5测试通过后继续3.1.6
  • 2023-01-19部署CDH显示对于此 Cloudera Manager 版本 (6.2.1) 太新的 CDH 版本不会显示
    解决办法:CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.sha1此文件没有变更到CDH-6.2.1-1.cdh6.2.1.p0.1425774-el7.parcel.shacd/opt/cloudera/parcel-repomvCDH-6.2.1-1.