• 2024-12-29Cloudera集群运维手册-开启Kerberos认证篇(Active Directory)
    [前]关于本文大数据安全模块主要包含认证,授权,审计,加密四大子模块,其中认证是所有模块的基础。没有认证作为前提,其他三大模块都毫无意义。本文详细介绍了为Cloudera集群开启Kerberos认证的整个过程。[〇]Kerberos协议入门1-关于Kerberos定义:Kerberos是一种网络认证协议,用于通
  • 2024-12-29Cloudera集群运维-关于kerberos加密算法的配置梳理
    [0]关于本文在为集群配置Kerberos时,很容易被加密算法相关的错误搞得头晕目眩,这里有必要梳理一下有关配置。直接先总结ClouderaManager中的Kerberos加密类型:影响客户端Cloudera Manager生产Keytab时使用的加密算法/etc/krb5.conf中的permitted_enctypes,default_tkt_encty
  • 2024-12-29Cloudera集群运维手册-开启Ranger授权篇
    [一]安装Solr&Ranger1-安装solr服务添加服务选择依赖分配角色审核更改命令详情汇总2-安装Ranger服务添加服务选择依赖分配角色数据库设置CREATEDATABASErangerDEFAULTCHARACTERSETutf8DEFAULTCOLLATEutf8_general_ci;CREATEUSER'ranger'@'%'IDENTIFIEDWITH
  • 2024-12-29Cloudera集群运维-如何优化Hbase Regionserver GC
    [前]RegionServerGC调优【警告】为HBase配置JVM垃圾回收是一项高级操作。配置不当可能对集群的性能产生重大影响。请仔细测试任何配置更改。【警告】 使用OpenJDK11时,ClouderaManager和大多数ClouderaRuntime服务使用G1GC作为默认的垃圾回收方法。(Java8
  • 2024-09-26centos7通过CDH部署Hadoop
    一、角色分配及安装环境准备资料下载地址:链接:百度网盘1.机器及机器角色规划2.关闭防火墙及SELinux3.安装依赖(server)redhat-lsb-core4.配置hosts解析192.168.1.136hadoop01192.168.1.137hadoop02192.168.1.138hadoop035.配置ClouderaManageryum仓库(server)#服务端配置y
  • 2024-08-15CDH 集群 使用 JindoFS SDK 访问 OSS
    CDH集群使用JindoFSSDK访问OSSCDH(Cloudera'sDistribution,includingApacheHadoop)是众多Hadoop发行版本中的一种,本文以CDH5.16.2为例介绍如何配置CDH支持使用JindoFSSDK访问OSS。步骤1.安装jar包下载最新的jar包jindofs-sdk-x.x.x.jar(​​下载页面​​),将
  • 2024-08-08CDH的CM金丝雀Canary报错
    CM金丝雀Canary报错1HDFS金丝雀Canary测试无法为/tmp/.cloudera_health_monitoring_canary_files创建父目录。2HiveMetastoreCanaryHiveMetastorecanary创建huehdfs主目录失败。检查:1)hdfs是否处于safemode,正常是off#hdfsdfsadmin-safemodegetSafe
  • 2024-07-137.13(第一周周六)
    第一周,基于Ambari搭建了大数据分析平台,根据教程创建了三台Linux虚拟机。根据教程一点一点做,发现了很多问题,通过网上搜索资料解决了以后,顺利地搭建起了该平台,发现这块东西真的很难,主要是很抽象,不像之前学的搭建一个网站,写一款安卓软件,现在大数据这个东西看不见摸不着,而且我也没有Li
  • 2024-07-137.13 第2周
    Hadoop设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性,正是这些设计上与生俱来的优点,才使得Hadoop一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。Hadoop技术在互联网领域已经得到了广泛的运用,例如,Yahoo使用4000个节点的Hadoop集群来支持广告系
  • 2024-07-10Parquet && Impala
    参考官网:Parquet: ParquetImpala: ImpalaParquet:https://github.com/Parquet/parquet-format MetadataTherearethreetypesofmetadata:filemetadata,column(chunk)metadataandpageheadermetadata.AllthriftstructuresareserializedusingtheTCompa
  • 2024-06-20最快方式搭建docker大数据 测试集群
    平时搭建一套测试集群找包找的累死,现在使用docker搭建cdh版本的 1.首先在服务器上安装dockeryuminstalldocker2.配置国内阿里云docker仓库服务 https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors 换成地址,重启docker服务sudomkdir-p/etc/dockers
  • 2024-06-12CDH详解(史上最全)
    工作记录知识研究CDH概览CDH(ClouderaDistributionIncludingApacheHadoop)是由Cloudera公司提供的一个集成了ApacheHadoop以及相关生态系统的发行版本。CDH是一个大数据平台,简化和加速了大数据处理分析的部署和管理。CDH提供Hadoop的核心元素-可伸缩存储和分布式计算-以
  • 2024-03-14CDH - [01] 概述
      一、什么是CDH  CDH是Cloudera'sDistributionIncludingApacheHadoop的缩写,即Cloudera公司发布的Hadoop发行版。它是一个为Hadoop构建的企业级数据平台,提供了Hadoop核心组件的预编译、测试和优化的版本,以及管理这些组件的工具和附加功能。Cloudera提供了易于安装、配
  • 2024-01-28CDH,HDP,CDP介绍
    CDH是Cloudera公司的代表产品,HDP是Hortonworks公司的代表产品,2019年1月进行了合并,形成了新的Cloudera公司,代表产品CDP。在两家公司合并前,Cloudera当时有两个主推的大数据平台产品:CDH5和CDH6。Hortonworks有两个主推的平台产品:HDP2和HDP3。这两家公司的产品分别对应Hadoop2和Ha
  • 2024-01-17docker安装CDH[单机单节点]---大数据
    https://www.cnblogs.com/51record/p/16378663.html 第一步:拉取cdh镜像dockerpullcloudera/quickstart第二步:启动容器dockerrun--namecdh-d--hostname=quickstart.cloudera--privileged=true-t-i-p8888:8888-p8020:8020-p8022:8022-p7180:7180-p21050:
  • 2023-11-24一、Hadoop概述与初步学习
    一、Hadoop的发展史 Google 爬取全球的网站,然后计算页面的PageRank 要解决网站的问题: a:这些网站怎么存放 b:这些网站应该怎么计算 发布了三篇论文 a:GFS(GoogleFileSystem) b:MapReduce(数据计算方法) c:BigTable-->HBase Dougcutting花费
  • 2023-11-16ClouderaManager中Event Server报java.io.IOException: No sub-file with id .fnm found
    晚上9点30:03.266分 ERROR EventCatcherService ErrorstartingEventServerjava.io.IOException:Nosub-filewithid.fnmfound(fileName=_1f9.cfsfiles:[f474fa52c5c7e5cfdc49"resourcemanager(wyx-cdh-,xp,_log_event,_eventwyx-cdh-hadoop01
  • 2023-11-15概述
    目录1、Hadoop是什么2、Hadoop三大发行版本3、Hadoop优势4、Hadoop组成4.1Hadoop1.x、2.x、3.x区别4.2HDFS概述4.3YARN概述4.4MapReduce1、Hadoop是什么1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2)主要解决,海量数据的存储和海量数据的分析计算问题。3)广
  • 2023-10-08Maven 引用CDH 5.4 的zookeeper时报错:Could not find artifact javax.jms:jms:jar:1.1 in cloudera 的解决办法
    错误:Couldnotfindartifactjavax.jms:jms:jar:1.1incloudera由于默认5.4.0的包引用了zookeeper3.3.1版本,进而引用了log4j的某个版本,导致的报错,改为如下即可: pom:使用cloudera的源:<repositories><repository><id>cloudera</id><u
  • 2023-09-15手动装配Hadoop Cloudera CDH4.2版本
    第1章 概要说明41.1 Hadoop是什么?41.2 为什么选择CDH版本?41.3 集群配置环境41.4 网络结构图5第2章 安装hadoop环境62.1 准备安装包62.2 默认用户组root:root62.3 卸载自带的jdk62.4 安装和配置jdk环境62.5 配置/etc/hosts62.6 配置ssh无密码登陆72.7 处理防火墙72.8