hudi-0.12 编译与集成

时间：2023-09-09 19:24:17浏览次数：48

标签：5.3 hudi jar 编译 install 0.12 spark

环境 hadoop：2.7.2 hive：2.3.1 spark：2.4.4 flink：1.13.0

1.下载hudi源码包

Index of /dist/hudi/0.12.0 (apache.org) hudi-0.12.0.src.tgz

tar -zxf hudi-0.12.0.src.tgz -C /hadoop/app/

2.安装maven

tar -zxf apache-maven-3.6.1.tar.gz

配置settings

<mirror>
<id>aliyunmaven</id>
<mirrorOf>*</mirrorOf>
<name>阿里云公共仓库</name>
<url>https://maven.aliyun.com/repository/public</url>
</mirror>

配置maven环境变量

vim /etc/profile

export MVN_HOME=/hadoop/app/apache-maven-3.6.1

export PATH=$PATH:$JAVA_HOME:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$MYSQL_HOME/bin:$HIVE_HOME/bin:$FLINK_HOME/bin:$ES_HOME/bin:$MVN_HOME/bin

3.在hudi安装目录下执行编译命令

cd /hadoop/app/hudi-0.12.0

mvn clean package -DskipTests -Dspark2.4 -Dflink1.13 -Dscala-2.11 -Dhadoop.version=2.7.2 -Pflink-bundle-shade-hive2

当出现参数异常时，直接修改对应的java文件即可

手动添加kafka依赖注：需要的jar包可以在

http://packages.confluent.io/archive/5.3/confluent-5.3.4-2.12.zip 下载

上传到Linux服务器/hadoop/app/soft/hudi_needs_jar

cd hadoop/app/soft/hudi_needs_jar

mvn install:install-file -DgroupId=io.confluent -DartifactId=common-config -Dversion=5.3.4 -Dpackaging=jar -Dfile=./common-config-5.3.4.jar
mvn install:install-file -DgroupId=io.confluent -DartifactId=common-utils -Dversion=5.3.4 -Dpackaging=jar -Dfile=./common-utils-5.3.4.jar
mvn install:install-file -DgroupId=io.confluent -DartifactId=kafka-avro-serializer -Dversion=5.3.4 -Dpackaging=jar -Dfile=./kafka-avro-serializer-5.3.4.jar
mvn install:install-file -DgroupId=io.confluent -DartifactId=kafka-schema-registry-client -Dversion=5.3.4 -Dpackaging=jar -Dfile=./kafka-schema-registry-client-5.3.4.jar

其中编译期间还需要pentaho-aggdesigner-algorithm-5.1.5-jhyde.jar

可以在我的百度网盘下载

链接：https://pan.baidu.com/s/1V_sZzVePTexfq4A8wI3OMQ
提取码：66sw
下载后在jar包路径下执行命令

cd hadoop/app/soft/hudi_needs_jar

mvn install:install-file -DgroupId=org.pentaho -DartifactId=pentaho-aggdesigner-algorithm -Dversion=5.1.5-jhyde -Dpackaging=jar -Dfile=./pentaho-aggdesigner-algorithm-5.1.5-jhyde.jar

4.与spark集成

将/hadoop/app/hudi-0.12.0/packaging/hudi-spark-bundle/target/hudi-spark2.4-bundle_2.11-0.12.0.jar 复制到spark 的jars目录下

cp /hadoop/app/hudi-0.12.0/packaging/hudi-spark-bundle/target/hudi-spark2.4-bundle_2.11-0.12.0.jar /hadoop/app/spark-2.4.4-bin-hadoop2.7/jars/

spark-shell --master local --jars hudi-spark2.4-bundle_2.11-0.12.0.jar --packages org.apache.spark:spark-avro_2.11:2.4.4 --conf 'spark.serializer=org.apache.spark.serializer.KryoSerializer' --conf 'spark.serializer=org.apache.spark.serializer.KryoSerializer'

后期参考Spark2.4-cdh6.2.1集成hudi0.10初探 - Shydow - 博客园 (cnblogs.com) 测试集成环境。

标签：5.3,hudi,jar,编译,install,0.12,spark
From： https://www.cnblogs.com/hxy0001/p/17690007.html

cmake基础示例：如何编译【跨平台】的动态库和应用程序
示例代码首先看一下测试代码的全貌：mylib：只有一个源文件，编译输出一个动态库;myapp：也只有一个源文件，链接mylib动态库，编译输出一个可执行程序; mylib在mylib目录中，一共有3个文件：mylib.h,mylib.c以及CMakeLists.txt，内容分别如下：//mylib/mylib.hw文件#ifndef_M......
ebpf-使用内核编译开发一个程序（ubuntu20.04）
前不久正好工作中使用到了这个方面的知识，这里写一下我的总结我对ebpf的理解ebpf(extendedBerkeleyPacketFilter)是一种虚拟机，通常我们使用的vmware是一种大型的虚拟机，vmware里面可以模拟cpu、显卡、网卡、硬盘等硬件，而ebpf这种的虚拟机是只模拟栈的小型的虚拟机，jvm也是一种栈......
编译程序和解释程序
......
C-条件编译、头文件
一、条件编译根据条件（表达式的值或者特定的宏的值）决定让代码是否参与最终的编译查看预处理的结果：gcc-Ecode.c 把预处理的结果显示到终端gcc-Ecode.c-ocode.i把预处理的结果存储到.i预处理文件1、常见的条件编译指令指令#if如果条件为真，则执行相应的操作......
rdkafka编译
1、下载源码rakafka源码https://github.com/confluentinc/librdkafka 2、安装openssl，可以参考https://www.cnblogs.com/ho966/p/15916018.html3、如果要支持gssapi,需要依赖cyrus-sasl和krb53.1安装krb5下载源码https://kerberos.org/dist/krb5/1.20/krb5-1.2......
安防教育直播项目应用中RTSPSever组件libEasyRTSPServer编译arm版本报undefined refer
大家知道我们团队编译过很多产品的ARM版本，对用户来说，多一种编译方式也是多一种选择，所以我们一直在拓宽TSINGSEE青犀视频全线产品的运用范围。近期TSINGSEE青犀视频研发团队编译了libEasyRTSPServer的ARM版本，在此过程中，我们遇到了编译错误undefinedreferenceto`uselocale’。libE......
MacOs环境反编译微信小程序
条件：mac版微信版本大于3.8.0的（无需解*密，下面直接反编译）使用node版本的wxappUnpacker解*密工具（https://github.com/geilige/wxappUnpacker）步骤：打开微信小程序，点点点点点点（尽量点全）默认存放小程序的路径/Users/用户名/Library（资源库）/Containers/com.tencent.xinWeChat（微信）/Data/.wxap......
gcc 常见编译参数
-c只激活预处理,编译,和汇编-S只激活预处理和编译-E只激活预处理-C在预处理的时候,不删除注释信息-g只是编译器，产生调试信息。-o制定目标名称-w不生成任何警告信息。-M生成文件关联的信息。......
Apktool编译时报error: No resource identifier found for attribute XXX in package
问题描述使用apktool编译android源码时，报W:XXX.xml:X:error:Noresourceidentifierfoundforattribute'iconTint'inpackage'android'错误。解决方案这是由于API版本较低。处理方法：找到相应文件，把对应的属性删除掉，再重新编译。......
qt程序调用cuda-11.7，cmake编译时，提示："CMakeCUDACompilerId.cu" failed. Compiler:
报错显示：Running/home/wc/software/cmake-3.26.3-linux-x86_64/bin/cmake/home/wc/work/junke_src/missile-sim'-GCodeBlocks-UnixMakefiles'in/home/wc/work/junke_src/build/debug.CMakeErrorat/home/wc/software/cmake-3.26.3-linux-x86_64/share/cmak......

hudi-0.12 编译与集成

相关文章

赞助商

阅读排行