首页 > 其他分享 >BitSail“拍了拍”你,并给你一份快速入门指南

BitSail“拍了拍”你,并给你一份快速入门指南

时间:2022-12-29 14:56:14浏览次数:41  
标签:入门 -- 拍了拍 hive bitsail DEFAULT NULL BitSail

本 Quick Guide 面向 BitSail 新手入门使用人员,从源码编译、产物结构、如何提交作业、实机演示等多方面带领大家迅速入门 BitSail,从 0 到 1 了解并完成 BitSail 基础构建。

BitSail 源码编译

BitSail 在项目中内置了编译脚本 build.sh,存放在项目根目录中。新下载的用户可以直接该脚本进行编译,编译成功后可以在目录:bitsail-dist/target/bitsail-dist-${rversion}-bin 中找到相应的产物。

BitSail 产物结构

 

BitSail 如何提交作业

Flink Session Job

 
第一步:启动Flink Session集群

session运行要求本地环境存在hadoop的依赖,同时需要HADOOP_CLASSPATH的环境变量存在。

bash ./embedded/flink/bin/start-cluster.sh

第二步:提交作业到Flink Session 集群

bash bin/bitsail run \
  --engine flink \
  --execution-mode run \
  --deployment-mode local \
  --conf examples/Fake_Print_Example.json \
  --jm-address <job-manager-address>
 

Yarn Cluster Job

 
第一步:设置HADOOP_HOME环境变量

export HADOOP_HOME=XXX

第二步:设置HADOOP_HOME,使提交客户端就找到yarn集群的配置路径,然后就可以提交作业到Yarn集群

bash ./bin/bitsail run --engine flink \
--conf ~/dts_example/examples/Hive_Print_Example.json \
--execution-mode run \
--deployment-mode yarn-per-job \
--queue default
 

BitSail 实机演示

这部分将为大家实机演示两个重要步骤。第一个演示是将 fake 的数据源写入到 MySQL 的 数据源中,第二个演示是将 MySQL 数据源写入到 Hive 中。

Fake->MySQL

// 创建mysql表
CREATE TABLE `bitsail_fake_source` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) DEFAULT NULL,
  `price` double DEFAULT NULL,
  `image` blob,
  `start_time` datetime DEFAULT NULL,
  `end_time` datetime DEFAULT NULL,
  `order_id` bigint(20) DEFAULT NULL,
  `enabled` tinyint(4) DEFAULT NULL,
  `datetime` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
 

MySQL->Hive

// 创建hive表
CREATE TABLE `bitsail`.`bitsail_mysql_hive`(
  `id` bigint ,
  `name` string ,
  `price` double ,
  `image` binary,
  `start_time` timestamp ,
  `end_time` timestamp,
  `order_id` bigint ,
  `enabled` int,
  `datetime` int
)PARTITIONED BY (`date` string)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
   

BitSail 技术干货往期回顾:

标签:入门,--,拍了拍,hive,bitsail,DEFAULT,NULL,BitSail
From: https://www.cnblogs.com/bytedata/p/17012532.html

相关文章

  • Getting Started with Spring Cloud Stream 入门
    这篇文章是与BenWilcock共同撰写的,他是SpringatPivotal的产品和技术营销经理。......
  • 初学《python编程从入门到实践》web应用程序,出现错误
    一开始是遇到了TemplateDoesNotExist的错误,上百度都是说改settings.py里面的TEMPLATE的DIRS,但我改了还是出现问题,我用的《python编程从入门到实践》这本书的出版时间是20......
  • Linux小白入门经验
    雄关漫道真如铁,而今迈步从头越。我们在单位工作的人都有一个梦想,那就是搞定所有的计算机难题,帮助公司完成更多的电脑维修、软件开发以及系统监测。随着互联网的深入发展,我们......
  • vue入门
    Vue入门SOC:关注度分离原则网页三要素:HTML+CSS+js:视图:给用户看,刷新后台给的数据网络通信:axios页面跳转:Vue-router状态管理:vuexVue-UI:ICEM模型V视图C控制器......
  • 详述I2C总线协议、时序,入门不再是难事
    这是因为这些设备中都有一个“掉电保存”的器件,比如硬盘,U盘等等,他们的特点就是没电了之后,存在他们上面的信息不会丢失,就像人的大脑,有记忆功能。在工业领域也非常常见这种器......
  • xposed安装和使用入门
    因为xposed已经停止更新,高版本的android可以使用他的改良版lsposed,开发环境和xposed一致,首先需要安装magisk+zygisk+lsposed.xposed开发环境导入xposed模块开发......
  • sqoop入门教程
    目录一、Sqoop概述    1、简介    2、Sqoop架构原理    3、Sqoop连接器二、Sqoop安装    1、sqoop下载解压    2、sqoop配置文件 ......
  • MINIGPA103 USBHID评估板入门学习手册基于STM32HAL库
    序由于作者水平有限,文档和视频中难免有出错和讲得不好的地方,欢迎各位读者和观众善意地提出意见和建议,谢谢!第一部分、硬件概述1.1实物概图图1.1Gamepad实物概图如图1......
  • Android基础入门教程
    一、Android介绍Android是一种基于Linux的自由及开放源代码的操作系统,Android分为四个层,从高层到低层分别是应用程序层、应用程序框架层、系统运行库层和Linux内核层。Andr......
  • ant使用指南详细入门教程
    一、概述ant是一个将软件编译、测试、部署等步骤联系在一起加以自动化的一个工具,大多用于Java环境中的软件开发。在实际软件开发中,有很多地方可以用到ant。开发环境:复制代......