首页 > 数据库 > 启动flink sql 任务

启动flink sql 任务

时间:2023-05-10 17:36:58浏览次数:49  
标签:hudi 启动 app flink yarn session sql

README.md

# how to use
# 使用说明


## 确认是否初始化完成, 当前yarn-session管理所有 《用户属性任务》
## 任务名称为: bus_user_info_flinkjob 

path=`pwd`
00. 确认是否已经存在yarn session
`shell

  yarn app -list |grep app_log_2_hudi_flinkJob  

`
1. 若未运行yarn session 应该执行以下命令, 运行yarnsession 创建Application-Name 
/opt/flink/bin/yarn-session.sh -jm 10G  -tm 10G  -nm app_log_2_hudi_flinkJob -qu  realtime  -d
2. 记录当前yarn session , 启动任务时要使用
yarn application --list  get 创建的Application-Name :app_log_2_hudi_flinkJob  的 jobid 

`shell

 jobid=`yarn app -list |grep bus_user_info_flinkjob |awk -F ' ' '{print $1}'`
 sed -i "s/applicationID=.*/applicationID=${jobid}/g" /tmp/.yarn-properties-hdfs

` 


3. 完成后可以执行任务, 每个任务可以单独提交, 每个任务说明流向及数据源信息(特征)

`shell 
 # 任务1.--数据实时入hudi 通过kafka收集数据,运行该程序, 可以将用明细数据, 按天进行分区,存储到 hudi 数据湖中。
/opt/flink/bin/sql-client.sh  -f /data/flinkJob/flinksql/app_log/01_kafka2hudi_all.sql  --session  $jobid
 # 任务2.-- 登录数据实时统计 入clickhouse   通过kafka收集数据,运行该程序, 可以将用户明细数据, 按天进行分区,存储到 clickhouse 中。
/opt/flink/bin/sql-client.sh  -f /data/flinkJob/flinksql/app_log/01_kafka2clickhouse.sql  --session  $jobid
`

标签:hudi,启动,app,flink,yarn,session,sql
From: https://www.cnblogs.com/whiteY/p/17388604.html

相关文章

  • SQL语句性能优化
    1,对查询进行优化,应尽量避免全表扫描,首先应考虑在where及orderby涉及的列上建立索引。 2,应尽量避免在where子句中对字段进行null值判断,创建表时NULL是默认值,但大多数时候应该使用NOTNULL,或者使用一个特殊的值,如0,-1作为默认值。 3,应尽量避免在where子句中使用!=......
  • mysql语句性能优化(一)
    1、对查询进行优化,应尽量避免全表扫描,首先应考虑在where及orderby涉及的列上建立索引2、应尽量避免在where子句中对字段进行null值判断,创建表时NULL是默认值,但大多数时候应该使用NOTNULL,或者使用一个特殊的值,如0,-1作为默认值3、应尽量避免在where子句中使用!=或<>......
  • mysql常用命令
    mysqlAccessdeniedforuserroot@localhost错误解决方法总结,安装后修改密码Mysql初始化root密码和允许远程访问 mysql命令:基本文本的,显示和使用的mysql数据库。前面已经简单的提过用法;比如登录等。mysqladmin命令,用来创建和维护mysql数据库的命令,......
  • MySQL 锁实践
    测试环境为MySQL5.7 隔离级别:REPEATABLE-READ自动提交:autocommitOFF创建测试表:CREATETABLE`t1`(`id`int(11)DEFAULTNULL,`name`varchar(10)DEFAULTNULL)ENGINE=InnoDBDEFAULTCHARSET=latin1insertintot1(id,name)values(1,"mirror");insertintot1......
  • MSSqlServer 出错 9003 错误
      MSSqlServer出错9003错误传递给数据库'PerDB'中的日志扫描操作的日志扫描号(227783:55280:433)无效。此错误可能指示数据损坏,或者日志文件(.ldf)与数据文件(.mdf)不匹配。如果此错误是在复制期间出现的,请重新创建发布。否则,如果该问题导致启动期间出错,请从备份还原......
  • MySQL的随机排序(random orderby)
    MySQL的随机排序(randomorderby)是指在查询数据库时,将结果集以随机的方式排列。这种排序方式可以用于有趣的应用场景,例如实现随机音乐播放、广告推荐等。要实现MySQL的随机排序,可以使用RAND()函数。RAND()函数可以生成0-1之间的随机数,将它作为排序的依据即可。SELECT*FROM`my......
  • SQL注入攻击 CVE-2022-32991
    春秋云镜靶场 注册并登录: 三个按钮随便选一个都有eid参数,抓包获取到useragent和cookie。 使用sqlmap进行爆库:python3sqlmap.py-u"http://eci-2ze9ucov849lkjtij17c.cloudeci1.ichunqiu.com/welcome.php?q=quiz&step=2&eid=60377db362694&n=1&t=34"-p"eid"--us......
  • 用sql语句实现sqlserver不同库间表相互同步
    同步表的方式有很多种因为不想太过于麻烦所以就用存储过程来实现某些表同步createproccopytbaleas--表名declare@namenvarchar(50)--创建表declare@createtablenvarchar(200)--删除表declare@deletetablenvarchar(200)--定义游标declaretabnameCURSORF......
  • .bat 判断并启动一个系统服务
    @echooffREM定义服务名称变量setSERVICE_NAME=RemoteClientREM检查服务状态scquery%SERVICE_NAME%|findstrRUNNING>nulif%errorlevel%equ0(echo%SERVICE_NAME%isalreadyrunning.)else(REM启动服务netstart%SERVICE_NAME%......
  • elementui plus - 下载组件库vue包,本地启动
    1.背景这个地址https://element-plus.gitee.io/zh-CN/经常打不开所以,可以去git仓库获取工程源码【虽然已经打包过的】2.解决仓库地址https://gitee.com/element-plus/doc-archive.git克隆到本地后,找到index文件夹,启动临时工程 3.效果 ......