首页 > 其他分享 >DataArts Studio实践丨通过Rest Client 接口读取RESTful接口数据的能力

DataArts Studio实践丨通过Rest Client 接口读取RESTful接口数据的能力

时间:2023-07-21 15:06:10浏览次数:37  
标签:INFO 12 20 07 Rest Client 接口 2023 GMT

本文分享自华为云社区《DataArts Studio 通过Rest Client 接口读取RESTful接口数据的能力,通过Hive-SQL存储》,作者: 张浩奇 。

Rest Client 提供了读取RESTful接口数据的能力。Rest Client从RESTful地址中获取数据,转换为数据集成支持的数据类型,然后传递给下游的hive-sql节点存储。本文POST接口典型场景为例,为您示例如何使用Rest Client,从RESTful地址中读取数据并同步到hive表中。

本文指导从RESTful地址中读取数据并同步到MRS-Hive表中。大致方案,DataArtStudio 管理配置采集任务,通过CDM服务进行代理下发和第三方API服务器进行对接,响应消息通过节点间参数传递给MSR-Hive-SQL解析入库,

集成流程如下:

DataArts Studio实践丨通过Rest Client 接口读取RESTful接口数据的能力_SQL

方案开发流程如下:

步骤1:DataArtsStudio 创建Rest Client任务

数据开发模块,创建Rest Client节点,输入GET/POST参数,包括认证方式,头域、请求参数/消息体

DataArts Studio实践丨通过Rest Client 接口读取RESTful接口数据的能力_hive_02

其中请求消息体中json可以使用EL表达式,比如携带时间过滤参数

JSON Body体

{

"startTime":"#{DateUtil.format(DateUtil.addDays(Job.planTime,-1),"yyyy-MM-dd")}",

"endTime":"#{DateUtil.format(DateUtil.now(),"yyyy-MM-dd")}"

}

系统转换后参数如下:

{

"startTime":"2023-07-11",

"endTime":"2023-07-12"

}

EL表达式的详细参考如下:

https://support.huaweicloud.com/usermanual-dataartsstudio/dataartsstudio_01_0494.html

响应消息的JSON中返回的消息如下数组格式:

Response body:

{"data":

[

{

"id":99467,

"proportionProjectId":"0405",

"proportionProjectName":"外勤津贴",

"proportionAfterTax":40800,

"proportionDepartmentId":289,

"proportionDepartmentName":"总所税务部",

"voucherStatusTime":1600758794000,

"billsNumber":"2020092299467"

},

{

"id":102000,

"proportionProjectId":"040102",

"proportionProjectName":"040102 _ 职能部门员工年薪",

"proportionAfterTax":20000,

"proportionDepartmentId":296,

"proportionDepartmentName":"总所创客部",

"voucherStatusTime":1606209149000,

"billsNumber":"2020112402000"

}

]

}

步骤2:MSR-Hive创建表

CREATE TABLE IF NOT EXISTS mrs_hive_rest

(

`billsNumber` STRING

,`proportionDepartmentId` BIGINT

,`voucherStatusTime` BIGINT

,`proportionProjectId` STRING

,`proportionAfterTax` BIGINT

,`id` BIGINT

,`proportionProjectName` BIGINT

,`proportionDepartmentName` STRING

);

步骤3:DataArtsStudio 创建hive-sql脚本用于存储POST接口的响应消息

数据开发模块创建hive-sql脚本,例如:

-- HIVE sql

-- ******************************************************************** --

-- author: zhanghaoqi

-- create time: 2023/07/12 15:50:41 GMT+08:00

-- ******************************************************************** --

SELECT * FROM mrs_hive_rest;

INSERT INTO mrs_hive_rest SELECT json_tuple(json, 'billsNumber', 'proportionDepartmentId', 'voucherStatusTime', 'proportionProjectId', 'proportionAfterTax', 'id', 'proportionProjectName', 'proportionDepartmentName') FROM (

SELECT explode(split(regexp_replace(regexp_replace('${jsonStr}', '\\[|\\]',''),'\\}\\,\\{','\\}\\;\\{'),'\\;'))

as json) t;

SELECT * FROM mrs_hive_rest;

SQL脚本关键点说明,在脚本中引用**${jsonStr}** 作为响应的消息的JSON字符串进行解析(在步骤4中定义改参数内容)

由于响应消息是JSON数组,使用了内置的json和字符串方法进行解析。

步骤4:DataArtsStudio 创建hive-sql节点执行脚本

创建hive-sql节点,执行步骤3脚本

DataArts Studio实践丨通过Rest Client 接口读取RESTful接口数据的能力_hive_03

参数关键点:脚本参数会自动提取SQL脚本中引用的参数,此处需要配置参数的内容,参数使用EL表达式获取前一个Rest_Client节点的返回值 #{JSONUtil.toString(JSONUtil.path(Job.getNodeOutput("Rest_Client_1729"),"data"))} 其中Rest_Client_1729为前一个节点的任务名,data为前一个节点的数据路径。

步骤5:配置完成后执行测试运行验证脚本

配置完成后,测试运行脚本,通过查看日志确认内容是否符合预期,SQL入库是否成功。

[2023/07/12 20:13:24 GMT+0800] [INFO] Connect to server successfully

[2023/07/12 20:13:24 GMT+0800] [INFO] Executing SQL:SELECT * FROM mrs_hive_rest;

[2023/07/12 20:13:24 GMT+0800] [INFO] Execute SQL successfully

[2023/07/12 20:13:24 GMT+0800] [INFO] Reading SQL execution result

[2023/07/12 20:13:24 GMT+0800] [INFO] The first 0 rows:

[2023/07/12 20:13:24 GMT+0800] [INFO] Read SQL execution result successfully

[2023/07/12 20:13:24 GMT+0800] [INFO]

[2023/07/12 20:13:24 GMT+0800] [INFO] Executing SQL:INSERT INTO mrs_hive_rest SELECT json_tuple(json, ‘billsNumber’, ‘proportionDepartmentId’, ‘voucherStatusTime’, ‘proportionProjectId’, ‘proportionAfterTax’, ‘id’, ‘proportionProjectName’, ‘proportionDepartmentName’) FROM (

SELECT explode(split(regexp_replace(regexp_replace(’[{“billsNumber”:“2020092299467”,“proportionDepartmentId”:289,“voucherStatusTime”:1600758794000,“proportionProjectId”:“0405”,“proportionAfterTax”:40800,“id”:99467,“proportionProjectName”:“外勤津贴”,“proportionDepartmentName”:“总所税务部”},{“billsNumber”:“2020112402000”,“proportionDepartmentId”:296,“voucherStatusTime”:1606209149000,“proportionProjectId”:“040102”,“proportionAfterTax”:20000,“id”:102000,“proportionProjectName”:“040102 _ 职能部门员工年薪”,“proportionDepartmentName”:“总所创客部”}]’, ‘\[|\]’,’’),’\}\,\{’,’\}\;\{’),’\;’))

as json) t;

[2023/07/12 20:13:38 GMT+0800] [INFO] Execute SQL successfully

[2023/07/12 20:13:38 GMT+0800] [INFO] Reading SQL execution result

[2023/07/12 20:13:38 GMT+0800] [INFO] Read SQL execution result successfully

[2023/07/12 20:13:38 GMT+0800] [INFO]

[2023/07/12 20:13:38 GMT+0800] [INFO] Executing SQL:SELECT * FROM mrs_hive_rest;

[2023/07/12 20:13:38 GMT+0800] [INFO] Execute SQL successfully

[2023/07/12 20:13:38 GMT+0800] [INFO] Reading SQL execution result

[2023/07/12 20:13:38 GMT+0800] [INFO] The first 2 rows:

2020092299467,289,1600758794000,0405,40800,99467,null,总所税务部

2020112402000,296,1606209149000,040102,20000,102000,null,总所创客部

[2023/07/12 20:13:38 GMT+0800] [INFO] Read SQL execution result successfully

[2023/07/12 20:13:38 GMT+0800] [INFO]

确认脚本执行成功,入库成功。

【云咖问答】第2期 华为云大咖架构师坐阵,与你共话应用创新,提问互动赢开发者定制礼品~https://bbs.huaweicloud.com/forum/thread-0234124103999807029-1-1.html

点击关注,第一时间了解华为云新鲜技术~


标签:INFO,12,20,07,Rest,Client,接口,2023,GMT
From: https://blog.51cto.com/u_15214399/6800476

相关文章

  • mysqlclient 版本
    MySQLclient版本MySQLclient是一个用于Python与MySQL数据库进行交互的模块。它提供了一组用于连接、查询和管理MySQL数据库的函数和方法。在这篇科普文章中,我们将介绍MySQLclient的版本信息以及如何在Python中使用它。MySQLclient版本信息MySQLclient的版本信息可......
  • 以程序员为视角,关于商品详情API接口的说明
    ​商品详情API接口是现代电商平台中非常重要的一部分,它提供了获取淘宝商品详细信息的能力。作为一个程序员,了解如何调用这个API接口是非常关键的。首先,我们需要明确的是,API接口是应用程序与服务器之间进行通信和数据交换的一种方式。在调用商品详情API接口之前,我们需要先获得相......
  • 个人微信API接口,WeChat机器人
    本篇文章主要讨论微信机器人的开发经验。微信机器人的功能需求很简单,业务代码贼好撸,但是如何和微信交互呢,如何取到微信数据调用相关聊天接口呢,具体分为以下几种技术类型:1.微信Web接口17年后微信都不支持了,不过还是有一些牛×的star都是过Wstar的项目,可惜荒废了。2.手机Xposed......
  • 高效 API 接口对接淘宝天猫 1688 拼多多京东商品详情数据(H5 端,PC 端)
    api接口详解大全?优秀的设计是产品变得卓越的原因设计API意味着提供有效的接口,可以帮助API使用者更好地了解、使用和集成,同时帮助人们有效地维护它每个产品都需要使用手册,API也不例外在API领域,可以将设计视为服务器和客户端之间的协议进行建模API协议可以帮助内部和外部......
  • 批量新增接口正确传参以及优化(含数组传参)
    需求页面: 接口文档说明: 单个新增计划传参: 批量新增计划传参:批量新增7月24日和8月1日的复制计划 接口优化:由于当前医生给指定的患者新增计划时,当前医生和患者都不会发生变化,批量新增时仅是新增多个计划时间,所以计划时间可以调整为数组进行传参接口文档优化: 单个计......
  • 个微API接口 个人微信机器人
     简要描述:下载消息中的文件请求URL:http://域名地址/getMsgFile请求方式:POST请求头Headers:Content-Type:application/jsonAuthorization:login接口返回参数:参数名必选类型说明wId是string登录实例标识 包含此参数所有参数都是从消息回调中取)msgId......
  • 多语言高并发接入阿里巴巴电商平台,获取实时商品详情数据源码,API接口技术开发分享
    接口数据展示alibaba.item_get-获得商品详情公共参数请求地址:注册key和secret接入请私信名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]cacheString......
  • 多语言高并发接入阿里巴巴电商平台,获取实时商品详情数据源码,API接口技术开发分享
    接口数据展示alibaba.item_get-获得商品详情公共参数请求地址:注册key和secret接入名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中)secretString是调用密钥api_nameString是API接口名称(包括在请求地址中)[item_search,item_get,item_sear......
  • 【JDK新特性】一篇搞懂Lambda表达式 & 函数式接口
    概述Lambda是JDK8的语法糖。它可以对某些匿名内部类的写法进行简化,它是函数式编程的一个重要体现。让我们不用关注什么是对象,重点关注我们对数据做了什么操作,可以说它Lambda表达式就是一个对象Lambda表达式在C++、C#、Python、Scala等一些语言中也支持,Java支持的还算比较晚的(确实好......
  • 学城项目支付接口前期准备
    1.安装支付宝模块pipinstallpython-alipay-sdk--upgrade#他是基于官方的api封装的2.在项目的libs文件夹下创建包3.配置私钥和公钥生成密钥教程网址:https://opendocs.alipay.com/common/02kipl生成密钥软件下载:https://opendocs.alipay.com/common/02kipk软件下载完......