首页 > 其他分享 >大数据管理平台 DataWings-数据集成概述

大数据管理平台 DataWings-数据集成概述

时间:2024-12-08 11:27:42浏览次数:8  
标签:同步 配置文件 DataWings 离线 实时 点击 数据管理 概述 资源

数据集成提供简单易用的迁移能力和多种数据源到数据仓库的集成能力,降低了客户数据迁移和集成的复杂性,有效地提高数据迁移和集成的效率。

支持的同步类型

同步类型来源数据源类型目标数据源类型
离线同步MySQLHive
离线同步OracleHive
离线同步SQL ServerHive
离线同步GreenplumHive
离线同步DorisHive
离线同步HiveMySQL
离线同步HiveHive
离线同步HiveDoris
离线同步TeleDBMySQL
离线同步TeleDBHive
离线同步TelePGHive
离线同步FTPHive
实时同步MySQLDoris
实时同步MySQLHudi
实时同步MySQLIceberg
实时同步PostgreSQLDoris
实时同步PostgreSQLHudi
实时同步PostgreSQLIceberg
实时同步TeleDBDoris
实时同步TeleDBHudi
实时同步TeleDBIceberg
实时同步TelePGDoris
实时同步TelePGHudi
实时同步TelePGIceberg

新增资源组

  1. 获取翼MR集群的配置文件。
  • 登录翼MR控制台,进入用户管理,若用户管理为空,则需要先进行IAM同步,保证用户管理中有当前天翼云账号对应的用户。
  • 进入到翼MR Manager以后,点击菜单租户与资源 > LDAP租户管理 > 租户与资源概述。点击“+新增”,新增租户并设置该租户在hdfs组中。
  • 点击菜单租户与资源 > Kerberos安全凭证 > 租户与资源概述,点击“+新增”新增Principal,下载Keytab文件。
  • 点击菜单运维与配置 > 配置管理-配置管理概述,选择HDFS和YARN集群,下载yarn-site.xml、core-site.xml、hdfs-site.xm、krb5.conf和keytab文件,共5个配置文件。
  1. 登录DataWings,选择全部产品 > 数据集成 > 集成集群管理 > 资源组,点击“新增资源组”按钮。
  1. 填写基本信息,信息填写完毕后点击“确认”按钮即可创建资源组。
基本信息说明
资源名称必填项,输入资源名称。
资源类型必填项,选择资源类型,支持Hadoop On Yarn。
Hadoop配置文件必填项,上传Hadoop 配置文件,包含core-site.xml,hdfs-site.xml,yarn-site.xml。
Kerberos账号必填项,输入Kerberos账号,需包含工作空间写入读取权限。
keytab配置文件必填项,上传Keytab配置文件,包含krb5.conf,keytab。
工作空间必填项,输入HDFS工作空间地址,用于上传数据集成服务运行同步任务的相关jar包和配置文件。输入格式为hdfs://ctyunns/xxx。

查看资源组

注册资源组后,您可以查看现有资源组的详情信息。

  1. 选择注册好的资源组。

  2. 点击列表右侧“详情”按钮。

编辑资源组

注册资源组后,您可以编辑现有资源组的基本信息。为了保证同步任务的正常运行,请填写正确的资源组信息和配置文件。

  1. 选择注册好的资源组。
  2. 点击列表右侧“编辑”按钮。

删除资源组

当该资源组下没有关联的集群时,您可以删除不再需要的资源组。

  1. 选择需要删除的资源组卡片。
  2. 点击列表右侧“删除”按钮。

 

标签:同步,配置文件,DataWings,离线,实时,点击,数据管理,概述,资源
From: https://blog.csdn.net/lish1988/article/details/144287846

相关文章

  • Bluetooth LE AUDIO架构概述
    背景BluetoothLEAUDIO是蓝牙5.2版本引入,LEAUDIO的引入不仅仅只是在功耗和延迟方面相对于经典蓝牙音频有改善,最大的创新在于应用场景的拓展,尤其是LE广播音频Auracast的引入,丰富了蓝牙Audio的应用场景,下面列举广播音频几个典型的应用场景:场景描述公共场所广播LEAudio广......
  • 【计算机毕业设计】基于Springboot青少年体质健康数据管理与分析系统+LW+ppt
    博主介绍:✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视......
  • 数据库与数据库管理系统概述
    title:数据库与数据库管理系统概述date:2024/12/7updated:2024/12/7author:cmdragonexcerpt:在信息化迅速发展的时代,数据已成为企业和组织的重要资产。数据库与数据库管理系统(DBMS)是高效存储、管理和利用数据的核心工具。本文首先定义了数据库的基本概念和特点,随后介......
  • 机器学习概述详解
    文章目录机器学习概述详解一、引言二、机器学习基础1、机器学习定义及应用场景2、监督学习与无监督学习三、机器学习开发流程四、使用示例1、LeNet网络结构代码示例2、AlexNet网络结构代码示例五、总结机器学习概述详解一、引言机器学习作为人工智能的一个重要分......
  • HCIP-25 IPv6概述
    目录IPv6概述IPv4现状全球IPv6发展现状WhyIPv6?IPv6优势IPv6过渡技术简介IPv6路由协议简介IPv6地址介绍IPv6地址概述IPv6地址地址空间IPv6地址格式IPv6地址结构IPv6地址前缀IPv6地址接口标识IPv6地址类型IPv6地址类型IPv6常见单播地址-GUAIPv6常见单播地址-ULAIPv6常见单播......
  • SpringSecurity - [01] 概述
    SpringSecurity是一个灵活且强大的工具,可以帮助你构建安全可靠的Spring应用程序。它不仅简化了认证和授权的过程,而且还提供了丰富的特性和扩展点,使得开发者可以根据项目的独特需求定制安全策略。无论是小型的内部工具还是大型的企业级应用,SpringSecurity都能提供必要的安全保......
  • 05.数组概述
    Java内存堆​ 存放所有new出来的对象和数组​ 可以被所有的线程共享,不会存放别的对象引用栈​ 存放基本变量类型(会包含这个基本类型的具体数值)​ 引用对象的变量(会存放这个引用在堆里面的具体地址)方法区​ 可以被所有的线程共享​ 包含了所有的class和static变量数......
  • 方法概述
    方法概述​ 方法(method)是程序中最小的执行单元​ 开发中重复的代码,具有独立功能的代码可以抽取到方法中​ 提高代码的复用性,提高代码可维护性注意:方法必须先创建才可以使用,该过程成为方法定义方法创建后并不是直接可以运行的,需要手动使用后,才执行,该过程成为方法调用​ ......
  • HPC环境下仿真数据管理:数据安全与合规性指南!
    仿真数据在众多行业中有着广泛的应用场景,如何进行仿真数据管理,是企业需要解决的问题。以下是一些应用场景:1.航空航天飞行模拟与训练:利用仿真数据模拟真实的飞行环境和条件,进行飞行员的飞行训练,提高飞行技能和应对紧急情况的能力。航天器设计与测试:通过仿真数据模拟航天器的运行......
  • 鸿蒙开发-ArkTS 中实现关系数据管理功能
    在ArkTS中使用SQLite数据库来实现简单关系数据功能的具体代码示例,模拟了一个“学生-课程”的多对多关系场景,即一个学生可以选修多门课程,一门课程也可以被多个学生选修。导入必要的模块import{SQLiteDatabase}from'@arkts/sqlite';初始化数据库letdb:SQL......