数据集成提供简单易用的迁移能力和多种数据源到数据仓库的集成能力,降低了客户数据迁移和集成的复杂性,有效地提高数据迁移和集成的效率。
支持的同步类型
同步类型 | 来源数据源类型 | 目标数据源类型 |
---|---|---|
离线同步 | MySQL | Hive |
离线同步 | Oracle | Hive |
离线同步 | SQL Server | Hive |
离线同步 | Greenplum | Hive |
离线同步 | Doris | Hive |
离线同步 | Hive | MySQL |
离线同步 | Hive | Hive |
离线同步 | Hive | Doris |
离线同步 | TeleDB | MySQL |
离线同步 | TeleDB | Hive |
离线同步 | TelePG | Hive |
离线同步 | FTP | Hive |
实时同步 | MySQL | Doris |
实时同步 | MySQL | Hudi |
实时同步 | MySQL | Iceberg |
实时同步 | PostgreSQL | Doris |
实时同步 | PostgreSQL | Hudi |
实时同步 | PostgreSQL | Iceberg |
实时同步 | TeleDB | Doris |
实时同步 | TeleDB | Hudi |
实时同步 | TeleDB | Iceberg |
实时同步 | TelePG | Doris |
实时同步 | TelePG | Hudi |
实时同步 | TelePG | Iceberg |
新增资源组
- 获取翼MR集群的配置文件。
- 登录翼MR控制台,进入用户管理,若用户管理为空,则需要先进行IAM同步,保证用户管理中有当前天翼云账号对应的用户。
- 进入到翼MR Manager以后,点击菜单租户与资源 > LDAP租户管理 > 租户与资源概述。点击“+新增”,新增租户并设置该租户在hdfs组中。
- 点击菜单租户与资源 > Kerberos安全凭证 > 租户与资源概述,点击“+新增”新增Principal,下载Keytab文件。
- 点击菜单运维与配置 > 配置管理-配置管理概述,选择HDFS和YARN集群,下载yarn-site.xml、core-site.xml、hdfs-site.xm、krb5.conf和keytab文件,共5个配置文件。
- 登录DataWings,选择全部产品 > 数据集成 > 集成集群管理 > 资源组,点击“新增资源组”按钮。
- 填写基本信息,信息填写完毕后点击“确认”按钮即可创建资源组。
基本信息 | 说明 |
---|---|
资源名称 | 必填项,输入资源名称。 |
资源类型 | 必填项,选择资源类型,支持Hadoop On Yarn。 |
Hadoop配置文件 | 必填项,上传Hadoop 配置文件,包含core-site.xml,hdfs-site.xml,yarn-site.xml。 |
Kerberos账号 | 必填项,输入Kerberos账号,需包含工作空间写入读取权限。 |
keytab配置文件 | 必填项,上传Keytab配置文件,包含krb5.conf,keytab。 |
工作空间 | 必填项,输入HDFS工作空间地址,用于上传数据集成服务运行同步任务的相关jar包和配置文件。输入格式为hdfs://ctyunns/xxx。 |
查看资源组
注册资源组后,您可以查看现有资源组的详情信息。
-
选择注册好的资源组。
-
点击列表右侧“详情”按钮。
编辑资源组
注册资源组后,您可以编辑现有资源组的基本信息。为了保证同步任务的正常运行,请填写正确的资源组信息和配置文件。
- 选择注册好的资源组。
- 点击列表右侧“编辑”按钮。
删除资源组
当该资源组下没有关联的集群时,您可以删除不再需要的资源组。
- 选择需要删除的资源组卡片。
- 点击列表右侧“删除”按钮。
标签:同步,配置文件,DataWings,离线,实时,点击,数据管理,概述,资源 From: https://blog.csdn.net/lish1988/article/details/144287846