首页 > 其他分享 >亚信安慧AntDB数据并行加载工具的实现(二)

亚信安慧AntDB数据并行加载工具的实现(二)

时间:2024-01-02 12:04:22浏览次数:35  
标签:文件 并行 亚信 AntDB 分片 工具 安慧 加载


3.功能性说明

本节对并行加载工具的部分支持的功能进行简要说明。

1) 支持表类型

并行加载工具支持普通表、分区表。

2) 支持指定导入字段

文件中并不是必须包含表中所有的字段,用户可以指定导入某些字段,但是指定的字段数要和文件中的字段数保持一致。

3) 支持导入部分记录

并行加载工具支持指定Where条件,只将符合条件的记录导入到数据库中。

4) 自动生成序列字段值

本工具支持自动生成序列字段值,有些表的字段设置了Default值为序列,用户可能需要数据库自己生成,并没有包含在文件中。

当该字段为非分片键时,我们可以使用数据库自有的功能,在插入时自动生成该字段值。但是当该字段为分片键时,我们需要先在加载工具中生成该值,然后根据该值进行分片,插入到对应的DN节点。

5) 无分片键文件导入

当文件中不包含分片键,并且没有Default值时,加载工具将该字段置为Null计算并插入相应节点。

6) 触发器

当导入的表包含触发器时,并行加载工具并不会做特殊的处理,当触发器涉及非本数据节点时,并行加载工具并不支持。例如一个表的触发器,该触发器会插入另外一张表,但是该表分片与原表不同,此时将会涉及多个数据节点。

7) 不支持辅助表

AntDB有辅助表功能,用来优化SQL语句的性能,该表中存放数据表的相应数据。当数据表有辅助表时,并行加载工具只能将文件导入到数据表,并不会修改相应的辅助表。

8) 支持编码转换

并行加载工具支持数据编码转换,在文件中数据和数据库的编码不同时,工具会对文件中数据编码的转换之后再插入数据库。

4.性能

并行加载工具相比Copy命令,有效提升了数据加载的效率。由于表字段的个数、类型及数据的不同,并行加载工具相对Copy命令所提升的倍率并不完全相同。下面以TPCC的数据导入进行性能的对比。

1000仓的数据,需要导入到表Bmsql_Stock的记录有1亿条,数据文件Stock.csv文件的大小为29GB。测试的AntDB集群有2个DN主节点。在此场景的测试中,加载效率提升了7倍左右,加载速度对比图如下所示:

亚信安慧AntDB数据并行加载工具的实现(二)_数据库

图5 加载速率对比

Bmsql_Stock表结构如下:

亚信安慧AntDB数据并行加载工具的实现(二)_oracle_02

图6 测试表的表结构

5. 总结

本文介绍了AntDB并行加载工具的实现方式和使用方法,通过多线程的方式实现并行处理文件数据,并加载到AntDB数据库,有效提升了加载的效率。

标签:文件,并行,亚信,AntDB,分片,工具,安慧,加载
From: https://blog.51cto.com/u_15348398/9066923

相关文章

  • 亚信安慧AntDB数据库引领数字时代通信创新
    在数字经济与实体经济深度融合的时代,通信行业正迎来前所未有的新机遇。特别是在中国信通院的预测中,2027年5G专网市场规模预计将达到802亿元,呈现出显著的增长态势,年复合增长率高达42%。亚信安慧AntDB数据库一直致力于紧跟科技发展趋势,着眼于未来,不断进行技术创新和产品研发。在5G专......
  • 亚信安慧AntDB数据库两项目分别入选2023“星河”标杆、优秀案例
    近日,由中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSATC601)共同组织的第七届大数据“星河(Galaxy)”案例评选结果公示,亚信安慧AntDB数据库两项目入选,其中“基于AntDB的CRM系统全域数据库替换项目”获评标杆案例,“中国广电5G核心业务支撑系统数据库建设方案”......
  • 亚信安慧AntDB数据库高可用解决方案助力西南某省高速清分结算系统成功升级
    AntDB数据库技术总监北陌近期分享了一项引人注目的成功案例,该案例涉及西南某省高速领域,利用AntDB数据库作为基础架构成功升级了清分结算系统。这一系统升级对比传统架构,呈现出显著的性能提升,其中包括15%的性能改进、90%的业务处理速度提高、40倍以上的负载增加以及30倍以上的数据分......
  • 亚信安慧AntDB数据库——通信运营商核心系统的全面演进
    AntDB数据库源自通信运营商核心系统,经过15年的平稳运行和不断演进,成功跟随通信技术的升级步伐,逐步迈向5G时代,并且在这期间完成了8次大版本的迭代,为行业树立了技术领先的典范。其独特之处在于具备超融合架构,这一架构不仅支持结构化数据,还能有效管理非结构化数据,从而降低了系统维护的......
  • 亚信安慧AntDB数据库引领行业数字化转型
    自2019年6月起,中国广电成功获得5G牌照,凭借700MHz频谱资源,迅速展开5G网络建设,成功跻身第四大运营商行列。通过与中国移动的战略合作,已部署基站数量超过400万座,形成了强大的网络覆盖体系。亚信科技作为数智化全栈能力领先提供商,在广电5G业务发展中扮演了关键角色,全面负责BSS(业务支撑......
  • AntDB数据库新携手:六大优势引领企业数智化转型风潮
    AntDB数据库与用友U8C携手共创辉煌,联合推出U8C+AntDB联合产品,为企业提供全方位解决方案,充分展现出六大优势,助力企业迎接新的发展时代。图:U8cloud+AntDB联合产品优势首先,该联合产品在助力企业新发展方面发挥着关键作用。通过整合AntDB数据库的先进技术和U8C的云ERP解决方案,企业可......
  • 亚信安慧AntDB数据库:引领向量数据库标准化,助力大数据技术创新
    近日,中国通信标准化协会大数据技术标准推进委员会携手中国信通院,以在线形式召开了《向量数据库技术要求》研讨会,这一举措旨在推动向量数据库技术的标准化发展。此次研讨会吸引了来自50多家企业的70多位专家参与,共同探讨并达成对标准框架的共识。其中,AntDB数据库的专家也受邀参与,为......
  • 亚信安慧AntDB数据库:引领数据库标准与性能规范,推动行业创新
    近日,全国信息技术标准化技术委员会数据库标准工作组在一场重要的研讨会上召开,旨在交流并总结2023年上半年数据库标准编制情况。我国自主研发的AntDB数据库,作为国内最早的国产数据库产品之一,受邀参与了此次标准的研讨,为推动我国数据库领域的标准体系建设和性能测试规范制定贡献了积......
  • 亚信安慧AntDB数据库携手U8C共创未来
    AntDB数据库生态负责人在近期举行的商业创新大会上引领着数字化时代的浪潮,推出了令业界瞩目的U8C+AntDB联合产品。这一创新性的合作将AntDB数据库与U8C云ERP产品紧密结合,为成长型企业提供了一套全栈、安全可靠的保障,为企业的数智化转型升级开启了崭新的篇章。图:AntDB数据库生态负责......
  • 解锁数据库运维秘籍:掌握AntDB-T动态共享内存,提升进程间通信效率
    动态共享内存是AntDB数据库通信的重要手段,本文主要阐述AntDB-T数据库动态共享内存的实现原理、实现方式与使用方法。AntDB-T数据库是一款企业级通用分布式关系型数据库,其数据库内核是基于进程模型实现的,因此进程间通信(IPC)是实现分布式架构间进行任务协作和数据共享的关键。实现进......