首页 > 数据库 >DTCC | 2021中国图数据库技术大会链接分享

DTCC | 2021中国图数据库技术大会链接分享

时间:2022-11-28 16:04:36浏览次数:75  
标签:架构 DTCC 数据库 2021 数据 模型 数据模型 分布式


DTCC | 2021中国图数据库技术大会链接分享

  • ​​DTCC | 2021中国图数据库技术大会链接分享​​
  • ​​一、新一代分布式架构​​
  • ​​二、数据流通与数据交易​​
  • ​​三、业务模型和数据模型​​
  • ​​四、知识图谱数据生产​​
  • ​​五、图数据研究中心实战案例​​
  • ​​六、推荐链接​​


Here’s the table of contents:

DTCC | 2021中国图数据库技术大会链接分享

    在本届​​DTCC​​大会,Neo4j公司技术专家将分享Neo4j是如何在特性和架构上既满足功能和性能要求、同时提供最佳的可扩展性。对图数据技术感兴趣的小伙伴可以在下方链接了解详情。另外本文中分享一些,自己对于图数据技术粗浅的理解和经验。

一、新一代分布式架构

    对图数据库是否适合传统分布式架构还是​​Fabric架构​​​?​​Fabric思想​​​是比传统分布式架构​​更高维​​​的分布式架构设计,新一代分布式架构适应性、扩展性更强,同时该架构可以兼容传统的集中式架构和分布式架构【架构上的降维打击】。​​容量​​​与​​性能​​?Fabric架构可以完全继承集中式和分布式存储引擎的优点,实现不同存储引擎的连接【但是对数据模型一致性有更高的要求,运维复杂性也会更高】。

二、数据流通与数据交易

    数据​​流通​​​与数据​​交易​​​场景下,借助Fabric架构可以实现数据的快速集成和流转。使用业务模型和数据模型的自动翻译技术,实现模型层面的流通、建立信任和激励机制,可以加速​​数据标准​​的真正落地。

三、业务模型和数据模型

    ​​业务模型​​​和​​数据模型​​​?​​业务建模相关资料​​​;​​数据模型相关资料​​​。业务模型是前台业务人员可以快速理解和使用的模型,传统的数据工程中数据工程师需要懂业务才可以精确地将业务模型​​翻译​​为数据模型,而且这个过程完全是人工处理。真实的数据工程场景下,数据模型和业务模型不是一一对应的关系而是更加抽象的建模,因此业务人员直接使用底层数据是非常难懂地,通常需要借助一些贴合业务的系统来可视化获取、处理、理解数据。

四、知识图谱数据生产

    目前企业建立的知识图谱大部分都是垂直领域的知识图谱。结合Fabric架构的数据平台引入区块链等技术建立数据信任机制、激励机制,可以加速全域数据的集成、在理论上可以实现一套​​全域知识图谱​​数据构建的平台技术。

五、图数据研究中心实战案例

    在实际生产中,我们使用图平台解决的问题是智能投研分析中面临的数据获取效率、数据关联等问题。综合考虑性能、成本、稳定性、扩展性、社区成熟度等因素,我们使用基于Neo4j的开源衍生图数据库​​ONgDB​​​搭建图平台,通过二次开发和插件工具的集成。已经基本满足​​深度学习模型训练​​​调用数据和​​智能搜索​​​的需求。通过半自动化生产工具​​olab-etl​​​实现图数据的持续高效生产;通过​​联邦查询技术​​​实现MySQL、Oracle、SQL server、Elasticsearch、MongoDB、Neo4j、ONgDB等本平台外部存储引擎的快速集成,集成后的数据可以使用Cypher标准化接口查询,同时实现了外部存储引擎数据的​​虚拟图化翻译​​​(所有的存储引擎走一样的Query接口标准,初步实现了图平台上​​One Query标准​​)。

    展示一个样例工作台图片(基于ONgDB二次开发的工作台和其它基础图数据工具做为基础支撑),图数据工程师在该工作台使用标准的Cypher Query接口可以实现图数据库、传统数据仓库、搜索引擎等其它存储引擎数据的获取,即不用切换出该平台即可获取其它地方的数据(返回结果可以是列表、虚拟图等多种格式);分析型查询可以一键调用,可以提升数据处理和分析的效率。

DTCC | 2021中国图数据库技术大会链接分享_信任链

标签:架构,DTCC,数据库,2021,数据,模型,数据模型,分布式
From: https://blog.51cto.com/u_13618048/5891687

相关文章

  • 人工智能与图数据库技术
    图数据库技术在人工智能应用中的核心能力决策类算法提供上下文支持增强算法学习效率提高算法准确性通过AI得到的结论更加具有可解释性完整翻译​​原文地址​​以下文章为N......
  • Oracle数据库性能模型
    如何为一个数据库建立性能模型作为一名DBA来说,我们面临的一个巨大挑战是:如何保证数据库的性能可以满足快速变化的应用的需求,如何在数据量和访问量持续增长的情况下,保证应用......
  • apollo配置中心从数据库中查询所有的配置及项目
    apollo配置中心从数据库中查询所有的配置及项目需求背景:如果需要从Apollo查询某个配置项做批量的更新替换,如果一个一个找不合适且容易遗漏,需要从底层数据库表中模糊查询来......
  • postgresql 数据库 INSERT 或 UPDATE 大量数据时速度慢的原因分析
    前言最近这段时间一直使用pg数据库插入更新大量的数据,发现pg数据库有时候插入数据非常慢,这里我对此问题作出分析,找到一部分原因,和解决办法。一死元祖过多提起pg数据库......
  • 拥抱开源还是坚守阵地:传统数据库供应商面临抉择
    开源软件正在引爆整个数据库产业,对于几十年前就在这个行业摸爬滚打的软件供应商来说,他们的商业模式面临着日益加剧的威胁,努力维持现状还是搭载开源的顺风......
  • Net6 CodeFirst注入MySQL数据库上下文
    十年河东,十年河西,莫欺少年穷学无止境,精益求精 2022太难了,好多公司倒闭,互联网不景气,工作难找,苏州的C#/Net程序员的招聘更是少之又少,java,C,等其他语言也是供大于求,总之,难上......
  • PostgreSQL数据库所有的等待事件
    WaitEventTypeWaitEventNameDescriptionLWLockShmemIndexLockWaitingtofindorallocatespaceinsharedmemory.OidGenLockWaitingtoallocateoras......
  • 使用SQL Server Management Studio 2008 将数据库里的数据导成脚本
    之前很羡慕MySQL有这样的工具可以把数据库里的数据导成脚本,SQLServer2005的时候大牛PinalDave写了个​​DatabasePublishingWizard​​​,具体用法参考他写的文章​​......
  • 部署主从数据库
    Mysql主从配置:   大型网站为了软解大量的并发访问,除了在网站实现分布式负载均衡,远远不够。到了数据业务层、数据访问层,如果还是传统的数据结构,或者只是单单靠一台服务......
  • 时序数据库 influxdb 教程
    十年河东,十年河西,莫欺少年穷学无止境,精益求精时序数据库influxdb适用于物联网、等大数据行业,支持亿级数据中文参考文档​​https://jasper-zhang1.gitbooks.io/influxdb/c......