首页 > 数据库 >科技云报道:新趋势下,国产数据库或“春山可望”

科技云报道:新趋势下,国产数据库或“春山可望”

时间:2024-01-30 12:31:52浏览次数:31  
标签:厂商 AI 数据 数据库 行业 国产 可望 春山

科技云报道原创。

从540亿元到1286亿元——这是中国通信标准化协会大数据技术标准推进委员会针对中国数据库行业给出的一份预测报告。

报告指出,未来五年,中国数据库行业将从百亿级市场跨越成为千亿级市场。

最近两年,中国的数据库行业似乎也在迎来一轮新热潮,而这种热潮是伴随着5G、云计算、大数据和AI等多种技术共同出现的。

在企业数字化加速到来的同时,企业对于各类数据分析的需求也被越发放到台前。

种种变革之下,数据库行业是否将迎来新的发展?

科技云报道:新趋势下,国产数据库或“春山可望”_数据

数据库发展出现新趋势

如果将整个软件产业体系比喻成一棵参天大树,数据库则处于其中最核心的基础部分,支撑着大部分的软件生态,进而使整个数字中国各行各业核心业务系统的正常运转。

数据库以其技术门槛之高、研发周期之长、工程要求之高而被誉为“基础软件皇冠上的明珠”。

而在过去很长一段时间里,国内市场几乎被海外数据库厂商所垄断。数据显示,微软、亚马逊、Oracle三家占据全球数据库市场三分之二以上的份额。

数据库更是被列为国家35项“卡脖子”的关键技术之一。

近年来,随着国家对信息安全和自主可控的要求不断提高,国产数据库市场也在逐渐崛起。在这个领域里,国内企业不断加强自主研发能力,推出了一系列具有自主知识产权的数据库产品。

无论是传统数据库厂商、云数据库厂商,还是新兴势力,都在不遗余力地打造各种类型的数据库,各种产品在不同领域都有着广泛的应用。

中国数据库虽然进入了高速发展阶段,但面向更大规模、更复杂应用场景需求,达到好用的技术水平,实现可复制、可推广国产数据库,还面临着大量的技术攻关、产业生态优化、应用协同等方面的难题。

换句话说,大而不强、多而不优的局面还没有发生根本性的改变。

但值得注意的是,新的技术浪潮正在推动中国数据库市场快速变化。在2023年度十大科技名词中,大模型位居榜首,数据要素也名列前三。

首先是火热了一年的大模型。

今年以来,AI Agent和AIGC等技术都是上层应用赛道里的关键词,而底层技术的变革总是要来得相对慢一些。在数据库行业,一个可预见性的趋势是AI+BI+DI。

事实上,这种趋势并非出现在大模型时代,在更早之前它就是数据库行业里的一个畅想。但由于技术不够成熟,导致这种畅想并未实现。

具体而言,在AI、BI与DI三者的结合中,AI的这部分能力由大模型厂商来提供相应的能力;数据库厂商提供的能力则在底层的数据处理分析上。

其中,DI相当于一个接受数据加工请求的平台;BI则是将这些数据分析结果用可视化的方式呈现出来。

只是在大模型时代,AI可以更好地理解用户意图,再基于底层强大的数据计算加工能力,即可实现更加丝滑、低成本的数据分析体验,将底层数据库的加工和分析结果在BI上呈现出来。

实际上,这种模式的落地不仅是站在AI大模型新时代的风口之下,也更是在市场的期盼之下。

正是在AI+BI+DI模式的驱动下,数据库行业将更加重视公有云模式。一方面是考虑到成本因素,另一方面则是数据使用模式的灵活度。

在全球数据库市场中,云数据库的市场份额近两年也得到了大幅提升。不仅如此,近两年的云数据库占比已经超过本地部署的数据库。

大模型时代,在数据库领域,公有云模式将成为一种新的趋势。

其次,在2023年度的科技关键词中,数据要素也将在数据库行业发挥更重要的角色。

在国家数据局发布“数据要素×”三年行动计划中明确提出,推动满足资产确认条件的数据资源,计入资产负债表无形资产或存货,推动数据资产化。

而相关部门发布的规定也将于2024年1月1日正式施行。

随着2024年数据资产的入表,将催化数据库行业走向新的发展高度。

未来,企业会越来越重视数据层面、资产层面的建设。过去粗放式的数据使用模式,在外部更强的监管要求下,也会朝着精细化的模式进行升级。相对应的,数据建设和治理在企业内部会变得更加合理。

更具体地来看,数据资产在企业内部相当于一个“底座”的作用。

在整个数据共享机制的构建中,一个最常见的问题是数据孤岛的存在。由于企业内部为了解决多个问题所构建的多个技术栈,而在不同组件下产生的数据割裂现象。

对此,湖仓一体架构在解决数据割裂问题方面成为新的解决方案。数据湖的能力可以将用户的数据底座统一起来,从而达到数据共享的效果。

而在湖仓一体技术架构基础上,数据也可以以各种格式存在于数据湖里,通过湖仓一体的分析来支撑企业对于数据使用的不同诉求,进而更有质量地构建自身的数据资产。

从各类做湖仓一体的数据库厂商来看,各家技术路线各不同,有些选择自研,有些则基于开源,而有些是自身云平台的产品组合,但最终目的都是为了降低数据在不同平台间的流动。

数据库国产替代在路上

从2000年前后,我国开始陆续出现商业数据库厂商,其主要代表有达梦数据、人大金仓、神舟通用、通用数据等。近年来,国内互联网、通信科技巨头阿里、腾讯、华为等公司也纷纷加速布局数据库产业,借助云计算优势进行相关数据库服务的研发。

目前中国数据库市场总体规模在全球数据库市场占比较低,但数据库厂商数量显著多于全球其他国家和地区。根据中金企信统计数据,2022年6月,中国数据库厂商已超过200家。

大量中国数据库厂商的出现,为挑战传统数据库巨头带来了更多可能。

在Gartner 2023年数据库魔力象限报告中,阿里云的PolarDB成为唯一进入领导者象限的中国数据库。

同时,被荣誉提及的十家数据库厂商中,也有四家来自中国,分别是:OceanBase、PingCAP、华为云、腾讯云。

但也需清醒地认识到,目前国产数据库发展还比较缓慢,从实际应用来看,仅在党政军领域应用较多,而在其他领域应用较少。

据智研咨询发布的《中国数据库行业市场调研分析及发展规模预测报告》数据显示,截止2022年我国数据库规模国产化率达21.3%。

换句话说,国产数据库想要实现真正的领先,还有很长的路要走。

首先,从数据库的发展可以看到,这一行业需要长时间的技术积累,例如Oracle从1978年开始至今已有40多年的历史,才发展成如今的规模。

其次,做数据库一定要有一个完整生态,例如自从x86替换小型机,DB2的市场份额逐渐下降以及软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应用,在此生态下才有Oracle、MySQL发展壮大的机会。

不过,近年来国家积极推动国产数据库的发展,监管部门陆续发布多个文件,明确提出“提高新技术应用和自主可控能力”“加大数据中心基础设施弹性供给”等要求。

尤其在2022年9月底,国务院国资委下发了重要的《国资发79号文件》,文件中明确指出,自2023年1月起,每季度末向国资委报送信创系统替换进度。

最终要求2027年底前,实现所有中央企业的信息化系统安全可靠的信创替代。

一系列的政策出台都在推动着国产数据库从应用到生态的全面建设。同时,国内数据库行业在各种新趋势和新技术的加持下,也将进一步加速行业发展和规范。

积于跬步,方能行至千里。中国数据库还要经历漫长打磨的过程,在新一轮科技革命的大潮中,这条漫漫长路显然才刚刚开始。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

标签:厂商,AI,数据,数据库,行业,国产,可望,春山
From: https://blog.51cto.com/u_16125291/9482594

相关文章

  • 从数据库更新模型时出现System.ArgumentException
    尝试从数据库进行更新时,遇到类型未system.argumentexception的异常 来自热心网友的提醒:初看这个问题的时候以为有相同的表、主键啊之类的冲突排除了很久后检查了一下EntitySetMapping发现存在相同的节点呢删除了就ok了检查了一下EntitySetMapping发现存在相同的节......
  • 分库分表已成为过去式,使用分布式数据库才是未来
    转载至我的博客https://www.infrastack.cn,公众号:架构成长指南当我们使用Mysql数据库到达一定量级以后,性能就会逐步下降,而解决此类问题,常用的手段就是引入数据库中间件进行分库分表处理,比如使用Mycat、ShadingShpere、tddl,但是这种都是过去式了,现在使用分布式数据库可以避免......
  • 【数据库】对大数据量数据集,PostgreSQL分组统计数量,使用 row_number() over
    在处理大数据量数据集时,我们经常需要进行分组统计。而在PostgreSQL中,我们可以使用row_number()函数结合over(partitionby)子句来实现这个功能。同时,通过设置row_num<=100的条件,我们可以限定每组最多数量为100。本文将详细介绍如何使用这种方法进行分组统计。一、row_......
  • 【数据库】对大数据量数据集,PostgreSQL分组统计数量,使用 row_number() over
    在处理大数据量数据集时,我们经常需要进行分组统计。而在PostgreSQL中,我们可以使用row_number()函数结合over(partitionby)子句来实现这个功能。同时,通过设置row_num<=100的条件,我们可以限定每组最多数量为100。本文将详细介绍如何使用这种方法进行分组统计。一、row......
  • python自定义装饰器,实现轮询监控数据库,并且根据字段内容变更打印相应日志或结束循环
    使用方法可以写个whileTrue的循环监控数据,再分别定义每个状态要做什么事情注意:循环中不要写breake不要return,换成yield,把函数作为一个生成器,由装饰器控制循环代码示例importfunctoolsimporttimefromutils.log_settingimportloggerfromconfigimportsetti......
  • sqlalchemy模块——python的ORM数据库
    介绍ORM数据库,简单理解就是把数据库的表抽象成一个个类,对数据库进行增删改查的时候可以直接通过库中的属性进行访问,即用python抽象数据库,通过sqlalchemy自动转换成数据库sql语句执行,可以更专注于代码的实现,可以配合sqlacodegen直接映射已有的数据库表,实际操作的时候需要借助其他......
  • shelve模块——python内置关系型数据库
    介绍python内置的关系型数据库,key-value的方式进行存储,使用的时候可以像字典一样调用,一般数据需要持久化的时候会用到此数据库,比如测试环境的一些基本不会更改的配置信息,可以使用shelve库存储,后续调用的时候不必每次都从接口拉取使用导入importshelve写入#writeback参数......
  • 专栏:数据库、中间件的监控一网打尽
    前言对于数据库、中间件的监控,目前社区里最为完善的就是Prometheus生态的各个Exporter,不过这些Exporter比较分散,不好管理,如果有很多目标实例需要监控,就要部署很多个Exporter,要是能有一个大一统的Exporter,具备所有这些Exporter的能力就好了。还真有,而且还不止一个,一个是 G......
  • MySQL数据库小结
    【一】登陆mysql-uroot-p123456【二】服务启动和停止【1】Windows(1)方式一计算机右击管理服务【右击计算机管理---中间服务与应用程序---双击服务---下面点击标准---即可查看每个软件是否启动服务的状态(可以直接输入要查询的软件名称,再回车键即可)。】(2)管理员身份(cmd)......
  • 【补充】数据库的三大范式
    【面试题】数据库的三大范式参考博客:数据库的范式设计【什么是范式】范式就是我们在设置数据库的表时,一些共同需要遵守的规范掌握这些设计时的范式,可以让我们在项目之初,设计库的表结构更加合理和优雅【三大范式之间的关系】三大范式之间,是逐级递进的关系,也就是说后......