首页 > 数据库 >MySQL败给了PostgreSQL!

MySQL败给了PostgreSQL!

时间:2023-06-22 13:22:15浏览次数:53  
标签:PostgreSQL 开发人员 数据库 开源 败给 MySQL 进程

在软件领域,数据库是毫无疑问的中流砥柱。在这片历史悠久、玩家众多的沃土上,流传着着无数技术和商业交织的故事。如今,老一代商业数据库日薄西山,开源数据库步步为营,处在浪潮之巅的我们已然可以看见其中的暗流涌动。在这场群雄逐鹿的戏码里,MySQL与PostgreSQL之争渐趋白热化。MySQL的衰落不再是某个耸人听闻的预言,而正在成为不可避免的现实。

 

 

日前,Stack Overflow面向90000名开发人员进行的一项调查显示,PostgreSQL在数据库引擎的选择上领先于MySQL,这与往年的调查相比有了显著变化。

 

 

其中,45.55%的受访者使用PostgreSQL,而MySQL和SQLite的比例分别为41.09%和30.9%。而就在三年前,同一项调查显示,MySQL和PostgreSQL的使用率分别为55.6%和36.1%,由此可见,使用PostgreSQL的用户群体的增速有多快。

 

 

图源:Stack Overflow

 

 

不过,需要指出的是,由于这是一项开发人员调查,因此并不反映生产中的使用情况。根据DB-Engines的数据库流行度排名,其中Oracle排名第一,其次是MySQL、SQL Server和PostgreSQL。还要注意的是,MySQL或其分支MariaDB通常被非常流行的WordPress内容管理系统使用,占了大量的生产使用。

 

 

尽管如此,不能否认的事实是,越来越多的开发人员倾向于为他们正在开发的应用程序选择PostgreSQL。而且结合DB-Engines上总结的历年来MySQL和PostgreSQL分数的趋势变化来看,PostgreSQL从2014年开始进入高速增长状态,而MySQL自2016年以来开始缓慢下降。

 

 

图源:DB-Engines

 

 

相较于MySQL的日渐式微,PostgreSQL为何能取得高速发展呢?我们可以从其发展履迹中一窥端倪。

 

 

脱胎于Ingres的开源数据库

 

 

PostgreSQL拥有很长的发展史。

 

 

其前身是美国国防部与加州大学伯克利分校合作的一个名为Ingres研究项目。1985年Ingres项目终止,随后开源,Postgre诞生。后来为了强调对SQL的支持,又更名为PostgreSQL,这一名字延用至今。粗略估算一下,不包括Ingres时期的开发,这一项目的开发历史也差不多38年了。

 

 

作为开源数据库的PostgreSQL有其鲜明的特点。

 

 

其一,跨平台属性强,支持几乎所有的操作系统和CPU硬件平台,如AIX,HPUX,Linux,BSD,Windows等。

 

 

其二,社区支持强大。项目由全世界超过1000名贡献者所维护,社区成员来自于全球的商业公司、高校、研究机构。而且PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。目前国内有很多公司基于PostgreSQL数据库开发自己的商业产品。

 

 

另外,PostgreSQL提供了单个完整功能的版本,而不像MySQL那样提供了多个不同的社区版、商业版与企业版。部分粉丝甚至会说PostgreSQL堪与Oracle相媲美,而且没有那么昂贵的价格和傲慢的客服。

 

 

相较于MySQL,PostgreSQL还有一些明显的特点,比如,支持更广泛的高级数据类型,更精细的索引系统,支持用各种语言编写的存储过程,能够满足绝大多数企业级应用的需求。

 

 

MySQL衰退,并不出奇

 

 

PostgreSQL和MySQL同为开源的关系型数据库,两者都经历了几十年的发展,并且已被证明高可靠、安全和可扩展。但是回顾其发展历程,两者又有着显著不同。

 

 

到2023年,PostgreSQL仍然是完全开源和社区驱动的,而MySQL在许可方面有着更复杂的历史。MySQL的开发主体是瑞典MySQLAB公司,最初MySQL是作为公司的商业产品开发的,同时提供免费版和付费版。

 

 

2008年1月,MySQLAB被Sun公司以10亿美元的价格收购。此后不久,Oracle又以74亿美元得价格收购了Sun,这一系列收购事件一度让MySQL数据库前途未卜,也引起了部分开发人员对其开源未来的担忧。后来,包括MariaDB和Percona在内的原始MySQL的几个开源分支帮助缓解了这些问题,但这些动荡依旧为MySQL的发展留下了挥之不去的暗影。

 

 

多年前,PostgreSQL创始人之一的Bruce Momjian在接受对外采访时就曾表示:“MySQL衰退,这并不是一件很令人惊奇的事情。”在他看来,MySQL的衰退可以归因于两点,其一,MySQL目标定位不明晰,其二,MySQL不是一个纯粹的开源数据库。

 

 

Momjian对此解释道:“之所以说MySQL目标定位不明晰,是因为其目标定位是在网络应用的用户层面上,而互联网企业要求的是一个快速反应时间和较小的用户量,但相对大用户来说,MySQL就有点捉襟见肘了,虽然他们非常努力去试图满足大客户的应用,想扩展企业级大客户的应用标准,但因为前期开发的框架不是很明晰,导致不是很成功。”

 

 

在关于开源的纯粹性上,Momjian认为:“MySQL数据库是一个公司的一产品,是一个公司做了绝大部分开发的工作,所以MySQL不是完全意义上的开源数据库,这是个劣势,不能得到绝大多数人的支持,或让社区更多人参与进来。”

 

 

在他看来,与MySQL不同,PostgreSQL一开始就是定位在Oracle这些大数据库能做的事情。所以MySQL势力越来越小,而PostgreSQL却在变大。尽管谁也不知道未来会如何发展,但PostgreSQL的增长是有目共睹的。

 

 

在曲折中探索:多进程还是多线程

 

 

立足当下,回顾过往,PostgreSQL能在开发者调查中超越MySQL,并非一朝一夕之功。至于未来如何,及时了解其最新的发展动向至关重要。

 

 

最近就有一项关于PostgreSQL的重大提案正在发生。

 

 

众所周知,和线程架构的MySQL不同,PostgreSQL数据库为进程架构模型,每一个连接都会启动一个服务进程为该连接服务。

 

 

一个PostgreSQL实例作为一大组协作进程运行,包括一个用于每个连接的客户端的进程。这些进程使用精心设计的库通过多个共享内存区域进行通信,该库允许在并非所有进程都具有映射到相同地址的相同内存的设置中创建复杂的数据结构。长期以来,这个模型都在如此为这个项目服务。

 

 

但PostgreSQL开发团队觉得到了需要改变的时候,要重新考虑是否延用这种面向进程的模型,还是将其迁移到线程模型。

 

 

事实上,多进程的优缺点都很分明。

 

 

好处在于:可以并行地执行多个任务,提高运行效率,数据安全,空间独立,一个进程崩溃也不会影响其他进程;不足在于:进程的创建和销毁过程需要消耗较多的计算机资源,在需要频繁创建和删除较多进程的情况下,资源消耗过多,不适宜使用多进程完成任务。

 

 

6月初,PostgreSQL的核心贡献者之一Heikki Linnakangas跟进了一些相关的讨论。从讨论走向来看,支持和反对的双方都各有其缘由。

 

 

支持方代表Andres Freund提出,开发团队已经遇到了诸多与进程模型相关的限制。比如:

 

 

  • 跨进程上下文切换的开销本来就比同一进程中线程之间的切换要高,合理怀疑这种开销会继续增加;

  • 进程模型增加了开发成本,迫使项目维护大量重复代码,包括在单个地址空间中不需要的几种内存管理机制。

 

 

反对方代表则认为不应该贸然进行这种根本性变革,“这将是一场灾难。有太多的代码会被破坏”。主要理由集中如下:

 

 

  • 安全性会降低,变革成本过大。可能产生“不止一个安全级漏洞”,而且收益无法抵消成本。

  • 可能还有其他工作应该具有更高的优先级。

  • 失去由单独进程提供的隔离,可能会降低系统的整体健壮性。

 

 

网友评论

 

 

不过,总体而言,仍有许多PostgreSQL开发人员还是谨慎地赞成至少探索这一变化。Robert Haas表示 ,PostgreSQL在大型系统上的扩展性不佳,这主要是因为所有这些进程都消耗了资源。“并非所有数据库都有这个问题,如果不进行某种重大的架构更改,PostgreSQL将无法解决这个问题”。在他看来,仅仅切换到线程可能还不够,但他认为,这种探索性的尝试将带来许多其他改进。

 

 

如果再进一步思考,我们会注意到,无论是支持基于进程还是基于线程的模式,可能都不会有终极答案。

 

 

因为线程可能不会在所有用例中都表现得更好,或者一些重要的扩展可能永远不会获得在线程中运行的支持。移除进程支持是一个只有在线程运行良好时才能真正考虑的问题。虽然讨论的结果表明大多数PostgreSQL开发人员认为这种探索式的变化在抽象上是好的,但也明显担心它在实践中如何运作。在不进则退的开源世界,不断迭代更新才能顺应时代变化,但变化的方向从来没有确定的航标,如何在螺旋中上升是开源开发者们需要审慎考虑的永恒命题。

 

 

 

标签:PostgreSQL,开发人员,数据库,开源,败给,MySQL,进程
From: https://www.cnblogs.com/sexintercourse/p/17497676.html

相关文章

  • MYSQL 修改表结构 gh-ost 到底强哪里 作者自己来talk
    PT工具在MYSQL中的使用其实已经好像有“半个世纪了”,其出名的原因主要是因为pt-osc,如果你不知道,那你真的用过MYSQL,其实还有另外两家FB-OST,GH-OST.实际上PT-OSC 虽然使用了这么多年,他也存在一些问题 PT-OSC1有些操作中,会引起高负载的写操作2在原表和新表切换的过程中更名,可......
  • MYSQL8 处理JSON 我不再是豆包,我是干粮
    最近来了一个项目,本身如果用MONGODB有点大材小用,所以为了避免某些表继续使用text字段来处理JSON数据的方式,让技术水平上一个档次,并且公司也不在上MYSQL5.7的新项目,全部是8.018这个版本。继续上一篇文字,那就看看MYSQL8的野心到底是如何展现的。顺便研究完,给开发一个靠谱的方案,......
  • MYSQL SHELL 到底是个什么局 剑指 “大芒果”
    如果在WINDOWS上想链接在LINUX上的MYSQL有什么方法,windows上各种GUI,还是打开MYSQL那个原本黑漆漆的小方格。现在你有了新的选,MYSQLShell全新的连接MYSQL的方式,一个满足各种人群连接MYSQL的方式。从官方上下载后,在WINDOWS上解压后,直接点击执行。双击mysqlsh为什么要有mysqlshel......
  • MYSQL 8 从PS说起,但不止于PS , 不在使用淘汰的慢查询日志,那我怎么查慢查询(6)...
    这是关于MYSQL8获取信息的方式的第六篇,终于到达了慢日志查询的位置,在MYSQL的DBA的管理员的心目中,pt-query-digest和SLOWQUERYLOG是分析慢查询的唯一的方式。实际上在MYSQL8中这样的慢查询的数据获取方式,已经被淘汰了,或者说不合时宜了。主要的原因是获取信息的时效性的问题......
  • POSTGRESQL 短查询优化,独立索引与组合索引 8
    这是一个关于POSTGRESQL查询的优化系列,这已经是这个系列的第八集了,接上期,在OLTP查询中我们需要注意的查询优化的地方非常多,稍不留意就会在一些问题上的操作导致查询的数据逻辑错误。继续上次的问题,在查询中,针对事件的查询问题,我们一般处理的模式 1 针对具体事件字段的时间标注......
  • postgresql SQL 优化 -- 理论与原理
    这里写的是一个系列,关于POSTGRESQLSQL优化的问题,这篇是这个系列的第二篇,第一篇可以在文字的末尾的连接中找到,之前有同学提出,希望有一个历史文字的连接。这期就进入正题,一个SQL语句撰写出来是怎么开始工作的,也就是查询的过程queryprocessing ,这里从几个步骤入手1  一个SQL......
  • Postgresql SQL 优化 两个模型与数据存储
    这里写的是一个系列,这是系列的第三篇,这个系列主要是针对SQL优化,前两篇的地址下文字的最下方。接上次,上次提到了SQL优化的原理与理论,实际上SQL优化的原理是离不开两个模型与数据存储的, 整体SQL优化的核心也在于两个模型和数据存储。简化的说明这两个模型1 数据访问成本模型2 ......
  • MYSQL 从performance_schema说起,但不止于PS (1)
    以下的内容,希望你的环节是在8.011以上的环境中操作,部分需要在8.018以上环境操作MYSQL如果你在使用MYSQL8的版本,那么performanceschema的确的重新认识一下了。在重新认识mysql的performance_schema之前我们有一些需要在强化的知识。分别是threads,instruments,consume......
  • PostgreSQL 从开发要换PG表字段的 collaion 说起 到 程序员别异想天开了
    2021年绝对是一个有意思的念头,估计过10年都会想到今年的一些变革,很多人都会被影响,改变,重新开始,或寻找新的路径。归正题,新公司的开发小朋友,对DB提出了一个问题,就是要修改某个表的字段的collation,究其原因为了某些业务中这个字段的排序。然后我就告诉DB,NONONO,究其原因曾经SQLSE......
  • MYSQL 从performance_schema说起,但不止于PS ,sys 到 information_schema?(4)
    接着上期sys库的内容,sys库的监控的内容基本上可以满足大部分对于性能分析的需求,SYS库中的信息可以分为2种数据展示的方式,和10+种的信息展示类别。我们下面来说一说。基于ORACLE的设计理念,SYS库中的信息分为一X$为开头的VIEW的信息和以普通表名为开头的信息。两者的信息内容是相......