热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PostgreSQL和MySQL技术全面剖析

本文介绍MySQL和PostgreSQL的一些特性对比,让大家了解二者的优

本文介绍MySQL和PostgreSQL的一些特性对比,让大家了解二者的优劣,更好的做出选择。当前国内的现状,互联网公司使用MySQL的较多,PostgreSQL的使用比例反而不高,但相信看到PG的新特性后,你会爱上她。当然MySQL作为最流行的数据库,依然会吸引大部分人的眼球。


PostgreSQL标榜自己是世界上最先进的开源数据库,甚至PG粉丝或者一些PGER宣称,她可以和Oracle相媲美(虽然PG很强大,但是和Oracle还是有差距的,当然PG优势也是显而易见的),而且没有那么昂贵的价格和傲慢的客服。


当然PG功能完善和强大是最早始于9版本,在10版本快速发展,增加很多功能和特性。PostgreSQL是完全由社区驱动的开源项目,他的核心代码,都是由社区维护,商用版本都是基于PG做的二次开发。


MySQL 声称自己是最流行的开源数据。看现在国内的现状,称得上名副其实。MySQL被卖几次后,最终落到Oracle公司的囊中。正是因此,MySQL之父Monty,修改了MySQL的源代码,创立了MariaDB分支。


说到这里当然不得不提另一个重要的分支,Percana公司的Percona Server。Percona公司更擅长MySQL运维,开发了很多非常实用运维工具,而且都已经开源,并回馈给社区,像XtraBackup和pt-Toolkits工具。


简单对比MySQL和PostgreSQL发现,MySQL背后是成熟的商业公司(Oracle有自己的MySQL企业版,收费,有许多社区版没有的特性),而PostgreSQL背后是一个庞大的志愿开发组,相比而言,PostgreSQL的商业性质更少一些,他没有所谓的PostgreSQL企业版,但是存在基于PG开发的一些企业级的PG数据库。


下面我将从以下几个方面阐述MySQL和PostgreSQL的异同和优劣,由于笔者水平的限制,不当之处,还请大家多提意见。


一、开源方面


PostgreSQL: The world’s most advanced open source database。


开源协议:PostgreSQL基于自由的BSD/MIT许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。


PG的开源协议特别灵活,任何公司的和个人都可以把PG作为一个产品销售,而不需要像MySQL那样必须修改大部分代码才可以作为公司的产品。


MySQL:World’s Most Popular Open Source Database。


开源协议:核心代码基于GPL或Commercial License。


MySQL的开源协议是基于GPL协议,任何公司都可以免费使用,不允许修改后和衍生的代码做为闭源的商业软件发布和销售,MySQL的版权在甲骨文手中,甲骨文可以推了其商业闭源版本。


如上图所示,开源软件协议


二、ACID支持方面


PostgreSQL支持事务的强一致性,事务保证性好,完全支持ACID特性。


MySQL只有innodb引擎支持事务,事务一致性保证上可根据实际需求调整,为了最大限度的保护数据,MySQL可配置双一模式,对ACID的支持上比PG稍弱弱。


三、SQL标准的支持方面


PostgreSQL几乎支持所有的SQL标准,支持类型相当丰富。MySQL只支持部分SQL标准,相比于PG支持类型稍弱。


四、复制


MySQL的复制是基于binlog的逻辑异步复制,无法实现同步复制。


复制模式:


  • 一主一备。

  • 一主多备。

  • 级联复制。

  • 循环复制。

  • 主主复制。


数据流转优势:通过canal增量数据的订阅和消费,可以同步数据到kafka,通过kafka做数据流转。


MySQL所有的高可用方案都是基于binlog做的同步,以及基于MySQL的分布式数据也是基于MySQL的binlog实现,binlog是MySQL生态圈最基本技术实现。


PostgreSQL可以做到同步,异步,半同步复制,以及基于日志逻辑复制,可以实现表级别的订阅和发布。


复制模式:


  • 一主一备。

  • 一主多备。

  • 级联复制。

  • 热备库/流复制。

  • 逻辑复制。


数据流转优势:通过逻辑复制实现消息的订阅和消费,可以同步数据到kafka,通过kafka实现数据流转。


五、并发控制


PostgreSQL通过其MVCC实现有效地解决了并发问题,从而实现了非常高的并发性。


PG新老数据一起存放的基于XID的MVCC机制,新老数据一起存放,需要定时触 发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能力下降。而且VACUUM清理不及时,还可能会引发数据膨胀。


当然PostgreSQL还有一点影响比较,为了保证事务的强一致性,未决事务会影响所有表VACUUM清理,导致表膨胀。


MySQL仅在InnoDB中支持MVCC。innodb的基于回滚段实现的MVCC机制,但是MySQL的间隙锁影响较大,锁定数据较多。


六、性能


1、PostgreSQL


1)PostgreSQL广泛用于读写速度高和数据一致性高的大型系统。此外,它还支持各种性能优化,当然这些优化仅在商业解决方案中可用,例如地理空间数据支持,没有读锁定的并发性等等。

2)PostgreSQL性能最适用于需要执行复杂查询的系统。

3)PostgreSQL在OLTP/ OLAP系统中表现良好,读写速度以及大数据分析方面表现良好,基于PG的GP数据库,在数据仓库领域表现良好。

4)PostgreSQL也适用于商业智能应用程序,但更适合需要快速读/写速度的数据仓库和数据分析应用程序。


2、MySQL


1)MySQL是广泛选择的基于Web的项目,需要数据库只是为了简单的数据事务。但是,当遇到重负载或尝试完成复杂查询时,MySQL通常会表现不佳。

2)MySQL的读取速度,在OLTP系统中表现良好。

3)MySQL + InnoDB为OLTP场景提供了非常好的读/写速度。总体而言,MySQL在高并发场景下表现良好。

4)MySQL是可靠的,并且与商业智能应用程序配合良好,因为商业智能应用程序通常读取很多。


七、高可用技术的实现


1、PostgreSQL


1)基于流复制的异步、同步主从。

2)基于流复制的–keepalive。

3)基于流复制的 –repmgr。

4)基于流复制的 –patroni+etcd。

5)共享存储HA(corosync+pacemaker)。

6)Postgres-XC。

7)Postgres-XL。

8)中间件实现:pgpool、pgcluster、slony、plploxy。


2、MySQL


1)主从复制。

2)主主复。

3)MHA。

4)LVS+KEEPALIVE。

5)MGR分布式数据库,多点写入[不建议],基于paxos协议。

6)PXC分布式数据库,多点写入[不建议],基于令牌环协议。

7)INNODB CLUSTER[8.0新技术,基于MGR实现,上层封装命令],基于paxos协议。

8)中间件实现:mycat。


八、外部数据源


PostgreSQL FDW –[foreign-data wrapper的一个简称,可以叫外部封装。


PostgreSQL不支持多数据引擎。但支持Extension组件扩充,以及通过名为FDW的技术将Oracle、Hadoop、MongoDB、SQLServer、Excel、CSV文件等作为外部表进行读写操作,因此,可以为大数据与关系型数据库提供良好对接。


MySQL:无。


九、数据存储和数据类型


PG主表采用堆表存放,存放的数据量较大,数据访问方式类似于Oracle的堆表。


MySQL采用索引组织表,MySQL必须有主键索引,所有的数据访问都是通过主键实现,二级索引访问时,需要扫描两遍索引(主键和二级索引)。


十、PostgreSQL与MySQL优劣对比


1、PostgreSQL相对于MySQL的优势


1)在SQL的标准实现上要比MySQL完善,而且功能实现比较严谨。 

2)存储过程的功能支持要比MySQL好,具备本地缓存执行计划的能力。

3)对表连接支持较完整,优化器的功能较完整,支持的索引类型很多,复杂查询能力较强。

4)PG主表采用堆表存放,MySQL采用索引组织表,能够支持比MySQL更大的数据量。 

5)PG的主备复制属于物理复制,相对于MySQL基于binlog的逻辑复制,数据的一致性更加可靠,复制性能更高,对主机性能的影响也更小。

6)MySQL的存储引擎插件化机制,存在锁机制复杂影响并发的问题,而PG不存在。 

7)PG对可以实现外部数据源查询,数据源的支持类型丰富。 

8)PG原生的逻辑复制可以实现表级别的订阅发布,可以实现数据通过kafka流转,而不需要其他的组件。 

9)PG支持三种表连接方式,嵌套循环,哈希连接,排序合并,而MySQL只支持嵌套循环。 

10)PostgreSQL源代码写的很清晰,易读性比MySQL强太多了。 

11)PostgreSQL通过PostGIS扩展支持地理空间数据。地理空间数据有专用的类型和功能,可直接在数据库级别使用,使开发人员更容易进行分析和编码。 

12)可扩展型系统,有丰富可扩展组件,作为contribute发布。 

13)PostgreSQL支持JSON和其他NoSQL功能,如本机XML支持和使用HSTORE的键值对。它还支持索引JSON数据以加快访问速度,特别是10版本JSONB更是强大。 

14)PostgreSQL完全免费,而且是BSD协议,如果你把PostgreSQL改一改,然后再拿去卖钱,也没有人管你,这一点很重要,这表明了PostgreSQL数据库不会被其它公司控制。相反,MySQL现在主要是被Oracle公司控制。


2、MySQL相对于PG的优势


1)innodb的基于回滚段实现的MVCC机制,相对PG新老数据一起存放的基于XID的MVCC机制,是占优的。新老数据一起存放,需要定时触 发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能力下降。而且VACUUM清理不及时,还可能会引发数据膨胀。

2)MySQL采用索引组织表,这种存储方式非常适合基于主键匹配的查询、删改操作,但是对表结构设计存在约束。

3)MySQL的优化器较简单,系统表、运算符、数据类型的实现都很精简,非常适合简单的查询操作。

4)MySQL相对于PG在国内的流行度更高,PG在国内显得就有些落寞了。

5)MySQL的存储引擎插件化机制,使得它的应用场景更加广泛,比如除了innodb适合事务处理场景外,myisam适合静态数据的查询场景。


总结


总体上来说,开源数据库都不是很完善,商业数据库oracle在架构和功能方面都还是完善很多的。从应用场景来说,PG更加适合严格的企业应用场景(比如金融、电信、ERP、CRM),但不仅仅限制于此,PostgreSQL的json,jsonb,hstore等数据格式,特别适用于一些大数据格式的分析;而MySQL更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如google、facebook、alibaba),当然现在MySQL的在innodb引擎的大力发展,功能表现良好。


MySQL和PostgreSQL复杂的开源关系型数据库,本文只是作者根据自己经验写的对PG和MySQL的理解,难免有不当之处,不当之处还请大家多多指正。


MySQL在国内的发展已然很成熟,但是如果你转向PostgreSQL,会发现不一样的天地,学院派的风格,丰富的功能,肯定会给你带来不一样的惊喜。






推荐阅读
  • MySQL数据库锁机制及其应用(数据库锁的概念)
    本文介绍了MySQL数据库锁机制及其应用。数据库锁是计算机协调多个进程或线程并发访问某一资源的机制,在数据库中,数据是一种供许多用户共享的资源,如何保证数据并发访问的一致性和有效性是数据库必须解决的问题。MySQL的锁机制相对简单,不同的存储引擎支持不同的锁机制,主要包括表级锁、行级锁和页面锁。本文详细介绍了MySQL表级锁的锁模式和特点,以及行级锁和页面锁的特点和应用场景。同时还讨论了锁冲突对数据库并发访问性能的影响。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 你知道Kafka和Redis的各自优缺点吗?一文带你优化选择,不走弯路 ... [详细]
  • 马蜂窝数据总监分享:从数仓到数据中台,大数据演进技术选型最优解
    大家好,今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • MySQL中的MVVC多版本并发控制机制的应用及实现
    本文介绍了MySQL中MVCC的应用及实现机制。MVCC是一种提高并发性能的技术,通过对事务内读取的内存进行处理,避免写操作堵塞读操作的并发问题。与其他数据库系统的MVCC实现机制不尽相同,MySQL的MVCC是在undolog中实现的。通过undolog可以找回数据的历史版本,提供给用户读取或在回滚时覆盖数据页上的数据。MySQL的大多数事务型存储引擎都实现了MVCC,但各自的实现机制有所不同。 ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • 2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)
    本文分享作者在2021年面试网易、腾讯、CVTE和字节等大型互联网企业的经历和问题,包括稳定性设计、数据库优化、分布式锁的设计等内容。同时提供了大厂最新面试真题笔记,并附带答案解析。 ... [详细]
  • Nginxgaodaima.comnginx属于七层架构,支持的是http协议,本身对tcp协议没有支持。所以不能代理mysql等实现负载均衡。但是lvs这个东西不熟悉,主要是公司 ... [详细]
  • 讨伐Java多线程与高并发——MQ篇
    本文是学习Java多线程与高并发知识时做的笔记。这部分内容比较多,按照内容分为5个部分:多线程基础篇JUC篇同步容器和并发容器篇线程池篇MQ篇本篇 ... [详细]
  • 2019我的金三银四
    先讲一下自己的情况吧,二本学生,17年毕业,目前在一家跨境电商从事Java技术开发工作(不是阿里,没那么厉害),技术栈目前偏向于容器云、持续集成持续交付这一块,也就是SpringBoot、Kuber ... [详细]
  • 前言最近一段时间在整公司项目里一个功能的优化,用到了多线程处理。期间也是踩了不少的坑,在这里想说下我遇到的问题和注意事项。以及怎样知道启动的那些多线程都 ... [详细]
  • 高可用架构_MySQL高可用架构设计
    文章来自于https:www.jianshu.compd3107bda2963PHP进阶学习交流QQ群:983229225Mysql复制功能介绍Mysql的复制功能提 ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有