当前位置: 开发笔记 > 运维 > 正文

漫谈PostgreSQL的日志实现机制

作者：豆腐心_suile | 来源：互联网 | 2018-07-05 13:59

当所有已标记的ldquo;脏数据rdquo;写入磁盘之后，在日志中插入一条checkpoint日志，表示checkpoint已经完成，同时它还记录着ch

1、事务的概念

事务是从实际生活中引入数据库的一个概念，即事务内的操作，要么全做，要么全不做。就像银行转账一样，当从一个帐户转出一部分钱之后，就必须在另一个帐户中存入相同数目的钱，若是转出钱之后，事务中止了，没有在另一个帐户中存钱，那么钱就不翼而飞了，这就是事务的原子性。当事务完成后，必须将其结果记录下来，不然就无从知道事务是已经发生还是尚未发生，这是事务的持久性。此外，事务还有隔离性和一致性。

2、为什么要引入日志？

首先，我们了解一下在数据库中是如何实现一个事务的。当事务开始后，我们从磁盘中读取数据，然后对这些数据进行操作，可能是筛选、统计、更新等，还可以有一些新建数据，总之，若发生数据变化后，当数据完成后，必须将这些变化后的数据重新写入到磁盘中，这样我们就完成了一个事务。当然这是最简单的一个描述，下面我们来针对每个环节进行深入的分析。首先是从磁盘中读取数据，根据常识，我们知道，在一个应用系统中，我们可能经常会读取相同的数据，如果每次都从磁盘读取，因为磁盘IO比较慢，所以效率不高，性能不好。大家都能想得到，可以采用缓冲区机制来提高数据读取的性能。本文主要目的不是缓冲区就不多说了。接下来是对数据的操作，事务完成后，我们需要把更新后的数据写入到磁盘，这里又有同样的问题出现，磁盘IO的性能问题，那么有人说我们还可以用缓冲区机制啊？说的太好了，缓冲区确实帮我们缓解了磁盘IO性能的问题。但缓冲区机制在帮我们解决了磁盘IO性能问题的同时，又带来了一个新的问题，如果发生了故障怎么办？如果数据库系统能千秋万载永世长存的话就没问题了，但现实是不可能的，如果系统发生故障，比如断电、死机什么的，缓冲区中的数据就会丢失，想想你刚中了500W元彩票，结果服务器down机了，你的彩票随着缓冲区的消失随风消逝了，你是不是很想把服务器给啃了？什么？你说你无所谓，一切都是浮云......别告诉我你是火星人......

我们言归正传，在数据库系统的设计中，数据的丢失是不可接受的，为了解决缓冲区数据写入磁盘的性能问题，引入了日志。在操作数据之前，我们先将操作记入日志，然后再修改数据，当然不修改数据的日志好象没什么意义，这样，即使系统down机导致缓冲区丢失，也不会把500W元彩票化为乌有了。我们可以通过读取日志，重做丢失的数据的操作，就可以保证丢失的数据全部恢复。有人说，写日志与写缓冲区不是一样要写磁盘吗？这位同学说的太对了，真的是一样的，都要进行写磁盘操作，只是有那么一点点细微的差别，写日志是顺序写入磁盘，而缓冲区则是随机写入磁盘。虽然只是这一点点差别，但对性能的影响却是巨大的，有兴趣的同学可以自己去试试哟。此外日志的数据量也远远小于要写入的缓冲区的数据量。

有些人提问了，为什么要先将操作记入日志，然后再执行操作修改数据呢？这是因为若是先执行操作，那么在随后写入日志之前若是系统down机，，那么就会丢失此次操作，在数据库系统中称之为WAL(write ahead log)。

3、日志缓冲区的引入

为进一步提高性能，引入了日志缓冲区，批量将日志写入到磁盘，而不再是产生一条就写一条，这样又带来一个问题，在日志缓冲区写入磁盘之前有可能会导致日志丢失，从而导致数据丢失。如何解决这个问题呢？我们需要对日志的作用进一步分析，日志是为了重做丢失的操作，若一个事务未提交之前，那么这个事务已进行的操作实际上并不重要，即使丢失也没有什么影响。就像银行转帐一样，从一个账户已经转出，此时系统故障，无法对另一个帐户转入，此事务会回滚，即系统会退回到帐户转出之前的状态，账户转出操作无效，即使账户转出的操作这条日志未被写入磁盘导致操作丢失，当我们恢复时，并不会有什么影响，可能还加速了恢复的过程，少处理了一条日志。因此日志缓冲区的磁盘写入时机可以被推迟，最晚不能晚于事务提交。实际上在日志缓冲区实现上还有一些其它的限制，如checkpoint、日志缓冲区已满等，不一定要等到事务提交时才写入磁盘。

4、lsn的由来和作用

既然已经有了日志，就要发挥它的作用，在恢复过程中，通过读取日志来重做操作，按什么顺序来重做日志呢？记录历史操作的顺序，是非常重要的，如果操作顺序发现混乱，导致的后果也是非常严重的。比如对一个数值100先减去100，再翻倍，若是发生操作顺序逆转，先翻倍再减去100，得到的结果就大相径庭了。这里就需要一个规则，给日志编个序号，我们按日志产生的顺序给每条日志编号，然后按日志编号来重做日志，就不会发生日志重做发生混乱的情况。在实现的过程中，我们在记录日志的时候，是按日志产生的顺序依次写入磁盘的，即使是写到日志缓冲区中，也是按产生的顺序依次写到日志缓冲区，再将日志缓冲区顺序写到磁盘中。因此我们可以采用日志在日志文件中的偏移来代替这个日志编号，不仅不需要额外的磁盘开销，而且还能通过这个偏移迅速定位到这个日志，真是个神奇的想法，我们给这样的日志编号起了一个特殊的名字：lsn，这就是lsn的由来。

但我们又发现一个新的问题，虽然我们知道了所有的历史操作和它们之间的顺序关系，但不知道这些操作的影响是否已经保存到磁盘，如果简单的重做所有操作，会不会把已经做过的操作重复进行。比如购物转账转了两次钱出去？所以在每个数据块的块头记录下最后一次修改这个数据块的操作的日志编号lsn，当重做日志时，数据块加载到缓冲区中，称之为页面，若页面的header中lsn比当前重做日志的lsn小，则说明当前日志尚未被重做；若不比当前重做日志的lsn小，即大于或等于当前重做日志的lsn，则说明当前日志已经被重做，或不需要重做；通过这种方法，可以避免日志被重复重做，从而得到正确的恢复结果。

5、利用checkpoint加速恢复的过程

当系统发生故障后，由于有日志的存在我们不用担心数据丢失，可以通过读取日志来恢复，但若是系统已经运行了很长时间，操作很多，日志很大的情况下，在进行日志恢复时恢复进程会十分慢长。在生产环境下，要求恢复的时间越短越好，怎么才能缩短恢复的时间呢？checkpoint就是解决这个问题的办法。在日志中，引入一种特殊的日志类型，checkpoint日志，它表示在此之前的所有“脏数据”已经写入到磁盘，那么在它之前的日志在恢复过程中就可以忽略掉，而不用再处理。虽然我们希望checkpoint是一个瞬时的过程，但在实现上却有很大的难度，我们不能瞬时将所有“脏数据”写入磁盘，如果可以做到，也就不需要日志了。因此checkpoint是一个过程，有它的起始和结束，当checkpoint开始时，我们记录当前日志的记录偏移lsn，并标记所有的“脏数据”为准备写入状态，接下来就是将具有准备写入状态的”脏数据”写入磁盘，注意：在写入的同时其它进程或线程有可能会产生新的“脏数据”，这些新产生的“脏数据”我们并不关心其是否写入磁盘。当所有已标记的“脏数据”写入磁盘之后，在日志中插入一条checkpoint日志，表示checkpoint已经完成，同时它还记录着checkpoint开始时的日志偏移，也称为REDO偏移。当进行恢复时，首先找到最后一次checkpoint日志的位置，读出checkpoint日志记录，从中获得REDO偏移，然后从REDO偏移开始恢复即可。通过调整checkpoint的间隔时间，可以得到一个可接受的故障恢复时间。

服务器

推荐阅读

服务器
Android 新闻App的本地服务器搭建教程

本文介绍了在开发Android新闻App时，搭建本地服务器的步骤。通过使用XAMPP软件，可以一键式搭建起开发环境，包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表，并设置相应的属性。最后，给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]

蜡笔小新 2023-12-14 17:15:19
服务器
rhel5.5搭建网关+LAMP+postfix+dhcp的步骤和配置方法

本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤，并提供了相关的命令和配置示例。 ... [详细]

蜡笔小新 2023-12-14 17:13:20
服务器
如何使用Java获取服务器硬件信息和磁盘负载率

本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务，并获取服务器的磁盘信息，并将结果输出。然后在本地使用JS编写一个AJAX脚本，远程请求服务端的程序，得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]

蜡笔小新 2023-12-14 13:56:20
port
如何找到并终止在8080端口上运行的进程？

本文介绍了如何找到并终止在8080端口上运行的进程的方法，通过使用终端命令lsof -i :8080可以获取在该端口上运行的所有进程的输出，并使用kill命令终止指定进程的运行。 ... [详细]

蜡笔小新 2023-12-14 13:45:13
服务器
禁止程序接收鼠标事件的工具_VNC Viewer for Mac(远程桌面工具)免费版

VNCViewerforMac是一款运行在Mac平台上的远程桌面工具，vncviewermac版可以帮助您使用Mac的键盘和鼠标来控制远程计算机，操作简 ... [详细]

蜡笔小新 2023-12-14 12:55:15
服务器
云服务器API接口的入门使用及功能解析

本文详细介绍了云服务器API接口的概念和作用，以及如何使用API接口管理云上资源和开发应用程序。通过创建实例API、调整实例配置API、关闭实例API和退还实例API等功能，可以实现云服务器的创建、配置修改和销毁等操作。对于想要学习云服务器API接口的人来说，本文提供了详细的入门指南和使用方法。如果想进一步了解相关知识或阅读更多相关文章，请关注编程笔记行业资讯频道。 ... [详细]

蜡笔小新 2023-12-14 12:43:39
服务器
阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient：4. 设备上报属性

阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]

蜡笔小新 2023-12-14 12:40:20
服务器
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
服务器
如何基于ggplot2构建相关系数矩阵热图以及一个友情故事

本文介绍了如何在rstudio中安装ggplot2，并使用ggplot2构建相关系数矩阵热图。同时，通过一个友情故事，讲述了真爱难觅的故事背后的数据量化和皮尔逊相关系数的概念。故事中的小伙伴们在本科时参加各种考试，其中有些沉迷网络游戏，有些热爱体育，通过他们的故事，展示了不同兴趣和特长对学习和成绩的影响。 ... [详细]

蜡笔小新 2023-12-14 10:47:00
服务器
如何用UE4制作2D游戏文档——计算篇

篇首语：本文由编程笔记#小编为大家整理，主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 09:50:34
port
PHP实现断点续传乱序合并文件的方法和源码

本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因，文件需要分割成多个部分发送，因此无法按顺序接收。文章中提供了merge2.php的源码，通过使用shuffle函数打乱文件读取顺序，实现了乱序合并文件的功能。同时，还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]

蜡笔小新 2023-12-14 04:33:19
port
Hyperledger Fabric外部链码构建与运行的开发笔记

本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识，包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性，外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍，读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行，并且不再受限于特定的语言和部署环境。 ... [详细]

蜡笔小新 2023-12-13 21:47:39
port
大量研发销售产品设计市场岗位！

关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商，服务新产业周期的IoT&5G、边缘计算与云计算市场，交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]

蜡笔小新 2023-12-13 21:02:32
服务器
图解redis的持久化存储机制RDB和AOF的原理和优缺点

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。 ... [详细]

蜡笔小新 2023-12-13 20:24:11
port
页面请求方法参数最长_关于 HTTP GET/POST 请求参数长度最大值的一个理解误区

http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的，最大不能超过XX ... [详细]

蜡笔小新 2023-12-13 19:20:03

豆腐心_suile

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章