数据库Mysql核心日志（redolog、undolog、binlog）

作者：秋夜里的寂寞 | 来源：互联网 | 2023-09-25 20:41

Mysql核心日志（redolog、undolog、binlog）我们在使用Mysql里会接触到三个核心日志分别是binlog、redolog、und

Mysql 核心日志&＃xff08;redolog、undolog、binlog&＃xff09;

我们在使用Mysql 里会接触到三个核心日志分别是 binlog 、redo log、undo log&＃xff0c; 这里面binlog 是server层的日志&＃xff0c;而redo log 和undo log都是引擎层&＃xff08;innodb&＃xff09;的日志&＃xff0c;要换其他数据引擎那么就未必有redo log和undo log了。也正是因为它们在Mysql不同的体系结构里&＃xff0c;所以他们所针对的的问题也是完全不同的&＃xff0c;而我们要了解这些日志的核心思想和功能原理&＃xff0c;那么就势必先要从它锁针对的问题和设计理念来了解。

binlog

binlog 设计目标

binlog 是作为mysql操作记录归档的日志&＃xff0c;这个日志记录了所有对数据库的数据、表结构、索引等等变更的操作。也就是说只要是对数据库有变更的操作都会记录到binlog里面来&＃xff0c; 可以把数据库的数据当成我们银行账户里的余额&＃xff0c;而binlog就相当于我们银行卡的流水。账户余额只是一个结果&＃xff0c;至于这个结果怎么来的&＃xff0c;那就必须得看流水了。而同样在mysql里我们就是通过binlog来归档、验证、恢复、同步数据。

binlog 记录内容

binlog应该说是Mysql里最核心的日志&＃xff0c; 它记录了除了查询语句(select、show)之外的所有的 DDL 和 DML 语句,也就意味着我们基本上所有对数据库的操作变更都会记录到binlog里面。binlog以事件形式记录&＃xff0c;不仅记录了操作的语句&＃xff0c;同时还记录了语句所执行的消耗的时间。 binlog 有三种记录格式&＃xff0c;分别是ROW、STATEMENT、MIXED。

1、ROW&＃xff1a; 基于变更的数据行进行记录&＃xff0c;如果一个update语句修改一百行数据&＃xff0c;那么这种模式下就会记录100行对应的记录日志。

2、STATEMENT&＃xff1a;基于SQL语句级别的记录日志&＃xff0c;相对于ROW模式&＃xff0c;STATEMENT模式下只会记录这个update 的语句。所以此模式下会非常节省日志空间&＃xff0c;也避免着大量的IO操作。

3、MIXED&＃xff1a; 混合模式&＃xff0c;此模式是ROW模式和STATEMENT模式的混合体&＃xff0c;一般的语句修改使用statment格式保存binlog&＃xff0c;如一些函数&＃xff0c;statement无法完成主从复制的操作&＃xff0c;则采用row格式保存binlog。

这三种模式需要注意的是&＃xff1a;使用 row 格式的 binlog 时&＃xff0c;在进行数据同步或恢复的时候不一致的问题更容易被发现&＃xff0c;因为它是基于数据行记录的。而使用 mixed 或者 statement 格式的 binlog 时&＃xff0c;很多事务操作都是基于SQL逻辑记录&＃xff0c;我们都知道一个SQL在不同的时间点执行它们产生的数据变化和影响是不一样的&＃xff0c;所以这种情况下&＃xff0c;数据同步或恢复的时候就容易出现不一致的情况。

binlog 写入策略

在进行事务的过程中&＃xff0c;首先会把binlog 写入到binlog cache中&＃xff08;因为写入到cache中会比较快&＃xff0c;一个事务通常会有多个操作&＃xff0c;避免每个操作都直接写磁盘导致性能降低&＃xff09;&＃xff0c;事务最终提交的时候再吧binlog 写入到磁盘中。当然事务在最终commit的时候binlog是否马上写入到磁盘中是由参数 sync_binlog 配置来决定的。

1、sync_binlog&＃61;0 的时候&＃xff0c;表示每次提交事务binlog不会马上写入到磁盘&＃xff0c;而是先写到page cache,相对于磁盘写入来说写page cache要快得多,不过在Mysql 崩溃的时候会有丢失日志的风险。

2、sync_binlog&＃61;1 的时候&＃xff0c;表示每次提交事务都会执行 fsync 写入到磁盘 &＃xff1b;

3、sync_binlog的值大于1 的时候&＃xff0c;表示每次提交事务都先写到page cach&＃xff0c;只有等到积累了N个事务之后才fsync 写入到磁盘&＃xff0c;同样在此设置下Mysql 崩溃的时候会有丢失N个事务日志的风险。

很显然三种模式下&＃xff0c;sync_binlog&＃61;1 是强一致的选择&＃xff0c;选择0或者N的情况下在极端情况下就会有丢失日志的风险&＃xff0c;具体选择什么模式还是得看系统对于一致性的要求。

redo log

redo log 设计目标

redo log 是属于引擎层(innodb)的日志&＃xff0c;它的设计目标是支持innodb的“事务”的特性&＃xff0c;事务ACID特性分别是原子性、一致性、隔离性、持久性&＃xff0c; 一致性是事务的最终追求的目标&＃xff0c;隔离性、原子性、持久性是达成一致性目标的手段&＃xff0c;根据的文章我们已经知道隔离性是通过锁机制来实现的。而事务的原子性和持久性则是通过redo log 和undo log来保障的。

redo log 能保证对于已经COMMIT的事务产生的数据变更&＃xff0c;即使是系统宕机崩溃也可以通过它来进行数据重做&＃xff0c;达到数据的一致性&＃xff0c;这也就是事务持久性的特征&＃xff0c;一旦事务成功提交后&＃xff0c;只要修改的数据都会进行持久化&＃xff0c;不会因为异常、宕机而造成数据错误或丢失,所以解决异常、宕机而可能造成数据错误或丢是redo log的核心职责。

redo log记录的内容

redo log记录的是操作数据变更的日志&＃xff0c;听起来好像和binlog有类似的地方&＃xff0c;有时候我都会想有了binlog为什么还要redo log&＃xff0c;当然从其它地方可以找到很多的理由&＃xff0c;但是我认为最核心的一点就是redo log记录的数据变更粒度和binlog的数据变更粒度是不一样的&＃xff0c;也正因为这个binlog是没有进行崩溃恢复事务数据的能力的。

以修改数据为例&＃xff0c;binlog 是以表为记录主体&＃xff0c;在ROW模式下&＃xff0c;binlog保存的表的每行变更记录。

比如update tb_user set age &＃61;18 where name &＃61;&＃39;赵白&＃39; &＃xff0c;如果这条语句修改了三条记录的话&＃xff0c;那么binlog记录就是

UPDATE &＃96;db_test&＃96;.&＃96;tb_user&＃96; WHERE &＃64;1&＃61;5 &＃64;2&＃61;&＃39;赵白&＃39; &＃64;3&＃61;91 &＃64;4&＃61;&＃39;1543571201&＃39; SET &＃64;1&＃61;5 &＃64;2&＃61;&＃39;赵白&＃39; &＃64;3&＃61;18 &＃64;4&＃61;&＃39;1543571201&＃39;UPDATE &＃96;db_test&＃96;.&＃96;tb_user&＃96; WHERE &＃64;1&＃61;6 &＃64;2&＃61;&＃39;赵白&＃39; &＃64;3&＃61;91 &＃64;4&＃61;&＃39;1543571201&＃39; SET &＃64;1&＃61;5 &＃64;2&＃61;&＃39;赵白&＃39; &＃64;3&＃61;18 &＃64;4&＃61;&＃39;1543571201&＃39;UPDATE &＃96;db_test&＃96;.&＃96;tb_user&＃96; WHERE &＃64;1&＃61;7 &＃64;2&＃61;&＃39;赵白&＃39; &＃64;3&＃61;91 &＃64;4&＃61;&＃39;1543571201&＃39; SET &＃64;1&＃61;5 &＃64;2&＃61;&＃39;赵白&＃39; &＃64;3&＃61;18 &＃64;4&＃61;&＃39;1543571201&＃39;

redo log则是记录着磁盘数据的变更日志&＃xff0c;以磁盘的最小单位“页”来进行记录。上面的修改语句&＃xff0c;在redo log里面记录得可能就是下面的形式。

把表空间10、页号5、偏移量为10处的值更新为18。把表空间11、页号1、偏移量为2处的值更新为18。把表空间12、页号2、偏移量为9处的值更新为18。

当我们把数据从内存保存到磁盘的过程中&＃xff0c;Mysql是以页为单位进行刷盘的&＃xff0c;这里的页并不是磁盘的页&＃xff0c;而是Mysql自己的单位&＃xff0c;Mysql里的一页数据单位为16K&＃xff0c;所以在刷盘的过程中需要把数据刷新到磁盘的多个扇区中去。而把16K数据刷到磁盘的每个扇区里这个过程是无法保证原子性的&＃xff0c;也就意味着Mysql把数据从内存刷到磁盘的过程中&＃xff0c;如果数据库宕机&＃xff0c;那么就可能会造成一步分数据成功&＃xff0c;一部分数据失败的结果。而这个时候通过binlog这种级别的日志是无法恢复的&＃xff0c;一个update可能更改了多个磁盘区域的数据&＃xff0c;如果根据SQL语句回滚&＃xff0c;那么势必会让那些已经刷盘成功的数据造成数据不一致。所以这个时候还是得需要通过redo log这种记录到磁盘数据级别的日志进行数据恢复。

redo log写入策略

redo lo占用的空间是一定的&＃xff0c;并不会无线增大&＃xff08;可以通过参数设置&＃xff09;&＃xff0c;写入的时候是进顺序写的&＃xff0c;所以写入的性能比较高。当redo log空间满了之后又会从头开始以循环的方式进行覆盖式的写入。

在写入redo log的时候也有一个redo log buffer&＃xff0c;日志什么时候会刷到磁盘是通过innodb_flush_log_at_trx_commit 参数决定。

innodb_flush_log_at_trx_commit&＃61;0 &＃xff0c;表示每次事务提交时都只是把 redo log 留在 redo log buffer 中 ;

innodb_flush_log_at_trx_commit&＃61;1&＃xff0c;表示每次事务提交时都将 redo log 直接持久化到磁盘&＃xff1b;

innodb_flush_log_at_trx_commit&＃61;2&＃xff0c;表示每次事务提交时都只是把 redo log 写到 page cache。

除了上面几种机制外&＃xff0c;还有其它两种情况会把redo log buffer中的日志刷到磁盘。

1、定时处理&＃xff1a;有线程会定时(每隔 1 秒)把redo log buffer中的数据刷盘。

2、根据空间处理&＃xff1a;redo log buffer 占用到了一定程度( innodb_log_buffer_size 设置的值一半)占&＃xff0c;这个时候也会把redo log buffer中的数据刷盘。

undo log

undo log设计目标

redo log 是也属于引擎层(innodb)的日志&＃xff0c;从上面的redo log介绍中我们就已经知道了&＃xff0c;redo log 和undo log的核心是为了保证innodb事务机制中的持久性和原子性&＃xff0c;事务提交成功由redo log保证数据持久性&＃xff0c;而事务可以进行回滚从而保证事务操作原子性则是通过undo log 来保证的。

要对事务数据回滚到历史的数据状态&＃xff0c;所以我们也能猜到undo log是保存的是数据的历史版本&＃xff0c;通过历史版本让数据在任何时候都可以回滚到某一个事务开始之前的状态。undo log除了进行事务回滚的日志外还有一个作用&＃xff0c;就是为数据库提供MVCC多版本数据读的功能。

undo log记录内容

在Mysql里数据每次修改前&＃xff0c;都首先会把修改之前的数据作为历史保存一份到undo log里面的&＃xff0c;数据里面会记录操作该数据的事务ID&＃xff0c;然后我们可以通过事务ID来对数据进行回滚。

比如我们执行 update user_info set name &＃61;“李四”where id&＃61;1的时候。整个undo log的记录形式会如下。

1、首先准备一张原始原始数据表

2、开启一个事务A&＃xff1a; 对user_info表执行 update user_info set name &＃61;“李四”where id&＃61;1 会进行如下流程操作

1、首先获得一个事务编号 104

2、把user_info表修改前的数据拷贝到undo log

3、修改user_info表 id&＃61;1的数据

4、把修改后的数据事务版本号改成当前事务版本号&＃xff0c;并把DB_ROLL_PTR 地址指向undo log数据地址。

3、最后执行完结果如图&＃xff1a;

redo、undo、binlog的生成流程与崩溃恢复

当我们执行update user_info set name &＃61;“李四”where id&＃61;1 的时候大致流程如下&＃xff1a;

1、从磁盘读取到id&＃61;1的记录&＃xff0c;放到内存。

2、记录undo log 日志。

3、记录redo log (预提交状态)

4、修改内存中的记录。

5、记录binlog

6、提交事务&＃xff0c;写入redo log (commit状态)

我们根据上面的流程来看&＃xff0c;如果在上面的某一个阶段数据库崩溃&＃xff0c;如何恢复数据。

1、在第一步、第二步、第三步执行时据库崩溃&＃xff1a;因为这个时候数据还没有发生任何变化&＃xff0c;所以没有任何影响&＃xff0c;不需要做任何操作。

2、在第四步修改内存中的记录时数据库崩溃&＃xff1a;因为此时事务没有commit&＃xff0c;所以这里要进行数据回滚&＃xff0c;所以这里会通过undo log进行数据回滚。

3、第五步写入binlog时数据库崩溃&＃xff1a;这里和第四步一样的逻辑&＃xff0c;此时事务没有commit&＃xff0c;所以这里要进行数据回滚&＃xff0c;会通过undo log进行数据回滚。

4、执行第六步事务提交时数据库崩溃&＃xff1a;如果数据库在这个阶段崩溃&＃xff0c;那其实事务还是没有提交成功&＃xff0c;但是这里并不能像之前一样对数据进行回滚&＃xff0c;因为在提交事务前,binlog可能成功写入磁盘了&＃xff0c;所以这里要根据两种情况来做决定。

如果binlog存在事务记录&＃xff1a;那么就"认为"事务已经提交了&＃xff0c;这里可以根据redo log对数据进行重做。其实你应该有疑问&＃xff0c;其实这个阶段发生崩溃了&＃xff0c;最终的事务是没提交成功的,这里应该对数据进行回滚。这里主要的一个考虑是因为binlog已经成功写入了&＃xff0c;而binlog写入后&＃xff0c;那么依赖于binlog的其它扩展业务&＃xff08;比如&＃xff1a;从库已经同步了日志进行数据的变更&＃xff09;数据就已经产生了&＃xff0c;如果这里进行数据回滚&＃xff0c;那么势必就会造成主从数据的不一致。

另外一种情况就是binlog不存在事务记录&＃xff0c;那么这种情况事务还未提交成功&＃xff0c;所以会对数据进行回滚。

binlog和redolog区别&＃xff1f;

binlog记录的是数据库表的行更改&＃xff0c;redo记录的是磁盘页的数据更改。

推荐阅读

get
MySQL显示SQL语句执行时间的实例详解

本文详细介绍了如何使用MySQL来显示SQL语句的执行时间，并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法：瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]

蜡笔小新 2023-12-12 16:16:42
get
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
cookie
如何限制php数据库链接数和连接超时时间？

本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目，以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数，以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]

蜡笔小新 2023-12-14 14:06:10
bash
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06
sum
图解redis的持久化存储机制RDB和AOF的原理和优缺点

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。 ... [详细]

蜡笔小新 2023-12-13 20:24:11
get
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
get
VB.NET在线急等问题解决方法，如何统计数据库字段下的数据并显示在文本框里？

本文介绍了一个在线急等问题解决方法，即如何统计数据库中某个字段下的所有数据，并将结果显示在文本框里。作者提到了自己是一个菜鸟，希望能够得到帮助。作者使用的是ACCESS数据库，并且给出了一个例子，希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句，得到的结果是650，但不知道如何得到560。希望能够得到解决方案。 ... [详细]

蜡笔小新 2023-12-13 15:15:30
version
问题2：重新命名或者移动数据文件、日志文件到新的位置

本文讨论了在数据库打开和关闭状态下，重新命名或移动数据文件和日志文件的情况。针对性能和维护原因，需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况，以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]

蜡笔小新 2023-12-13 13:02:24
version
mysql-cluster集群sql节点高可用keepalived的故障处理过程

本文描述了mysql-cluster集群sql节点高可用keepalived的故障处理过程，包括故障发生时间、故障描述、故障分析等内容。根据keepalived的日志分析，发现bogus VRRP packet received on eth0 !!!等错误信息，进而导致vip地址失效，使得mysql-cluster的api无法访问。针对这个问题，本文提供了相应的解决方案。 ... [详细]

蜡笔小新 2023-12-12 19:20:50
import
Netty拆包粘包问题解决 —— 特殊结束符

本文介绍了解决Netty拆包粘包问题的一种方法——使用特殊结束符。在通讯过程中，客户端和服务器协商定义一个特殊的分隔符号，只要没有发送分隔符号，就代表一条数据没有结束。文章还提供了服务端的示例代码。 ... [详细]

蜡笔小新 2023-12-14 18:02:45
search
如何使用Java获取服务器硬件信息和磁盘负载率

本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务，并获取服务器的磁盘信息，并将结果输出。然后在本地使用JS编写一个AJAX脚本，远程请求服务端的程序，得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]

蜡笔小新 2023-12-14 13:56:20
search
MyBatis错题分析解析及注意事项

本文对MyBatis的错题进行了分析和解析，同时介绍了使用MyBatis时需要注意的一些事项，如resultMap的使用、SqlSession和SqlSessionFactory的获取方式、动态SQL中的else元素和when元素的使用、resource属性和url属性的配置方式、typeAliases的使用方法等。同时还指出了在属性名与查询字段名不一致时需要使用resultMap进行结果映射，而不能使用resultType。 ... [详细]

蜡笔小新 2023-12-13 18:40:17
search
Windows操作系统的版本介绍及特点

本文介绍了Windows操作系统的版本及其特点，包括Windows 7系统的6个版本：Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统，具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本，缺乏Aero特效功能，没有64位支持，最初设计不能同时运行三个以上应用程序。 ... [详细]

蜡笔小新 2023-12-12 17:41:13
header
php 主动断掉http,怎么在PHP项目中实现一个HTTP断点续传功能

怎么在PHP项目中实现一个HTTP断点续传功能发布时间：2021-01-1916:26:06来源：亿速云阅读：96作者：Le ... [详细]

蜡笔小新 2023-12-12 17:17:29
header
海马s5近光灯能否直接更换为H7？

本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡，并提供了完整的教程下载地址。此外，还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]

蜡笔小新 2023-12-12 11:39:00