首页 > 其他分享 >事务的redo与undo

事务的redo与undo

时间:2023-05-08 18:12:32浏览次数:31  
标签:事务 log undo file 日志 redo

MySQL事务中的redo与undo

一 前言

众所周知InnoDB 是一个事务性的存储引擎,在上一小节我们提到事务有4种特性:原子性、一致性、隔离性和持久性,在事务中的操作,要么全部执行,要么全部不做,这就是事务的目的。

那么事务的四种特性到底是基于什么机制实现呢???

  • 1、事务的原子性、隔离性由锁机制实现,我们将在后续章节《数据库锁机制》中介绍

  • 2、而事务的一致性和持久性由事务的 redo 日志和undo 日志来保证。

    redo log 是重做日志,提供再写入操作,实现事务的持久性;
    undo log 是回滚日志,提供回滚操作,保证事务的一致性。
    

本文将讨论关于事务中的redo和undo的几个问题:

  • redo 日志与undo日志分别用于记录什么?
  • redo 如何保证事务的持久性?
  • undo 如何保证事务的一致性?
  • undo log 是否是redo log的逆过程?

二 Redo log

2.1 redo的作用

记录的是尚未完成的操作,数据库崩溃则用其重做

2.2 redo的组成

Redo log可以简单分为以下两个部分:

  • 保存在内存中重做日志的缓冲 (redo log buffer),是易失的
  • 保存在硬盘中重做日志文件 (redo log file),是持久的

2.3 redo工作流程

img

InnoDB 的更新操作采用的是 Write Ahead Log (预先日志持久化)策略,即先写日志,再写入磁盘。

当一条记录更新时,redo流程大致如下

在内存更新数据后,会把更新后的记录写入到 redo log buffer 中。

第一步:InnoDB 会先把记录从硬盘读入内存
第二部:修改数据的内存拷贝
第三步:生成一条重做日志并写入redo log buffer,记录的是数据被修改后的值
第四步:当事务commit时,将redo log buffer中的内容刷新到 redo log file,对 redo log file采用追加写的方式
第五步:定期将内存中修改的数据刷新到磁盘中(注意注意注意,不是从redo log file刷入磁盘,而是从内存刷入磁盘,redo log file只在崩溃恢复数据时才用),如果数据库崩溃,则依据redo log buffer、redo log file进行重做,恢复数据,这才是redo log file的价值所在

2.4 Write Ahead Log

redo是如何保证事务的持久性的呢???

答案是Force Log at Commit 机制,即当事务commit提交时,innodb引擎先将 redo log buffer 写入到 redo log file 进行持久化,待事务的commit操作完成时才算完成。这种做法也被称为 Write-Ahead Log(预先日志持久化),在持久化一个数据页之前,先将内存中相应的日志页持久化。

问题1:为何不直接将修改的数据写入磁盘,而是要write ahead log呢?

答案:用于崩溃恢复
详解:
undo日志是对原始数据的备份
redo日志是对原始数据的修改
 
原始数据的按照既定的数据结构存放在磁盘上,写入磁盘是要耗费巨大成本的,而写入redo相对容易一些,因为redo里毕竟只需要考虑存放改动的数据即可,所以内存数据写写入redo log file,然后内存数据才能写入磁盘,如此,在内存数据再写入磁盘时因为某种原因比如断电崩溃,那么还可以依据redo log file恢复数据,如下图所示。

img

问题2:如何保证每次修改的数据都能写入redo log file呢?

# 储备知识1
O_DIRECT选项是在Linux系统中的选项,使用该选项后,对文件进行直接IO操作,不经过文件系统缓存,直接写入磁盘
 
# 储备知识2
redo log又称之为重做日志,因重做日志打开并没有O_DIRECT选项,所以重做日志先写入到文件系统缓存,然后才会刷入硬盘,即
Redo log buffer--->os cache(文件系统缓存)--->redo log file
 
如果在刷入redo log file前断电,则会丢失文件系统缓存中数据,数据未写入redo log file,
因为由内存写入redo log file在前,而由内存写入磁盘在后,所以redo log file写入失败,则数据丢失
 
# 那如何保证每次的修改都记入日志文件redo log file呢???
答案是fsync操作
在每次将redo buffer写入os cache文件系统缓存后,InnoDB存储引擎都需要调用一次 fsync操作,保证立即由os cache文件系统缓存写入redo log file
 
fsync是一种系统调用操作,其fsync的效率取决于磁盘的性能,因此磁盘的性能也影响了事务提交的性能,也就是数据库的性能。

问题3:脏页何时刷入磁盘呢?

# 储备知识:脏页
Buffer Pool 中更新的数据未刷新到磁盘中,该内存页我们称之为脏页。最终脏页的数据会刷新到磁盘中,将磁盘中的数据覆盖,这个过程与 redo log 不一定有关系。
 
# 答案
redo log 日志满了的情况下,会主动触发脏页刷新到磁盘

问题4:脏页只在redo log满的情况下才会刷入磁盘吗?

答案:no,以下几种情况同样会触发脏页的刷新
 
- 1、系统内存不足时,需要将一部分数据页淘汰掉,如果淘汰的是脏页,需要先将脏页同步到磁盘;
- 2、MySQL 认为空闲的时间,这种情况没有性能问题;
- 3、MySQL 正常关闭之前,会把所有的脏页刷入到磁盘,这种情况也没有性能问题。

问题5:脏页刷入会带来性能问题吗?
[rml_read_more]:

在生产环境中,如果我们开启了慢 SQL 监控,你会发现偶尔会出现一些用时稍长的 SQL。**这是因为脏页在刷新到磁盘时可能会给数据库带来性能开销,**导致数据库操作抖动。

2.5 参数innodb_flush_log_at_trx_commit

上面提到的Force Log at Commit机制就是靠InnoDB存储引擎提供的参数innodb_flush_log_at_trx_commit来控制的

该参数控制 commit提交事务 时,如何将 redo log buffer 中的日志刷新到 redo log file 中。

  • 1、当设置参数为1时,(默认为1,建议),表示事务提交时必须调用一次 fsync 操作,最安全的配置,保障持久性
  • 2、当设置参数为2时,则在事务提交时只做 write 操作,只保证将redo log buffer写到系统的页面缓存中,不进行fsync操作,因此如果MySQL数据库宕机时 不会丢失事务,但操作系统宕机则可能丢失事务
  • 3、当设置参数为0时,表示事务提交时不进行写入redo log操作,这个操作仅在master thread 中完成,而在master thread中每1秒进行一次重做日志的fsync操作,因此实例 crash 最多丢失1秒钟内的事务。(master thread是负责将缓冲池中的数据异步刷新到磁盘,保证数据的一致性)

拓展阅读

我们需要注意的是 InnoDB 的 redo log 的大小是固定的,分别有多个日志文件采用循环方式组成一个循环闭环,当写到结尾时,会回到开头循环写日志。我们可以通过参数 innodb_log_files_in_group 和 innodb_log_file_size 配置日志文件数量和每个日志文件的大小。

三 Undo log

3.1 作用

undo即撤销还原。

用于记录更改前的一份copy,在操作出错时,可以用于回滚、撤销还原,只将数据库逻辑地恢复到原来的样子

undo日志记录了什么?

比如有两个用户访问数据库,当然并发罗。A是更改,B是查询。
 
--A更改还没有提交,B查询的话,数据肯定为历史数据,这个历史数据就是来源于UNDO段,
 
--A更改未提交,需要回滚rollback,回滚rollback的数据也来至于UNDO段。
 
结论:为了并发时读一致性成功,那么DML操作,肯定先写UNDO段。

3.2 undo的存储位置

在InnoDB存储引擎中,undo存储在回滚段(Rollback Segment)中,每个回滚段记录了1024个undo log segment,而在每个undo log segment段中进行undo 页的申请,在5.6以前,Rollback Segment是在共享表空间里的,5.6.3之后,可通过 innodb_undo_tablespace设置undo存储的位置。

3.3 undo的类型

在InnoDB存储引擎中,undo log分为:

  • insert undo log
  • update undo log

insert undo log是指在insert 操作中产生的undo log,因为insert操作的记录,只对事务本身可见,对其他事务不可见。故该undo log可以在事务提交后直接删除,不需要进行purge操作。

而update undo log记录的是对delete 和update操作产生的undo log,该undo log可能需要提供MVCC机制,因此不能再事务提交时就进行删除。提交时放入undo log链表,等待purge线程进行最后的删除。

补充:purge线程两个主要作用是:清理undo页和清除page里面带有Delete_Bit标识的数据行。在InnoDB中,事务中的Delete操作实际上并不是真正的删除掉数据行,而是一种Delete Mark操作,在记录上标识Delete_Bit,而不删除记录。是一种"假删除",只是做了个标记,真正的删除工作需要后台purge线程去完成。

3.4 undo log 是否是redo log的逆过程?

img

undo log 是否是redo log的逆过程?其实从前文就可以得出答案了,undo log是逻辑日志,对事务回滚时,只是将数据库逻辑地恢复到原来的样子,而redo log是物理日志,记录的是数据页的物理变化,显然undo log不是redo log的逆过程。

3.5 redo & undo总结

下面是redo log + undo log的简化过程,便于理解两种日志的过程:

假设有A、B两个数据,值分别为1,2.
1. 事务开始
2. 记录A=1到undo log
3. 修改A=3
4. 记录A=3到 redo log
5. 记录B=2到 undo log
6. 修改B=4
7. 记录B=4到redo log
8. 将redo log写入磁盘
9. 事务提交

实际上,在insert/update/delete操作中,redo和undo分别记录的内容都不一样,量也不一样。在InnoDB内存中,一般的顺序如下:

  • 写undo的redo
  • 写undo
  • 修改数据页
  • 写Redo

因为,数据在没有commit前,是随时从内存中写入到表数据块的,属于脏数据。 数据库崩溃后即使使用redo流程进行redo操作,但是脏数据还在,脏数据怎么处理,就只能靠undo流程,使用undo数据块的旧数据覆盖了。

undo与redo的联系:但是不管是脏的还是旧的,都在redo日志中复制了一份。

  • 1.undo是一种“数据文件datafile”,具有表空间,当然具有块block;
  • 2.redo是一种“文件file”,没有表空间。
  • 3.数据库在DML事务时,先创建undo
  • 4.读一致性与一致性(scn相同)的区别
  • 5.undo与rollback的区别:在undo(撤销还原流程)中会使用rollback(回滚)这个动作

标签:事务,log,undo,file,日志,redo
From: https://www.cnblogs.com/ycmyay/p/17382642.html

相关文章

  • 数据库的四大特性和事务隔离级别
    数据库中经常被问到四大特性和隔离级别,一般都是涉及到概念性问题,在此做一些整理总结,方便理解。1、事务的隔离级别由低到高依次为Readuncommitted(未授权读取、读未提交)、Readcommitted(授权读取、读提交)、Repeatableread(可重复读取)、Serializable(序列化),这四个级别可以逐个解决脏......
  • 手把手带你实现事务消息
    1、本文2个目的1、讨论一下消息投递的5种方式2、带你手写代码,实现事务消息的投递2、讨论一下消息投递的5种方式2.1、业务场景电商中有这样的一个场景:商品下单之后,需给用户送积分,订单表和积分表分别在不同的db中,涉及到分布式事务的问题。我们通过可靠消息来解决这个问题:商......
  • SQLSERVER四种事务隔离级别
    SQLSERVER的四个事务隔离级别到底怎么理解? 一:背景1.讲故事在有关SQLSERVER的各种参考资料中,经常会看到如下四种事务隔离级别。READUNCOMMITTEDREADCOMMITTEDSERIALIZABLEREPEATABLEREAD随之而来的是大量的文字解释,还会附带各种 脏读, 幻读, 不可重复读 常......
  • RocketMQ之事务消息
    一、概述ApacheRocketMQ在4.3.0版中已经支持分布式事务消息,通过消息的异步事务,可以保证本地事务和消息发送同时执行成功或失败,从而保证了数据的最终一致性。二、案例根据官方提供的例子,TransactionProducer.java如下:publicclassTransactionProducer{publicstaticf......
  • 多文档事务
    多文档事务mongodb单机只能支持单文档事务,只能保证单文档的原子性,如果想要保证多文档的原子性,那么就需要分布式复制集了,由于我使用的是docker容器创建的mongodb实例,演示的时候也使用docker容器即可。创建三个mongodb实例。--replSet设置集群名称dockerrun--namemongo1......
  • 全局事务与本地事务的区别应用
    全局事务:资源管理器管理和协调的事务,可以跨越多个数据库和进程。资源管理器一般使用XA二阶段提交协议与“企业信息系统”(EIS)或数据库进行交互。 本地事务:在单个EIS或数据库的本地并且限制在单个进程内的事务。本地事务不涉及多个数据来源。 在Hibernate配置文件中有这么两......
  • 数据库事务
    数据库事务(一)概述数据库事务(DatabaseTransaction),是指作为单个逻辑工作单元执行的一系列操作。事务处理可以确保除非事务性单元内的所有操作都成功完成,否则不会永久更新面向数据的资源。通过将一组相关操作组合为一个要么全部成功要么全部失败的单元,可以简化错误恢复并使应......
  • SQL Server事务执行过程中中释放锁导致的死锁问题 - 排查与分析
    0.前情提要系统的某个用来上报数据的接口存在死锁的问题。这个接口内部对多张表进行了Update操作,执行顺序为A表、B表、C表、D表、A表。死锁发生的SQL,一条是第一次更新A表的SQL,另一条是第二次更新A表的SQL。整个更新都处在一个事务内,理论上讲,只要第一个Session开始执行事务,第二个......
  • 高级Java程序员必问,Redis事务终极篇
    1.简介1.1什么是Redis事务Redis事务(Transaction)通过将多个Redis操作封装为一个原子性的操作序列,确保在事务执行过程中,不会受到其他客户端的干扰。从而在保证数据一致性的同时,协调并发,提高数据操作的效率和性能。1.2Redis事务的应用场景在分布式系统和高并发场景下,事务处理......
  • 18、GTID复制 (Global Transaction ID 全局事务标识符)
    GTID复制(GlobalTransactionID全局事务标识符)GTID(GlobalTransactionID全局事务标识符)MySQL5.6版本开始支持,但不太成熟,建议使用MySQL5.7以上版本的GTID功能MySQL5.6版本出现没有默认开启,5.7中即使不开启也有匿名的GTID记录.1、开启GTID功能可以支持多DUMP线......