首页 > 数据库 >深入理解数据库事务:确保数据完整性与一致性

深入理解数据库事务:确保数据完整性与一致性

时间:2023-08-21 17:05:14浏览次数:41  
标签:数据完整性 事务 隔离 幻读 数据库 脏读 一致性 数据

前言

在现代信息系统中,数据是至关重要的资产之一。作为一名后端开发人员,与数据库的交道必不可少,为了确保数据的完整性、一致性和可靠性,数据库引入了事务的概念。本次将带您深入了解数据库事务的重要性、特性以及如何在应用程序中正确地使用事务来维护数据的稳定性。

什么是数据库事务?

数据库事务是一组数据库操作的集合,这些操作要么全部成功执行,要么全部失败回滚。事务是数据库管理系统(DBMS)中的核心概念,用于确保数据在并发访问和操作时的一致性和完整性。

ACID 特性

事务通常遵循 ACID 特性,这是指:

  • 原子性(Atomicity):事务中的操作要么全部成功,要么全部失败。如果任何操作失败,整个事务都会回滚,保持数据的一致性。

假设您正在购物超市,您选择了一些商品放入购物篮。原子性就像是您在结账时,要么所有商品都被正确地扫描和计算,要么没有商品被结账,就像是所有商品一起被称为一个“原子”单位。

  • 一致性(Consistency):事务将数据库从一个合法状态转换为另一个合法状态,不会违反数据完整性约束。

在购物过程中,超市会检查您购物篮中的商品是否与价格一致,以确保不会因为错误标价而导致不一致的情况。一致性就像是超市保持商品和价格一致,您购买的商品总是符合预期。

  • 隔离性(Isolation):并发执行的事务相互隔离,一个事务的操作不会影响其他事务,直到事务提交才对其他事务可见。

想象您和朋友同时在超市购物,但您的购物篮和朋友的购物篮是分开的,互不干扰。这就是隔离性,不同的购物篮(事务)在彼此之间是隔离的,不会相互干扰

  • 持久性(Durability):一旦事务提交,其对数据库的更改将永久保存,即使系统崩溃也不会丢失。

假设您购买了商品并完成了结账,超市会将您购买的记录存档,以备将来查询。即使您离开超市,您的购买记录仍然被保留,就像是您的购物信息被“持久”存储

事务的基本操作

一个典型的事务通常包括以下步骤:

  1. 开始事务(BEGIN):事务开始前,DBMS 记录当前状态以备后用。

  2. 执行操作(Perform Operations):在事务内执行数据库操作,如插入、更新、删除等。

  3. 提交事务(COMMIT):如果事务内的所有操作都成功完成,可以将事务提交,将更改永久保存到数据库中。

  4. 回滚事务(ROLLBACK):如果在事务执行期间发生错误,可以回滚事务,撤消之前的操作,将数据库恢复到事务开始前的状态。

事务的隔离级别

事务隔离级别控制了事务之间的可见性和并发行为。常见的隔离级别包括:

  • 读未提交(Read Uncommitted):在这个隔离级别下,一个事务可以读取其他事务尚未提交的数据。这可能导致脏读(读取了未提交的数据)、不可重复读(同一查询在事务执行期间返回不同结果)和幻读(事务在同一查询中看到不同的数据行)等问题。读未提交的隔离级别最不严格,可能会引发数据不一致问题

  • 读已提交(Read Committed):在这个隔离级别下,一个事务只能读取已经提交的数据,避免了脏读问题。但是,不可重复读和幻读问题仍然可能出现。因为其他事务可能在事务进行期间提交新的数据,导致不同时间点的查询结果不一致。

  • 可重复读(Repeatable Read):可重复读隔离级别确保在同一事务内,同一个查询的结果保持一致。这意味着一个事务中的查询不会受到其他事务的修改影响。这可以防止脏读和不可重复读问题,但幻读问题仍然可能出现,因为其他事务可能插入新数据,导致新数据行的出现。

  • 串行化(Serializable):串行化是最严格的隔离级别,它确保每个事务都在独立的时间段内执行,防止了并发问题。事务按照顺序一个接一个地执行,这可以解决脏读、不可重复读和幻读问题。然而,串行化可能会对性能产生较大的影响,因为事务需要依次执行。


上面说到事务的隔离级别可以解决脏读、幻读、不可重复读的问题。那么什么是脏读、幻读、和不可重复读呢?

  • 脏读(Dirty Read)
    脏读指的是在一个事务中读取了另一个事务未提交的数据。假设事务 A 修改了某一行数据,但还没有提交。同时,事务 B 尝试读取了事务 A 修改的数据。如果事务 A 最终回滚了,那么事务 B 读取的数据就是不存在的,这就是脏读。脏读会导致不准确的数据展示,因为读取的数据可能是临时的、未经验证的。

想象你正在制作一个蛋糕,但在制作过程中,你的朋友看了一眼,然后走了。在他离开之前,你还没有完成蛋糕,但他已经看到了不完整的状态。这就好像是一个“脏读”:朋友读取了还没有完成的信息,结果可能是不准确或临时的。

  • 不可重复读(Non-repeatable Read)
    不可重复读是指在同一个事务内,多次读取同一数据时,得到不同的结果。这可能是因为在事务执行期间,其他事务修改了数据。例如,事务 A 在读取某一行数据后,事务 B 修改了这行数据,并提交了。现在事务 A 再次读取相同的数据,发现数据已经不同了,造成了不一致的现象。

假设你正在读一本小说,当你读到一部分内容时,有人偷偷地在书的后面添加了一些新章节。如果你再次阅读同一部分,你会发现内容已经改变了,因为有新的内容被添加进来。这就像是“不可重复读”:同样的数据在短时间内发生了变化,导致你得到了不同的结果。

  • 幻读(Phantom Read)
    幻读是指在同一个事务内,多次查询同一范围的数据时,得到不同的结果。这与不可重复读类似,但幻读关注的是数据的数量变化。例如,事务 A 在查询某个范围内的所有数据时,事务 B 插入了新数据,并提交了。现在事务 A 再次查询同一范围的数据,发现数据行的数量增加了,这就是幻读。

想象你正在草地上采摘草莓,你数了一下有多少个成熟的草莓。然后你去拿一个篮子,当你回来时,发现有一些新的草莓从草丛里冒出来,导致总数增加了。这就是“幻读”:同一范围内的数据在短时间内发生了变化,导致数量发生了变化。

事务的传播行为

事务的传播行为是指在多个事务边界交互时,一个事务如何与另一个事务进行交互和传播。传播行为定义了事务的范围、边界和嵌套关系,以确保事务的一致性和正确性。以下是几种常见的事务传播行为:

  • PROPAGATION_REQUIRED(需要事务)
    这是默认的传播行为。如果当前没有事务,就创建一个新事务;如果已经存在事务,就加入该事务。这意味着如果方法被调用时没有事务,则会创建一个新事务。如果方法已经在事务中,则方法将使用已经存在的事务。这样做可以保证事务嵌套。

这就像您和朋友在一起制作一张拼图。如果朋友已经在拼图上工作(存在事务),您会加入他的工作。如果没有人在拼图,您会创建一个新的拼图,然后加入制作过程。这样,无论之前是否有拼图,您都可以保证最终拼图是一张完整的。

  • PROPAGATION_REQUIRES_NEW(需要新事务)
    无论当前是否存在事务,都会创建一个新的事务。如果方法已经在事务中,则当前事务会被挂起,新事务将创建。这样做可以在方法执行期间独立于外部事务创建一个新的事务,确保完全隔离。

这就像您与朋友们一起在不同的活动中度过周末。无论朋友们在做什么活动(存在事务),您都决定自己尝试一项新活动,不受其他人的影响。您可以全身心地投入新的活动,不必担心与其他活动的冲突。

  • PROPAGATION_NESTED(嵌套事务)
    如果当前存在事务,则在该事务内嵌套一个新事务。如果没有事务,则行为类似于 PROPAGATION_REQUIRED。嵌套事务可以回滚到嵌套点,而不会影响外部事务。这样可以实现更细粒度的事务管理。

想象您和家人一起做一个家庭项目,同时每个家庭成员也在做各自的小项目。您的小项目被嵌套在整个家庭项目中。您的项目可以独立完成,但仍然受到家庭项目的影响。如果家庭项目失败,您的项目也会受到影响。

  • PROPAGATION_SUPPORTS(支持事务)
    如果当前存在事务,则加入该事务;如果没有事务,则以非事务方式执行。这意味着方法将根据调用方的上下文来决定是否执行在事务中。

这就像您加入一个跳绳团队的训练。如果其他人正在跳绳(存在事务),您可以选择加入他们的活动。如果没有人在跳绳,您可以以非正式的方式自己练习,不需要参与到团队的事务中。

  • PROPAGATION_NOT_SUPPORTED(不支持事务)
    以非事务方式执行方法。如果当前存在事务,则将其挂起,方法执行完毕后恢复原事务。这样可以保证方法的执行不受外部事务的影响。

这就像您在休闲时间去运动,不受任何工作的干扰。无论别人是否在工作,您可以专注于自己的活动,没有事务的干扰。

  • PROPAGATION_MANDATORY(强制性的事务)
    必须在一个已存在的事务中执行,否则将抛出异常。这样可以确保方法在事务上下文中被调用。

这就像您参加一个要求穿制服的活动。您必须穿制服(存在事务)才能参与,否则将无法参加。

  • PROPAGATION_NEVER(不允许事务)
    必须在非事务环境中执行,否则将抛出异常。这样可以确保方法不会被错误地嵌套在事务中。

这就像您在一个休息时间内,被告知不能工作。无论其他人是否在工作,您不能参与到事务中。

如何正确使用事务?

在应用程序中,正确使用事务至关重要。以下是一些指导原则:

  1. 小而短的事务:将事务保持尽可能小和短,以减少对数据库资源的锁定时间,提高并发性能。

  2. 适当的隔离级别:选择适当的隔离级别,平衡数据的一致性和性能需求。

  3. 异常处理:捕获和处理事务中的异常,以便在错误发生时能够正确地回滚事务。

  4. 批量操作:对大量数据进行操作时,考虑使用批量操作,减少事务的数量,提高性能。

  5. 事务嵌套:某些数据库支持事务嵌套,但必须小心使用,确保正确的提交和回滚顺序。

总结

事务是数据库管理中保证数据一致性和完整性的重要工具。通过遵循 ACID 特性、正确使用事务操作和选择适当的隔离级别,我们可以确保应用程序的数据在并发环境下保持稳定。深入理解和正确使用数据库事务,将使您的应用更加可靠、稳定和高效。

标签:数据完整性,事务,隔离,幻读,数据库,脏读,一致性,数据
From: https://www.cnblogs.com/kxxz/p/17646515.html

相关文章

  • Apache DolphinScheduler 支持使用 OceanBase 作为元数据库啦!
    DolphinScheduler是一个开源的分布式任务调度系统,拥有分布式架构、多任务类型、可视化操作、分布式调度和高可用等特性,适用于大规模分布式任务调度的场景。目前DolphinScheduler支持的元数据库有Mysql、PostgreSQL、H2,如果在业务中需要更好的性能和扩展性,可以在DolphinScheduler......
  • mysql登陆数据库报错Segmentation fault (核心已转储)的解决办法
     转自:https://bbs.cnbugs.com/read-43-1.html今天在登陆新安装好的数据库报如下错误: [root@lnmp~]#mysql-uroot-pEnterpassword:WelcometotheMySQLmonitor.Commandsendwith;or\g.YourMySQLconnectionidis13Serverversion:8.0.21 Copyright(c......
  • 数据库基础
    数据库简介数据库定义与概念数据库是一种存储、组织和管理大量数据的软件工具。它能够存储各种类型的数据,包括文本、图像、视频、音频等,并且可以方便地对其进行读取、写入和更新等操作。数据库的概念可以追溯到二十世纪早期,最早的数据库是文件系统,后来逐渐演化为关系型数据库......
  • 达梦数据库 dexp和dimp的使用
    介绍Oracle中备份还原数据有exp和imp,而达梦数据库也有dexp和dimp命令,用来备份还原达梦的数据。操作类型逻辑使用场景dexp和dimp既可以用于服务端中,又能够在客户端使用。备注,此备份还原方案是逻辑操作,在少量数据的情况下,性能足够,一旦数据量过大,则备份时间极长。同步方式达梦数据库支......
  • 查询SQL SERVER数据库会话阻塞
    SELECT[session_id],[blocking_session_id]AS'正在阻塞其他会话的会话ID',DB_NAME([database_id])AS'数据库名称',[request_id],[cpu_time],[start_time]AS'开始时间',[status]AS'状态',[command]AS'命令',......
  • 一致性 Hash
    参考:simplezero :一致性hash 概念一致性hash算法主要应用在分布式缓存系统中,在增加或者删除服务器节点时,能够尽可能小地改变已存在的服务请求与处理请求服务器之间的映射关系,也就是系统中的大多数历史缓存的存储服务器节点可以不变,解决了普通hash算法带来的动态伸缩性问题。......
  • 磨刀不误砍柴工,数据压缩,带来的可不止空间节省 | StoneDB数据库观察
    谈到数据仓库,必然都会涉及海量历史数据,但是对于历史数据有个共识,就是越近的数据访问频率越高,越久远的数据访问频率越低。作者 | 祁国辉编辑&设计|宇亭责编 | 韩  楠当历史数据访问频率低到一定程度,我们就会发现数据的存储成本和收益开始倒挂,存储数据有点得不......
  • 哪篇论文宣布了 HTAP 数据库的诞生? StoneDB带您解读《A Common Database Approach for
    theme:condensed-night-purple开启掘金成长之旅!这是我参与「掘金日新计划·12月更文挑战」的第4天,点击查看活动详情本文是 StoneDB学术分享会专栏的第五篇,我们来分享一下HTAP学术界上比较经典的一篇论文《ACommonDatabaseApproachforOLTPandOLAPUsinganIn-M......
  • 带你来吃瓜!Andy Pavlo教授带您一文回顾数据库的2022年
    theme:fancy编辑/翻译:宇亭校对:王学姣、李浩本文是由数据库界知名专家AndyPavlo教授写的2022年数据库回顾文章,这个系列从去年开始,非常经典,也比较系统的整理了一下数据库界的大事件(当然,主要还是以国外的居多),StoneDB团队对本文进行了翻译,小编在一些链接部分加了注释,方便大家......
  • 主流开源分析引擎梳理,看看你最中意谁?| StoneDB数据库观察
    编者荐语:本文来自石原子合伙人祁国辉老师,主要对主流的开源分析引擎进行详尽的分析,干货满满,欢迎大家阅读学习。最近一段时间,我重新梳理了一下目前市面上主流的数据分析引擎,发现真是琳琅满目,令人眼花缭乱。静下心来花了两周时间横向看了一下,学习过程中,记了一些笔记,希望能够......