MySQL知识体系——事务

Wesley13
• 阅读 718

ACID(事务的四大特性)

    四个特性中,最重要的就是一致性。由原子性,隔离性,持久性来保证。

(以下描述用例:用户A、B、C分别在银行拥有500元存款)

    原子性(Atomicity)

        事务是一个不可分割的工作单元,事务中的操作要么全部COMMIT提交成功,要么全部失败ROLLBACK回滚。

        原子性由 Undo log 保证。Undo Log 会保存每次变更之前的记录,从而在发生错误时进行回滚。

        MySQL知识体系——事务

        操作1:A消费200

操作2:C收入200

1/2两个操作任何一个失败,数据都将回到操作前的状态,即A(500)C(500)

    一致性(Consistency)

        数据库总是从一个一致性的状态转换到另一个一致性的状态。

        MySQL知识体系——事务

        操作前:A(500)C(500)

操作后:A(300)C(700)

可以理解为:原子性以“操作”为对象,一致性以“数据库状态(即数据)”为对象

    隔离性(Isolation)

        一个事务所做的修改在最终提交以前,对其他事务是不可见的。

隔离性由 MVCC 和 Lock 保证(后面会说明)。

        MySQL知识体系——事务

事务1:A向C转账200

事务2:B向C转账100

1/2两个事务在提交之前,相互看不到对方的操作,即事务1看不到事务2中对C存款的修改,同时事务2也一样看不到事务1的操作

    持久性(Durability)

        事务一旦被提交,它对数据库中数据的改变就是永久性的,接下来即使数据库发生故障也不应该对其有任何影响。

持久性由 Redo Log 保证。每次真正修改数据之前,都会将记录写到 Redo Log 中,只有 Redo Log 写入成功,才会真正的写入到存储中,如果提交之前发生意外如断电,可以通过 Redo Log 恢复记录。

事务的并发问题

    脏读

        事务A读取了事务B更新但未提交的数据,然后B回滚操作,那么A读取到的数据是脏数据。

    不可重复读

        事务A多次读取同一数据,事务B在事务A多次读取的过程中,对数据作了更新并提交,导致事务A多次读取同一数据的结果不一致。

    幻读

        事务A读取了一些数据,但是事务B在事务A读取完数据后,插入/删除了一条新的记录,然后事务A再次读取数据时发现多/少了,就好像发生了幻觉一样。

        小结:不可重复读的和幻读很容易混淆,不可重复读侧重于修改,幻读侧重于新增或删除。解决不可重复读的问题只需锁住满足条件的行,解决幻读需要锁表。

事务的隔离级别

    read-uncommitted(RU)(未提交读)

在read-uncommitted级别,事务中的修改,即使没有提交,对其他事务也都是可见的。事务可以读取未提交的数据,这也被称为脏读(Dirty Read)。这个级别会导致很多问题,从性能上来说,read-uncommitted不会比其他的级别好太多,但却缺乏其他级别的很多好处,除非真的有非常必要的理由,在实际应用中一般很少使用。

        对每个更新语句的行记录进行加锁,而不是对整个事务进行加锁,所以会发生脏读。而 RC 和 RR 会对整个事务加锁。

    read-committed(RC)(提交读)

  大多数数据库系统的默认隔离级别都是read-committed(但MySQL不是)。read-committed满足前面提到的隔离性的简单定义:一个事务开始时,只能"看见"已经提交的事务所做的修改。换句话说,一个事务从开始直到提交之前,所做的任何修改对其他事务都是不可见的。这个级别有时候叫做不可重复读(nonrepeatble read),因为两次执行同样的查询,可能会得到不一样的结果。

        每次执行 SQL 语句都会生成一个新的 Read View,每次读到的都是不同的,所以会发生不可重复读。而 RR 的事务从始至终都是使用同一个 Read View。

    repeatable-read(RR)(可重复读)

  repeatable-read解决了脏读的问题。该隔离级别保证了在同一个事务中多次读取同样记录结果是一致的。但是理论上,可重复读隔离级别还是无法解决另外一个幻读(Phantom Read)的问题。所谓幻读,指的是当某个事务在读取某个范围内的记录时,另一个事务又在该范围内插入了新的记录,当之前的事务再次读取该范围的记录时,会产生幻行(Phantom Row)。InnoDB和XtraDB存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)解决了幻读的问题。

        MySQL默认的事务处理级别是“REPEATABLE-READ”,也就是可重复读,SELECT @@global.tx_isolation;

    serializable(可串行化)

  serializable是最高的隔离级别。它通过强制事务串行执行,避免了前面说的幻读的问题。简单来说,serializable会在读取每一行数据都加锁,所以可能导致大量的超时和锁争用问题。实际应用中也很少用到这个隔离级别,只有在非常需要确保数据的一致性而且可以接受没有并发的情况下,才考虑采用该级别。

        每种隔离级别都可以解决不同的并发问题(蓝色标注“√”代表存在并发问题):

        MySQL知识体系——事务

MVCC(Multi-Version Concurrency Control 多版本并发控制)

    MVCC的本质,是多版本共存。

    不同的数据库实现MVCC的方式是不一样的,因为MVCC没有一个统一的实现标准。在这我们只讨论 InnoDB 的实现方式。

InnoDB实现

    InnoDB的聚集索引有 3 个隐藏字段,分别是:

  1. DB_ROW_ID 行ID,主键(RowID)
  2. DATA_TRX_ID 事务的ID号,用来表示指针以实现快照读。对应于系统版本号(MVCC 核心)
  3. DATA_ROLL_PTR 滚动指针,Undo Log 的指针(隔离核心)

还有一个DELETE BIT 位,作为索引删除标记(当删除时,不会立即删除,而是打标记,然后异步删除)

    InnoDB事务以排它锁(悲观锁的一种实现)的方式修改原始数据,把修改前的数据存放于 Undo Log,通过回滚指针与数据关联,如果修改成功,什么都不做,如果修改失败,则将数据从 Undo Log 中恢复。

    下面是对数据进行UPDATE操作的示意图:

    MySQL知识体系——事务

    在可重读Repeatable reads事务隔离级别下: 

  • SELECT时,读取创建版本号<=当前事务版本号,删除版本号为空或>当前事务版本号。 
  • INSERT时,保存当前事务版本号为行的创建版本号。 
  • DELETE时,保存当前事务版本号为行的删除版本号。 
  • UPDATE时,插入一条新纪录,保存当前事务版本号为行创建版本号,同时保存当前事务版本号到原来删除的行。

 

    通过MVCC,虽然每行记录都需要额外的存储空间,更多的行检查工作以及一些额外的维护工作,但可以减少锁的使用,大多数读操作都不用加锁,读数据操作很简单,性能很好,并且也能保证只会读取到符合标准的行,也只锁住必要行。

共享锁和排他锁

    共享锁(S):允许一个事务去读一行,阻止其他事务获得相同的数据集的排他锁。即被锁对象可以被任何事务读,但是拒绝写。

    排他锁(X):允许获得排他锁的事务更新数据,但是阻止其他事务获得相同数据集的共享锁和排他锁。即被锁对象只能被锁的持有者修改,其他事务不可读和写。

    共享锁和排他锁都是是悲观锁不同的实现,都属于悲观锁的范畴。在InnoDB中,UPDATE/INSERT/DELETE操作都会自动加排他锁,普通的SELECT语句不会加任何锁,如果想加锁,可以使用下面方式:

SELECT * FROM table_name WHERE id = 1 LOCK IN SHARE MODE; -- 显式加共享锁
SELECT * FROM table_name WHERE id = 1 FOR UPDATE; -- 显式加排他锁

    有人认为InnoDB是乐观锁的方式实现了MVCC,现在看来这一说法可能是片面的。对于保证一致性,MVCC是理想化的乐观锁解决方案,但是MySQL的业务场景非常复杂,同时乐观锁也并不是一定优于悲观锁,比如在写操作的时候采用乐观锁(如版本号机制),其效率未必优于使用排他锁实现。

总结

    对于MySQL事务的认识,可以让开发者在工作中避免很多深藏不露的BUG,同时也可以灵活运用数据库的设计思想,解决实际遇到的问题。通过InnoDB对于MVCC思想的实践,可以知道,许多技术、思想、机制等等并不一定非要有个优劣排名,适合的才是最好的,正如JVM的分代垃圾回收,对于不同的内存区域,采用适合的GC机制。

May you find the future that suits you best.

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
MySQL数据库InnoDB存储引擎Log漫游(1)
作者:宋利兵来源:MySQL代码研究(mysqlcode)0、导读本文介绍了InnoDB引擎如何利用UndoLog和RedoLog来保证事务的原子性、持久性原理,以及InnoDB引擎实现UndoLog和RedoLog的基本思路。00–UndoLogUndoLog是为了实现事务的原子性,
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这