首页 > 数据库 >【MySQL】实战教程笔记

【MySQL】实战教程笔记

时间:2022-10-16 12:00:08浏览次数:53  
标签:教程 log 事务 笔记 索引 MySQL 日志 redo 主键

序言

感谢林晓斌老师,感谢他的教程:https://funnylog.gitee.io/mysql45/

MySQL 的基础架构

主要分为两层

服务层

  • 连接器:管理连接,验证权限。尽量使用长连接
  • 查询缓存:对一个表的更新会清空这个表上的所有查询缓存。(8.0去掉缓存了)
  • 分析器:词法分析和语法分析
  • 优化器:选择索引
  • 执行器:

存储引擎层

现在默认使用InnoDB

日志系统

redo log 重做日志

为了效率,MySQL采用WAL(write-ahead logging),先写日志再写入磁盘。

redo log是InnoDB存储引擎的概念,具体来说就是在更新记录时,先记录redo log,更新内存,这个时候就算更新成功了,然后再空闲的时候将操作记录更新到磁盘。

InnoDB的redo log是固定大小的,通过记录write pos和checkpoint进行循环读写。write pos是日志当前要写入的位置,checkpoint是当前要擦除的位置,当然,在擦除之前要将记录更新到数据文件。

innodb_flush_log_at_trx_commit这个参数设置成1的时候,表示每次事务的redo log都直接持久化到磁盘,这样可以保证MySQL异常重启之后数据不丢失,实现crash-safe的能力。

binlog 归档日志

binlog是MySQL服务层的概念,与redo log的区别在于:

  • binlog是逻辑日志,记录语句的原始逻辑,有两种方式:记录sql语句或者记录更新前后的状态。redo log是物理日志,记录在某个数据页上做了什么修改。
  • binlog可以追加写入,不会覆盖之前的。redo log是循环写的。

redo log的两阶段提交

更新数据时,redo log采用 两阶段提交 是为了保持两份日志的逻辑一致。
具体步骤为:

  • 【执行器】取行数据
  • 【存储引擎】返回行数据(如果在数据页内存中直接返回,否则从磁盘中取)
  • 【执行器】修改行数据,调用引擎接口写入行数据
  • 【存储引擎】更新行数据到内存,将操作记录更新到redo log,此时redo log处于prepare状态,告知执行器完成
  • 【执行器】生成binlog,将binlog写入磁盘,调用引擎的提交事务接口,将redo log改为commit状态,更新完成。

如果两份日志不一样,会出现的问题,例如:

  • 在数据恢复时,通过数据库全量备份+binlog重放来恢复到某个时刻的数据,如果两个日志不一致,就会导致数据与原库不同。
  • 扩容的时候,也就是需要再多搭建一些备库来增加系统的读能力的时候,现在常见的做法也是用全量备份加上应用binlog来实现的,这个“不一致”就会导致你的线上出现主从数据库不一致的情况。

事务隔离

事务的支持是在引擎层实现的。

事务的隔离级别

  • 读未提交。一个事务未提交时,它所作的变更就会被其它事务看到。
  • 读已提交。一个事务提交后,它所做的变更才会被其它事务看到。
  • 可重复读。一个事务执行过程中看到的数据总是和事务开始时的一致。
  • 串行化

实现时,数据库会创建视图,访问时以视图的结果为准。

  • 可重复读级别的视图在事务开始时创建
  • 读已提交级别的视图在每个SQL语句开始执行时创建
  • 读未提交级别没有视图概念,直接读取记录的最新值
  • 串行化通过加锁实现

隔离的实现

可重复读为例,不同时刻的事务有不同的read-view。同一条记录在系统中存在多个版本,就是数据库的多版本并发控制(MVCC)
每条记录在更新时都会记录回滚操作,通过回滚日志可以得到之前状态的值。

注意,只有在系统中不存在更早的read-view时,对应的回滚日志才会删除,因此长事务会导致回滚日志占用大量空间。
通过显式启动事务语句可以避免无意中导致的长事务,也就是begin-commit-rollback。

索引

索引的模型

  • 哈希表:没有顺序,只能等值查询
  • 有序数组:可以等值和范围查询,但是更新麻烦,适用于静态存储引擎
  • 二叉树/多叉树

数据库底层存储的核心就是基于这些数据模型的。每碰到一个新数据库,我们需要先关注它的数据模型,这样才能从理论上分析出这个数据库的适用场景。

InnoDB的索引

在创建或设置主键时,mysql会自动添加一个与主键对应的唯一索引,不需要额外的操作。

在InnoDB中,表都是根据主键顺序以索引的形式(B+树)存放的,这种称为索引组织表。

  • 主键索引叶子节点存放的是行数据,在InnoDB中又称为聚簇索引
  • 非主键索引叶子节点是主键的值,在InnoDB中又称为二级索引

不难想到,主键查询方式只需要查询一棵树,而普通索引查询方式需要先查普通索引的树,得到主键的值,再查主键索引的树。
因此,应尽量使用主键查询。

在创建表时,KEY 和 INDEX 是同义词,都用来创建索引。

索引的维护

注意考虑以下几点:

  • 维护索引时可能会导致数据页的分裂与合并,而自增主键只涉及追加操作,不会导致页分裂;
  • 普通索引的叶子节点会存放主键索引的值,因此主键长度越小,普通索引的叶子节点就越小,普通索引占用的空间也就越小。

覆盖索引

在查询过程中,需要回到主键索引树进行搜索获取数据的过程称为回表

而如果一个索引中包含了要查询的数据,无需回表就可以直接满足查询需求,则称之为覆盖索引
显然,使用覆盖索引可以减少搜索次数,提升查询速度,是一种优化手段。

考虑到覆盖索引的好处,那么就会想到建立更多的覆盖索引,而由多个字段组成的联合索引可以很好地满足各种查询的需求。
不过索引的维护有代价,需要权衡。

例如,下表有了name_age索引,就可以直接通过name查到age的值。

CREATE TABLE `tuser` (
  `id` int(11) NOT NULL,
  `id_card` varchar(32) DEFAULT NULL,
  `name` varchar(32) DEFAULT NULL,
  `age` int(11) DEFAULT NULL,
  `ismale` tinyint(1) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `id_card` (`id_card`),
  KEY `name_age` (`name`,`age`)
) ENGINE=InnoDB

在创建联合索引时,索引项是根据定义中的字段顺序进行排序的,因此具有最左前缀原则
也就是说,只有查询条件中包含第一个(最左)字段,才可以使用联合索引。

联合索引不仅可以通过最左前缀原则定位记录,还可以通过索引下推过滤记录(MySQL 5.6),减少回表次数。
在索引遍历过程中利用索引中包含的字段先做判断,过滤掉不满足条件的记录。
例如,name_age索引可以利用age字段做过滤,减少回主键索引搜索的次数。

MySQL里面的锁包括:全局锁,表锁和行锁。

全局锁

对整个数据库加锁,其它线程的数据更新语句(增删改)、数据定义语句(建表、修改表结构等)和更新类事务的提交语句会被阻塞。

加全局读锁的方法:Flush tables with read block(FTWRL)

使用场景:做全库逻辑备份。防止备份的时候不同表的逻辑时间点不一致。

但是让全库只读可能存在问题:

  • 备份主库,期间不能更新;
  • 备份从库,不能执行主库binlog,导致主从延迟。

解决方法:使用官方逻辑备份工具mysqldump的-single-transaction参数,会启动一个事务确保一致性视图,依靠MVCC的支持,在整个过程中数据是可以正常更新的。但是要求所有表使用支持可重复读隔离级别的引擎,而MyISAM就不支持。

另外,使用 set global readonly=true 也可以让全库只读,但是 readonly 有其他用途,修改 global 变量的影响更大,不建议使用。而且如果使用FTWRL后客户端异常断开,MySQL会自动释放全局锁。

表级锁

MySQL 中表级别的锁有两种,分别是表锁和元数据锁(Meta data lock, MDL)。

表锁:

使用方法:lock tables ... read/write,可以用 unlock tables 主动释放锁。

对于使用 InnoDB 这种支持行锁的引擎,一般不使用表锁来控制并发。

MDL:

不需要显式使用,对表增删改查时自动加 MDL读锁,对表结构变更时,自动加 MDL写锁。

  • 读锁之间不互斥;
  • 读写锁之间、写锁之间互斥。

问题:如果一个申请写锁的请求被阻塞,之后所有申请读锁的请求也会被阻塞,使整个表不可读写。

解决方法:上面的问题在于长事务,事务不提交就会一直占着MDL锁。所以,

  • 手动 kill 长事务或者暂停当前的 DDL
  • 在 alter 语句中设置等待时间,超时后放弃

标签:教程,log,事务,笔记,索引,MySQL,日志,redo,主键
From: https://www.cnblogs.com/tofengz/p/16728319.html

相关文章

  • Mysql单表访问方法,索引合并,多表连接原理,基于规则的优化,子查询优化
    参考书籍《mysql是怎样运行的》非常推荐这本书,通俗易懂,但是没有讲mysql主从等内容书中还讲解了本文没有提到的子查询优化内容,本文只总结了常见的子查询是如何优化的系......
  • kubernetes学习笔记4-pod
    Pod资源定义​自主式pod资源,很少用到,手动创建的资源,用kubectldelete后不会自动创建,而使用pod控制器管理的才会按照用户期望的重新创建;​资源清单:一级字段(apiVersion|kind|m......
  • 初学者安装Anconda环境配置的pycharm教程
    1.Anaconda下载地址:Anaconda|IndividualEdition双击下载好的 Anaconda2-5.2.0-Windows-x86_64.exe文件,点击 Next 即可。点击 IAgree (我同意)Installfor:Just......
  • 详解降维-主成分分析-概率角度(Probabilistic PCA)【白板推导系列笔记】
    教科书对PCA的推导一般是基于最小化重建误差或者最大化可分性的,或者说是通过提取数据集的结构信息来建模一个约束最优化问题来推导的。事实上,PCA还有一种概率形式的推导,那......
  • 详解支持向量机-硬间隔SVM-模型定义【白板推导系列笔记】
    支撑向量机(SVM)算法在分类问题中有着重要地位,其主要思想是最大化两类之间的间隔。按照数据集的特点:1. 线性可分问题,如之前的感知机算法处理的问题2. 线性可分,只有一点......
  • Entity Framework教程-模型(Models)
    更新记录转载请注明出处:2022年10月16日发布。2022年10月10日从笔记迁移到博客。模型基础实体对象模型说明(EntityDataModel)EF使用实体对象模型进行增删改查(CRU......
  • AD笔记总结
    原理图要点:1、新建工程,新建的project是要以后缀PrjPCB2、新建原理图、PCB,右键project,进行New添加3、新建原理图库、PCB库,右键project,进行new添加改变单位显示:View......
  • MySQL-8.0版本的docker-compose安装脚本(单实例)
    1.需求场景在开发和测试环境中,或者研究型的环境,对于数据库的安全和稳定性可以稍低一些,那么我们可以通过docker快速部署MySQL服务,降低部署的时间成本。2.脚本2.1目录......
  • 笔记本外接显卡方案
    前言本博客的上一篇文章更新于2021年2月,距今已经有一年半了。这一年半我一切正常,没有经历任何糟糕的事情,一直没更新纯粹是因为太忙。一年半的高压下来,我的心态也变化了不......
  • Sentinel安装教程【Linux+windows】
    一、Sentinel的简介Sentinel是阿里巴巴出品的一款流控组件,它以流量为切入点,在流量控制、断路、负载保护等多个领域开展工作,保障服务可靠性。如果你学过netflix公司旗下......