推荐:SQL语句执行顺序相关问题。
MySQL Server架构
分层概述
MySQL Server架构可抽象为3层。
- 连接层:验证用户名密码,认证成功后,获取当前账号的权限并缓存,并分配TCP连接池和线程池资源。
- 处理层:实现核心的处理功能。
- 存储层:将处理后的数据高性能安全的写入磁盘,或从磁盘中正确的读取。
模块构成与执行顺序
- 连接层 :提供多个线程用于客户端和服务器交互,连接层包含连接池与线程池。
- 连接池:MySQL可以有多个客户端进行连接,为了解决TCP连接频繁创建销毁引起的性能损耗,所以建立了TCP连接池,采用长连接模式复用TCP连接。
- 线程池:MySQL采用多线程的方式运行,MySQL Server也会分配一个线程来处理后面的流程,像TCP连接池一样,为了避免开销,也会创建一个线程池。
- SQL接口:接收SQL指令,返回查询结果。
- 缓存缓冲区:使用键值对的方式缓存查询的结果(由于命中率太低在8的版本中被废弃)。
- 解析器:对SQL语法进行分析,让程序读懂SQL。将SQL语句分解,验证权限,创建为语法树,如果SQL语法错误,也是在这一步给的提示。流程如下:词法分析->语法分析->分析机->抽象语法树。
- 优化器:对SQL的执行进行优化,进行查询时,根据索引和SQL的情况,选择最合适的查询策略,这个模块是最复杂的模块。
- 可插拔存储引擎: 存储引擎(InnoDB,MyISAM等)用于规范数据如何被高效安全的读写。可插拔主要体现在针对库或者表可以进行引擎切换,结合日志模块 (老生常谈的Bin、Relay、Redo、Undo、Error、General、Slow这些)生成相关日志。
- 文件系统:这是操作系统层的东西,数据不是无脑存储到磁盘上的,需要文件系统的约束,它提供了对存储设备的访问、分配、保护和检索文件的方法,文件系统诸如NTFS,EXFAT,FAT32,NFS、NAS,EXT2、EXT3。
data文件相关
InnoDB引擎.frm、.idb、.opt文件是什么?
MySQL登录成功后使用SHOW VARIABLES LIKE 'datadir';
,或者Linux系统下查看vim /etc/my.cnf
,找datadir项,可查看数据存储的目录。认准一个使用InnoDB引擎的非空数据库,在datadir/数据库名的目录下会发现有.frm、.idb文件、.opt类型的文件。
- .frm 存储表结构的数据。
- .idb用于存储数据(5.7及以上默认使用,8的版本只有.idb,把idb和.frm进行了合并)。
- .opt,通常叫做db.opt,纯文本,用于存储字符集编码排序规则那套东西:例如default-character-set=utf8mb4;default-collation=utf8mb4_unicode_ci;(8的版本已去除)
InnoDB引擎.idb与ibdata1文件版本差异
注意mysql5.5.7到5.6.6的版本中的数据,是放在data/ibdata1文件中的。
.idb叫做独立表空间,ibdata1叫做系统表空间。
使用show variables like 'innodb_file_per_table';
可查看相关配置,如果是OFF,则表示使用ibdata1文件。ON表示使用独立表空间。
MyISAM引擎.frm、.MYD、.MYI、.opt文件是什么的?
MySQL登录成功后使用SHOW VARIABLES LIKE 'datadir';
,或者Linux系统下查看vim /etc/my.cnf
,找datadir项,可查看数据存储的目录。认准一个使用InnoDB引擎的非空数据库,在datadir/数据库名的目录下会发现有.frm、.MYD、.MYI、.opt文件类型的文件。
- .frm 存储表结构的数据(在8的版本变成了.sdi)。
- .MYD,用于存数据。
- .MYI,用于存储索引。
- .MYD、.MYI合并到一起,相当于InnoDB引擎的idb文件。
- .opt,通常叫做db.opt,纯文本,用于存储字符集编码排序规则那套东西:例如default-character-set=utf8mb4;default-collation=utf8mb4_unicode_ci;(8的版本已去除)。
data下的各种日志,会在另一篇文章中讲。
既然有了information_schema 库来存储元数据,为什么还要.frm和.opt?
information_schema库,用于存储数据库的结构、表、视图、列、约束、索引等信息的元数据,同时.frm和.opt也存储了一份元数据,这也是问题的由来。
侧重定位不同,information_schema 数据库是一个用于快速检索元数据的库,方便开发者进行元数据分析和操作,而.frm是专门服务于表结构的,MySQL本身玩的就是数据,适当的冗余不见得是坏事。
information_schema的部分数据基于.frm、.opt,还是独立维护?
部分基于.frm、.opt。
试试就知道,开了一个虚拟机找一个测试库,.frm非文本文件没法改,修改某个库的.opt文件,将default-collation=utf8mb4_unicode_ci;改为default-collation=utf8mb4_general_ci;重启MySQL服务,执行SELECT * FROM information_schema.SCHEMATA WHERE SCHEMA_NAME = 'db_name';
发现编码同步做了更改。
扩展
MySQL8对缓存缓冲区的移除
缓存缓冲区和Redis在项目中作用与用法相似,用于缓存查询语句查询出来的结果,key为SQL语句,val为数据,使用空间换时间,里面涉及表缓存,记录缓存,权限缓存等。
此模块在8的版本中移除,因为命中率太低。如果查询请求包含某些系统函数(now()),或者一些系统库(如mysql、information_schema、performance_schema)那么请求就不会被缓存。是缓存就会有一致性的问题,mysql会监听每一张表的写操作(DDL,DML),如果发生了变更,将会删除缓存。其次是对于复杂的业务,不会只有读操作,这也是分表冷热数据分离的原因之一,所以被移除掉了。
客户端连接器
连接器属于客户端(MySQL Client、Navicat、PHP的PDO,Java的JDBC等)的组件,所以放到了这里。用于和MySQL Server通信。一般是有TCP和Socket两种通信方式(与PHP与Nginx通信方式类似)。
- TCP就是常见的IP端口号的方式。
- Socket就是UNIX套接字,一种本地通信方式。在linux中创建一个套接字文件(.sock文件),客户端通过该文件与服务器通信。与TCP/IP相比,使用UNIX域套接字可以更快地进行本地通信,因为不需要经过网络协议栈的处理。但是因为无法远程的局限性,所以用得少,对PHP开发者来说,PDO和主流框架,都支持此连接方式。
查询缓存命中率
执行show status like 'Qcache%';
会得到一个kv格式的表格
Qcache_free_blocks: 查询缓存中空闲的内存块数量。
Qcache_free_memory: 查询缓存中可用的内存大小。
Qcache_hits: 查询缓存命中的次数,即从查询缓存中成功获取到结果的查询次数。
Qcache_inserts: 查询缓存中插入的查询次数。
Qcache_lowmem_prunes: 由于内存不足而从查询缓存中移除的查询次数。
Qcache_not_cached: 由于不符合查询缓存规则而没有被缓存的查询次数。
Qcache_queries_in_cache: 当前查询缓存中缓存的查询数量。
Qcache_total_blocks: 查询缓存中的内存块总数量。
数据库缓冲池
InnoDB是依靠页来管理存储空间的,CRUD的操作是对页面的读写。因为磁盘IO操作慢,内存操作快,所以MySQL Server会使用内存来作为数据缓冲池,真正访问页之前,需要把磁盘上的页缓存到内存中的Buffer Pool后才可以访问,用于提升MySQL的性能。
流程:当数据库系统需要从磁盘读取数据时,它首先检查缓冲池中是否已经缓存了相应的数据页。如果数据页已经在缓冲池中,则不需要从磁盘读取,而是直接从缓冲池中获取数据,这样可以大大提高数据检索速度。
缓冲池的数据有数据页、索引页、锁数据、和数据字典。
配置缓冲池
MyISAM:缓冲池和innodb的不一样,是键缓存,参数为key_buffer_size;
查看:SHOW VARIABLES LIKE 'key_buffer_size'; SHOW STATUS LIKE 'Key_blocks_%';
单位为字节。
配置:在my.cnf中配置key_buffer_size = 256M
后重启。
InnoDB:
查看:SHOW VARIABLES LIKE 'innodb_buffer_pool_size';
单位为字节。
配置:在my.cnf中配置innodb_buffer_pool_size = 256M
后重启。
不想要重启,可以使用set globak k=v,(5.7及以上可用)。但是无法持久化保存。
多个缓冲池
在多线程情况下,访问buffer pool中的数据需要加锁处理,对于并发量打的情况下,加锁会影响处理速度,所以就考虑到拆分buffer pool的情况,用于提高并发处理的能力。每个buffer pool被称为一个实例,他们是独立的,独立的申请内存,独立的管理数据。
查看:SHOW VARIABLES LIKE 'innodb_buffer_pool_instances';
配置:在my.cnf中配置innodb_buffer_pool_instances= 2
后重启。
每个buffer_size为innodb_buffer_pool_size / innodb_buffer_pool_instances;
当innodb_buffer_pool_size<=1GB时,设置多个实例是无效的。
执行SQL时更新了缓冲池的数据,这些数据会实时同步到磁盘吗?
不会。
对数据表中的记录进行修改时,首先会修改缓冲池中的数据,然后会以一定的频率刷新到磁盘上,也不是每次更新操作都会把数据刷新到磁盘。缓冲池会采用一个叫做checkpoint的方式将更改的数据(脏页数据)写入到磁盘,此操作用于提升数据库的性能。
InnoDB与MyISAM区别
项目 | InnoDB | MyISAM |
---|---|---|
事务 | 支持 | 不支持 |
外键 | 支持(但不支持跨引擎) | 不支持 |
最小锁粒度 | 行锁 | 表锁 |
日志 | 支持redo、undo、bin log | 支持bin log |
聚簇索引 | 支持 | 不支持 |
二级索引叶子节点存储 | 索引值与主键 | 索引值与所在行地址 |
适用场景 | 高并发,事务,金融 | 节省资源,轻量级简单业务 |
count(*)统计算法 | 逐行遍历,时间复杂度O(n) | 内部自动维护,时间复杂度O(1) |