一、存储引擎定义
存储引擎是MySQL数据库的组件,负责执行实际的数据IO操作(数据的存储和提取)。工作在文件系统之上,数据库的数据会先传输到存储引擎,再按照存储引擎的存储格式保存到文件系统。
常用的存储引擎:InnoDB MyISAM
二、 MyISAM和InnoDB
MyISAM
1、MyISAM相关特性
- MyISAM不支持事务,也不支持外键约束,只支持全文索引,数据文件和索引文件是分开保存的。
- 访问速度快,对事务完整性没有要求
- MyISAM 适合查询、插入为主的应用
- MyISAM在磁盘上存储成三个文件,文件名和表名都相同,但是扩展名分别为:
.frm文件存储表结构的定义
数据文件的扩展名为MYD(MYData
索引文件的扩展名是MYI(MYIndex)
- 表级锁定形式,数据在更新时锁定整个表
- 数据库在读写过程中相互阻塞(会在数据写入的过程阻塞用户数据的读取,也会在数据读取的过程中阻塞用户的数据写入)
- 数据单独写入或读取,速度过程较快且占用资源相对少
- MyIAM支持的存储格式:静态表、动态表、压缩表
2、MyISAM 表支持 3 种不同的存储格式
(1)静态(固定长度)表
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态表多。
(2)动态表
动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
(3)压缩表
压缩表由 myisamchk 工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
3、MyISAM适用的生产场景举例
- 公司业务不需要事务的支持
- 单方面读取或写入数据比较多的业务
- MyISAM存储引擎数据读写都比较频繁场景不适合
- 使用读写并发访问相对较低的业务
- 数据修改相对较少的业务
- 对数据业务一致性要求不是非常高的业务
- 服务器硬件资源相对比较差
InnoDB
1、InnoDB特点介绍
- 支持事务,支持4个事务隔离级别
- MySQL从5.5.5版本开始,默认的存储引擎为InnoDB
- 读写阻塞与事务隔离级别相关
- 能非常高效的缓存索引和数据
- 表与主键以簇的方式存储
- 支持分区、表空间,类似oracle数据库
- 支持外键约束,5.5前不支持全文索引,5.5后支持全文
- 对硬件资源要求还是比较高的场合
- 行级锁定,但是全表扫描仍然会是表级锁定,如update table set a=1 where user like %zhang%;
注:
- 使用like进行模糊查询时,会进行全表扫描,锁定整个表。
- 对没有创建索引的字段进行查询,也会进行全表扫描锁定整个表。
- 使用索引进行查询,则是行级锁定。
2、InnoDB适用生产场景分析
- 业务需要事务的支持。
- 行级锁定对高并发有很好的适应能力,但需确保查询是通过索引来完成。
- 业务数据更新较为频繁的场景。如:论坛,微博等。
- 业务数据一致性要求较高。如:银行业务。
- 硬件设备内存较大,利用InnoDB较好的缓存能力来提高内存利用率,减少磁盘IO的压力。
3、企业选择存储引擎依据
1、需要考虑每个存储引擎提供了哪些不同的核心功能及应用场景
2、支持的字段和数据类型。
所有引擎都支持通用的数据类型。
但不是所有的引擎都支持其它的字段类型,如二进制对象
3、锁定类型:不同的存储引擎支持不同级别的锁定
表锁定: MyISAM 支持
行锁定:InnoDB 支持
4、索引的支持
建立索引在搜索和恢复数据库中的数据时能显著提高性能
不同的存储引擎提供不同的制作索引的技术
有些存储引擎根本不支持索引
5、事务处理的支持
提高在向表中更新和插入信息期间的可靠性
可根据企业业务是否要支持事务选择存储引擎
4、MyISAM 和 InnoDB 的区别
MyISAM:不支持事务、外键约束;支持全文索引;锁定类型只支持表级锁定;适合单独的查询和插入的操作;读写会相互阻塞;硬件资源占用较小;数据文件和索引文件是分开存储的,存储成三个文件:表结构文件.frm、数据文件.MYD、索引文件.MYI
使用场景:适用于不需要事务支持,单独的查询或插入数据的业务场景
InnoDB:支持事务、外键约束;也支持全文索引;锁定类型支持行级锁定(在全表扫描时仍会表级锁定);读写并发能力较好;缓存能力较好可以减少磁盘IO的压力;数据文件也是索引文件,存储成:表结构文件.frm、表空间文件.ibd
使用场景:适用于需要事务支持,数据一致性要求较高,数据会频繁更新,读写并发高的业务场景
InnoDB行锁与索引的关系:
InnoDB的行级锁是通过给索引项加锁来实现的。如果对没有索引的字段进行操作会使用全表扫描并表级锁定。
三、MySQL 查询数据的执行过程:
1)客户端向 MySQL 服务器发送一条查询请求,连接器负责处理连接,并进行身份验证和权限控制。
2)MySQL 先检查查询缓存,如果命中缓存,则立刻返回存储在缓存中的结果;否则使用查询解析器进行SQL语句解析、预处理,再由优化器生成对应的执行计划。
3)MySQL 根据执行计划,调用存储引擎来执行查询。
4)将结果返回给客户端,同时缓存查询结果。
四、存储引擎管理操作
1、查看存储引擎
show create table 表名;
show table status [from 库名] where name = '表名';
2、修改存储引擎
alter table 表名 engine=innodb/myisam; #针对已存在的表修改存储引擎
create table 表名 (....) engine=innodb/myisam; #新建表时指定存储引擎
set global/session default_storage_engine=innodb/myisam; #设置默认存储引擎
vim /etc/my.cnf
default_storage_engine=INnoDB/MyISAM
修改默认存储引擎
或者
vim /etc/my.cnf
3、行锁定
InnoDB的行级锁是通过给索引项加锁来实现的。如果对没有索引的字段进行操作会使用全表扫描并表级锁定。
五、死锁问题
是指两个或两个以上的事务在执行过程中,因争夺锁资源而造成的一种互相等待的现象,若无外力作用,事务都将无法继续运行。此时称系统处于死锁状态或系统产生了死锁。
事务A | 事务B |
begin; | begin; |
delete from student where id=2;#事务结束前,id=2的行会被锁定 | |
select * from t1 where id=1 for update; #加排他锁,模拟并发情况,锁定id=1的行 | |
delete from t1 where id=1; #死锁产生 | |
update t1 set name='abc' where id=2; #死锁产生。因为会话1中id=5的行还在删除过程中,该行已被锁定 | |
rollback; #回滚,结束事务。id=5的行被解锁 | |
update t1 set name='abc' where id=2; #成功更新数据 |
如何避免死锁?
1)设置事务的锁等待超时时间 innodb_lock_wait_timeout
2)设置开启死锁检测功能 innodb_deadlock_detect
3)为表建立合理的索引,减少表锁发生的概率
4)如果业务允许,可以降低隔离级别,比如选用 提交读 Read Committed 隔离级别,从而避免间隙锁导致死锁
5)建议开发人员尽量使用更合理的业务逻辑,比如多表操作时以固定顺序访问表,尽量避免同时锁定多个资源
6)建议开发人员尽量保持事务简短,减少对资源的占用时间和占用范围
7)建议开发人员在读多血少的场景下采用乐观锁机制