聚集索引与非聚集索引的区别
https://zhuanlan.zhihu.com/p/113917726
Myisam引擎采用非聚集索引,索引与数据分开,叶子结点存放数据的地址。
Innodb采用聚集索引,主键索引树的叶子结点存放真实数据,非主键索引树的叶子结点存放主键值
索引底层的实现,为什么不选红黑树、B树等?
总结
(1)哈希表 没法实现范围查找
(2)二叉搜索树 可以实现范围查找,但自增主键导致树退化为链表,查找效率由O(logn)变为O(n)
(3)红黑树 利用旋转调整树的平衡性,但不是绝对平衡,因为自增主键会导致树向右倾斜。
(4)AVL树 绝对平衡,查找效率为O(logn)。但树偏高,磁盘的IO次数还是很多。因此需要在每一层多存一点数据。
(5)B树 结点直接存放数据,查找效率为O(h*logn),其中 h 为树高,n 为每个结点关键词的个数。
(6)B+树 非叶子节点存放索引地址,因为每一层可以存放更多的关键词,查询效率更高。叶子节点存放真实数据且,叶子结点之间用链表连接起来,范围查找效率更高。
就拿命中索引的说吧,innodb主键是聚簇索引,采用b+树结构,非叶节点存的是主键和指向子节点的指针,叶子节点存的就是整体行数据,整体都是有序的,通过主键扫描根据树查找,最终落到叶子节点,命中然后返回。(其实更细的有mysql的一页有16kb,一页其实有多行记录,命中一页之后还要通过行记录索引通过二分找到行记录)
索引为什么能提高查询性能
数据库的隔离级别
(1)每种级别解决什么问题,还会存在什么问题
Read Uncommitted(读取未提交内容)
在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少。读取未提交的数据,也被称之为脏读(Dirty Read)。
Read Committed(读取提交内容)
这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。它满足了隔离的简单定义:一个事务只能看见已经提交事务所做的改变。这种隔离级别 也支持所谓的不可重复读(Nonrepeatable Read),因为同一事务的其他实例在该实例处理其间可能会有新的commit,所以同一select可能返回不同结果。
Repeatable Read(可重读)
这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。不过理论上,这会导致另一个棘手的问题:幻读 (Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB和Falcon存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。
Serializable(可串行化)
这是最高的隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争。这四种隔离级别采取不同的锁类型来实现,若读取的是同一个数据的话,就容易发生问题。例如:
- 脏读(Drity Read):某个事务已更新一份数据,另一个事务在此时读取了同一份数据,由于某些原因,前一个RollBack了操作,则后一个事务所读取的数据就会是不正确的。
- 不可重复读(Non-repeatable read):在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新的原有的数据。
- 幻读(Phantom Read):在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在此时插入了新的几列数据,先前的事务在接下来的查询中,就有几列数据是未查询出来的,如果此时插入和另外一个事务插入的数据,就会报错。
最左前缀匹配原则
最左前缀匹配原则:在检索数据时从联合索引的最左边开始匹配
创建一个(a,b)的联合索引,where条件中a=1 and b=2 或者是b=2 and a=1都会走联合索引(查询优化器会更改顺序)
为什么直接使用b=2走不到联合索引?
联合索引(a,b)的索引树:
a在等值的情况下,b值才是按顺序排列的。即a在索引全局内有序,而b只在局部有序。
这是因为MySQL创建联合索引的规则是首先会对联合索引的最左边第一个字段排序,在第一个字段的排序基础上,然后在对第二个字段进行排序。所以仅仅是b=2这种查询条件没有办法利用联合索引。
为什么要建立联合索引?
- 联合索引(a,b,c)相当于建立了(a)、(a,b)、(a,b,c)三个索引,能够减少索引文件的大小。
- 在某些情况下,可以避免回表操作。比如select a,b,c from table where a=1 and b=1 and c=1;
- 在开启索引下推的基础上,联合索引可以避免绝大多数的回表操作。
怎么判断执行器具体选择了联合索引哪一部分?
从explain内的key_len字段中
日志部分
undo日志和redo日志分别是干嘛的?
redo log重做日志是InnDB存储引擎层的,用来保证事务安全。在事务提交之前,每个修改操作都会记录变更后的数据,保存的是物理日志-数据,防止发生故障的时间点,有脏页未写入磁盘,在重启mysql的时候,根据redo log进行重做从而达到事务的持久性
undo log回滚日志保存了事务发生之前的数据的一个版本,可以用于回滚,同时也提供多版本并发控制下的读。