首页 > 数据库 > 【博学谷学习记录】超强总结,用心分享。数据库的重要知识点。

【博学谷学习记录】超强总结,用心分享。数据库的重要知识点。

时间:2022-12-18 21:00:45浏览次数:43  
标签:知识点 事务 博学 Tree 查询 索引 超强 失效 数据库

一. 数据库事务

 

1.务特性

 

原子性:即不可分割性,事务要么全部被执行,要么就全部不被执行。一致性:事务的执行使得数据库从一种正确状态转换成另一种正确状态

隔离性:在事务正确提交之前,不允许把该事务对数据的任何改变提供给任何其他事务,

持久性:事务正确提交后,其结果将永久保存在数据库中,即使在事务提交后有了其他故障,事务的处理结果也会得到保存。


 

2.离级别

 

 

(1)读未提交(read Uncommited):

在该隔离级别,所有的事务都可以读取到别的事务中未提交的数据,会产生脏读问题,在项目中基本不怎么用,  安全性太差;

(2) 读已提交(read commited):

这是大多数数据库默认的隔离级别,但是不是 MySQL 的默认隔离级别;这个隔离级别满足了简单的隔离要求:一个事务只能看见已经提交事务所做的改变,所以会避免脏读问题;由于一个事务可以看到别的事务已经提交的数据,于是随之而来产生了不可重复读和虚读等问题(下面详细介绍这种问题,结合问题来理解隔离级别的含义);

(3 ) 可重复读(Repeatable read):

这是 MySQL 的默认隔离级别,它确保了一个事务中多个实例在并发读取数据的时候会读取到一样的数据;不过理论上,这会导致另一个棘手的问题:幻读 (Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB 和 Falcon 存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。(4) 可串行化(serializable):

事物的最高级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争,一般为了提升程序的吞吐量不会采用这个;

 

二. 索引

1.索引的概念和优点

概念:

索引存储在内存中,为服务器存储引擎为了快速找到记录的一种数据结构。索引的主要作用是加快数据查找速度,提高数据库的性能。

优点:

(1)   创建唯一性索引,保证数据库表中每一行数据的唯一性

(2)   大大加快数据的检索速度,这也是创建索引的最主要的原因

(3)   加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。

(4)   在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

 

 

2.索引的分类

(1)     普通索引:最基本的索引,它没有任何限制。


(2)     唯一索引:与普通索引类似,不同的就是索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。

(3)     主键索引:它是一种特殊的唯一索引,用于唯一标识数据表中的某一条记录,不允许有空值,一般用             primary key 来约束。

(4)     联合索引(又叫复合索引):多个字段上建立的索引,能够加速复合查询条件的检索。

(5)     全文索引:老版本 MySQL 自带的全文索引只能用于数据库引擎为MyISAM 的数据表,新版本 MySQL 5.6 的 InnoDB 支持全文索引。默认 MySQL不支持中文全文检索,可以通过扩展 MySQL,添加中文全文检索或为中文内容表提供一个对应的英文索引表的方式来支持中文。

 

 

3.索引的底层实现原理

  1. 索引结构

索引是在 Mysql 的存储引擎(InnoDB,MyISAM)层中实现的, 而不是在服务层实现的. 所以每种存储引擎的索引都不一定完全相同, 也不是所有的存储引擎都支持所有的索引类型的, Mysql 目前提供了以下 4 种索引:

 

 

 

 

B+Tree 索引: 最常见的索引类型, 大部分索引都支持 B+树索引. Hash 索引: 只有 Memory 引擎支持, 使用场景简单.

R-Tree 索引(空间索引): 空间索引是 MyISAM 引擎的一个特殊索引类型, 主要地理空间数据, 使用也很少.

 

S-Full-text(全文索引): 全文索引也是 MyISAM 的一个特殊索引类型, 主要用于全文索引, InnoDB 从 Mysql5.6 版本开始支持全文索引.

 

 

2.BTree 结构

 

B+Tree 是在 BTree 基础上进行演变的, 所以我们先来看看 BTree, BTree 又叫多路平衡搜索树, 一颗 m 叉 BTree 特性如下:


(1)   树中每个节点最多包含 m 个孩子.

 

(2)   除根节点与叶子节点外, 每个节点至少有[ceil(m/2)] 个孩子(ceil 函数指向上取整).

 

(3)   若根节点不是叶子节点, 则至少有两个孩子.

 

(4)   每个非叶子节点由 n 个 Key 和 n+1 个指针组成, 其中 [ceil(m/2) -1 ] <= n <= m-1.以 5 叉 BTree 为例, key 的数量: 公式推导 [ceil(m/2) -1 ] <= n <= m-1.

 

所以 2 <= n <= 4, 中间节点分裂父节点,两边节点分裂.

 

 

 

 

 

3.B+Tree 结构

 

B+Tree 为 BTree 的变种, B+Tree 与 BTree 的区别:

1.B+Tree 的叶子节点保存所有的 key 信息, 依 key 大小顺序排列.

2.B+Tree 叶子节点元素维护了一个单项链表.

 

所有的非叶子节点都可以看作是 key 的索引部分.

 

 

 

 

由于 B+Tree 只有叶子节点保存 key 信息, 查询任何 key 都要从 root 走的叶子. 所以B+Tree 查询效率更稳定.

 

Mysql 中的 B+Tree

MySql 索引数据结构对经典的 B+Tree 进行了优化, 在原 B+Tree 的基础上, 增加了一个指向相邻叶子节点的链表指针, 就形成了带有顺序指针的 B+Tree, 提高区间访问的性能.

 

MySql 中的 B+Tree 索引结构示意图:

 

 

 

4.如何避免索引失效

 

(1)  范围查询,右边的列不能使用索引,否则右边的索引也会失效.

 

索引生效案例

 

 

 

address 索引失效, 因为 status 是大于号, 范围查询.

 

(2)   不要在索引上使用运算,否则索引也会失效.

 

比如在索引上使用切割函数, 就会使索引失效.

 

 

 

(3)  字符串不加引号,造成索引失效.

 

如果索引列是字符串类型的整数, 条件查询的时候不加引号会造成索引失效. Mysql 内置的优化会有隐式转换.

索引失效案例

 

 

 

(4)   尽量使用覆盖索引, 避免 select *, 这样能提高查询效率.

 

如果索引列完全包含查询列, 那么查询的时候把要查的列写出来, 不使用 select *

 

 

(5)  or 关键字连接

 

用 or 分割开的条件, 如果 or 前面的列有索引, or 后面的列没有索引, 那么查询的时候前后索引都会失效

如果一定要用 or 查询, 可以考虑下 or 连接的条件列都加索引, 这样就不会失效了.

 

 

 索引失效案例:

 

 

 

 

三. 数据库锁

 

1. 行锁和表锁

 

1. 主要是针对锁粒度划分的,一般分为:行锁、表锁、库锁

行锁:访问数据库的时候,锁定整个行数据,防止并发错误。表锁:访问数据库的时候,锁定整个表数据,防止并发错误。

2. 行锁 和 表锁 的区别:

表锁: 开销小,加锁快,不会出现死锁;锁定力度大,发生锁冲突概率高,并发度最低

行锁: 开销大,加锁慢,会出现死锁;锁定粒度小,发生锁冲突的概率低,并发度高

 

2. 悲观锁和乐观锁

 

(1) 悲观锁:顾名思义,就是很悲观,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会 block 直到它拿到锁。

传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。

(2)乐观锁: 顾名思义,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制。

乐 观 锁 适用 于 多 读 的 应 用 类型 , 这 样 可 以 提高 吞 吐 量 , 像 数 据库 如 果 提 供 类 似于write_condition 机制的其实都是提供的乐观锁。

 

 

 

四、MySql 优化


1) 定位执行效率慢的 sql 语句.(了解)

 

  命令:show status like 'Com____',通过这条命令, 我们可以知道当前数据库是以查询为主还是更新为主. 如果是查询为主, 就重点查询; 如果增删改多就重点优化写入操作.

 

  explain + sql语句查询sql执行过程, 通过执行计划,我们能得到哪些信息:A:哪些步骤花费的成本比较高

B:哪些步骤产生的数据量多,数据量的多少用线条的粗细表示,很直观C:这条sql语句是否走索引

  show profile分析SQL,可以查看所有sql语句的执行效率(所用时间). 前提是这个命令需要被打开, 严格的说也就是打开这个命令后执行的所有 sql 语句, 它都能记录下执行时间, 并展示出来. 可以通过这个命令分析哪些 sql 语句执行效率低. 耗时长, 就更有针对性的优化这条 sql.

  慢查询日志(常用的工具)

慢 查 询日 志 记 录 了所 有 执 行 时间 超 过 参数 long_query_time 的 sql 语 句 的日 志 , long_query_time 默认为 10 秒(可以通过配置文件设置), 日志保存在 /var/lib/mysql/目录下,有个 slow_query.log 文件,

 

2) 优化索引

 

 

1.1  索引设计原则

 

索引的设计需要遵循一些已有的原则, 这样便于提升索引的使用效率, 更高效的使用索引.  对查询频次较高, 且数据量比较大的表, 建立索引.

  1)索引字段的选择, 最佳候选列应当从 where 子句的条件中提取, 如果 where 子句中的组合比较多, 那么应当挑选最常用, 过滤效果最好的列的组合.

  2)使用唯一索引, 区分度越高, 使用索引的效率越高.

       3) 索引并非越多越好, 如果该表赠,删,改操作较多, 慎重选择建立索引,  过多索引会降低表维护效率.

  4)  使用短索引, 提高索引访问时的 I/O 效率, 因此也相应提升了 Mysql 查询效率.

  5) 如果 where 后有多个条件经常被用到, 建议建立符合 索引, 复合索引需要遵循最左前缀法则, N 个列组合而成的复合索引, 相当于创建了 N 个索引.

复合索引命名规则 index_表名_列名 1_列名 2_列明 3

比如:create index idx_seller_name_sta_addr on tb_seller(name, status, address)

1.2  避免索引失效

 

  1)如果在查询的时候, 使用了复合索引, 要遵循最左前缀法则, 也就是查询从索引的最左列开始, 并且不能跳过索引中的列.

 

  2)尽量不要在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描

    应尽量避免在 where 子句中使用 != 或 <> 操作符,否则将引擎放弃使用索引而进行全表扫描。

     不做列运算where age + 1 = 10,任何对列的操作都将导致表扫描,它包括数据库教程函数.计算表达式等, 都会是索引失效.

    查询 like,如果是 ‘%aaa’ 也会造成索引失效.

    应尽量避免在 where 子句中使用 or 来连接条件,如果一个字段有索引,一个字段没有索引,将导致引擎放弃使用索引而进行全表扫描

 

   3) Sql 语句调优

      根据业务场景建立复合索引只查询业务需要的字段,如果这些字段被索引覆盖,将极大的提高查询效率.

    多表连接的字段上需要建立索引,这样可以极大提高表连接的效率.

      where 条件字段上需要建立索引, 但 Where 条件上不要使用运算函数,以免索引失效.  排序字段上, 因为排序效率低, 添加索引能提高查询效率.

    优化 insert 语句: 批量列插入数据要比单个列插入数据效率高.

     优化 order by 语句: 在使用 order by 语句时, 不要使用 select *, select 后面要查有索引的列, 如果一条 sql 语句中对多个列进行排序, 在业务允许情况下, 尽量同时用升序或同时用降序.

    优化 group by 语句: 在我们对某一个字段进行分组的时候, Mysql 默认就进行了排序,但是排序并不是我们业务所需的, 额外的排序会降低效率. 所以在用的时候可以禁止排序, 使用 order by null 禁用.select age, count(*) from emp group by age order by null

    尽量避免子查询, 可以将子查询优化为 join 多表连接查询.

 

    4) 合理的数据库设计

     根据数据库三范式来进行表结构的设计。设计表结构时,就需要考虑如何设计才能更有效的查询, 遵循数据库三范式:

 

     第一范式:数据表中每个字段都必须是不可拆分的最小单元,也就是确保每一列的原子性;

     第二范式:满足一范式后,表中每一列必须有唯一性,都必须依赖于主键;

    第三范式:满足二范式后,表中的每一列只与主键直接相关而不是间接相关(外键也是直接相关),字段没有冗余。

     注意:没有最好的设计,只有最合适的设计,所以不要过分注重理论。三范式可以作为一个基本依据,不要生搬硬套。有时候可以根据场景合理地反规范化:

     A:保留冗余字段。当两个或多个表在查询中经常需要连接时,可以在其中一个表上增加若干冗余的字段,以 避免表之间的连接过于频繁,一般在冗余列的数据不经常变动的情况下使用。

     B:增加派生列。派生列是由表中的其它多个列的计算所得,增加派生列可以减少统计运算,在数据汇总时可以大大缩短运算时间, 前提是这个列经常被用到, 这也就是反第三范式。

     C:分割表。

        数据表拆分:主要就是垂直拆分和水平拆分。

        水平切分:将记录散列到不同的表中,各表的结构完全相同,每次从分表中查询, 提高效率。

        垂直切分:将表中大字段单独拆分到另外一张表, 形成一对一的关系。D: 字段设计

            1.表的字段尽可能用 NOT NULL

            2.字段长度固定的表查询会更快

            3.把数据库的大表按时间或一些标志分成小表

标签:知识点,事务,博学,Tree,查询,索引,超强,失效,数据库
From: https://www.cnblogs.com/linwenguan/p/16990912.html

相关文章

  • vue知识点
    第一章、vue的指令与过滤器1.内容渲染指令1.1.v-text:缺点会覆盖元素内部原有的内容1.2.{{}}:插值表达式,只是内容的占位符不会覆盖原来的内容1.3.v-html:可以带有标......
  • 【博学谷学习记录】超强总结,用心分享|狂野架构常见编程规约
    编程规约方法参数类型必须一致,不要出现自动装箱拆箱操作2.1.1.1反例这种操作很容易产生难以排查的NPE异常/***反例*容易出现空指针异常,如果参数为null就会......
  • 零散知识点
    pythonptypython-c'importsocket,subprocess,os;s=socket.socket(socket.AF_INET,socket.SOCK_STREAM);s.connect(("192.168.56.109",6666));os.dup2(s.fileno(......
  • IGMP 基本知识点
    IGMP又称互联网组管理协议,是TCP/IP协议栈中负责IPv4组播成员注册管理的协议。是配置组播主要使用的协议,目前IGMP一共有三个版本IGMPv1、IGMPv2、IGMPv3三种版本高版......
  • c/c++学习过程中的知识点记录:学习笔记(一)
    学习的过程就是一个一个小的知识点累加的过程,学会一个就在此记录一个。时间长了就知道的就多了,还可以用来温习自己学过的知识。一、return语句不可返回栈指针(指向栈内存的......
  • Linux系统网络相关知识点
    云计算底层技术-虚拟网络设备(Bridge,VLAN,VxLan)https://www.cnblogs.com/janeysj/articles/10755246.html盘点Linux系统网络相关知识点https://zhuanlan.zhihu.com/p/5......
  • 模板层之标签、自定义模板语法、母版(模版)的继承与导入、模型层前期准备知识点、ORM常
    模板层之标签模板语法支持if判断(支持elif):{%if条件1(可以自己写也可以用传递过来的数据)%}<p>今天又是周三了</p>{%elif条件2(可以自己写也可以用传递过......
  • 编译原理知识点
    第四章作业及相关知识点一、第一题知识点1、消除左递归\(P→Pα|β\)等价于\(P→βP’(P’\)为新增加的非终结符\(),P'→αP'|ε\)2、判断一个上下文无关文法是\(LL(1......
  • 入门Linux运维工程师需要掌握的知识点和工具以及技能
    Linux系统的学习,可以选用redhat或centos,特别是centos在企业中用得最多,当然还会有其它版本的,比如Ubuntu等,根据自己的工作情况和兴趣来定。当然不同发行版本主要是包上的区别......
  • Transformer 必备知识点
    NNDL学习笔记transformer:基于多头自注意力的序列到序列的模型 前馈神经网络全连接ResNet残差连接层归一化Softmax编码器-解码器 注意力机制自注意力模型......