文章很长,且持续更新,建议收藏起来,慢慢读!疯狂创客圈总目录 博客园版 为您奉上珍贵的学习资源 :
免费赠送 :《尼恩Java面试宝典》 持续更新+ 史上最全 + 面试必备 2000页+ 面试必备 + 大厂必备 +涨薪必备
免费赠送 :《尼恩技术圣经+高并发系列PDF》 ,帮你 实现技术自由,完成职业升级, 薪酬猛涨!加尼恩免费领
免费赠送 经典图书:《Java高并发核心编程(卷1)加强版》 面试必备 + 大厂必备 +涨薪必备 加尼恩免费领
免费赠送 经典图书:《Java高并发核心编程(卷2)加强版》 面试必备 + 大厂必备 +涨薪必备 加尼恩免费领
免费赠送 经典图书:《Java高并发核心编程(卷3)加强版》 面试必备 + 大厂必备 +涨薪必备 加尼恩免费领
免费赠送 资源宝库: Java 必备 百度网盘资源大合集 价值>10000元 加尼恩领取
美团面试:Mysql如何选择最优 执行计划,为什么?
尼恩特别说明: 尼恩的文章,都会在 《技术自由圈》 公号 发布, 并且维护最新版本。 如果发现图片 不可见, 请去 《技术自由圈》 公号 查找
尼恩说在前面
在40岁老架构师 尼恩的读者交流群(50+)中,最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团、蚂蚁、得物的面试资格,遇到很多很重要的相关面试题:
Mysql如何选择最优 执行计划,为什么?
最近有小伙伴面试美团,都问到了这个面试题。 小伙伴没有系统的去梳理和总结,所以支支吾吾的说了几句,面试官不满意,面试挂了。
所以,尼恩给大家做一下系统化、体系化的梳理,使得大家内力猛增,可以充分展示一下大家雄厚的 “技术肌肉”,让面试官爱到 “不能自已、口水直流”,然后实现”offer直提”。
当然,这道面试题,以及参考答案,也会收入咱们的 《尼恩Java面试宝典PDF》V175版本,供后面的小伙伴参考,提升大家的 3高 架构、设计、开发水平。
《尼恩 架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》的PDF,请到文末公号【技术自由圈】获取
在 MySQL 数据库中,查询执行计划(MySQL Execution Plan)是决定查询性能的关键因素。
一个好的执行计划(MySQL Execution Plan)能够让查询高效地运行,减少资源的消耗和响应时间。
一、什么是执行计划(MySQL Execution Plan)?
MySQL Execution Plan (执行计划)是 MySQL 数据库在处理查询语句时,确定的一套具体操作步骤。
MySQL Execution Plan (执行计划) 描述了数据库引擎如何访问表、如何 使用索引,以及以何种顺序执行连接和过滤操作等内容。
对于复杂的查询,不同的执行计划可能会导致查询性能有天壤之别。
一个高效的执行计划能够充分利用索引,减少数据的读取量和磁盘 I/O 操作,从而快速地返回查询结果。
二、MySQL 优化器的作用
MySQL 有一个查询优化器,它的主要任务是在众多可能的执行计划中选择一个最优的计划。
再 介绍查询优化器 之前, 我们看看 Mysql的架构。
Mysql的架构 ,整体是分为服务层、引擎层和文件系统层,其架构图如下所示:
MySQL Server 服务层(Service Layer)解析 SQL 语句、优化查询以及执行操作的,分别有三个关键组件完成:
- 解析器(Parser)
- 优化器(Optimizer)
- 执行器(Executor)。
每个组件在查询执行的过程中扮演不同的角色,下面分别介绍这三者的作用:
1. 解析器(Parser)
解析器是 SQL 查询执行的第一步,它的职责是将用户发送的 SQL 语句解析为数据库能够理解的内部结构。
- SQL 词法分析:解析器首先对 SQL 语句进行词法分析,将 SQL 语句分割成多个“单词”或“标记”,如表名、列名、关键字等。
- 语法分析:接着,解析器会根据 SQL 语法规则生成对应的解析树(Parse Tree),用来描述 SQL 语句的逻辑结构。这个过程检查 SQL 语句的语法是否正确。
- 语义分析:确认 SQL 语句中涉及的数据库对象是否存在(比如表名、字段名是否有效),并且检查权限。
解析完成后,生成一个中间表示结构,交由下一步进行处理。
2. 优化器(Optimizer)
优化器负责选择最优的执行计划,使查询能够以最高效的方式运行。
- 逻辑优化:优化器会对 SQL 语句进行逻辑优化,比如 SQL 语句重写、消除冗余操作、合并重复条件、重新排列 WHERE 子句中的条件等。
- 物理优化:在物理优化阶段,优化器会选择最优的访问路径和执行顺序。例如,它会决定使用哪种索引(如果有多个索引可选),是否做全表扫描,如何连接多张表(选择嵌套循环、哈希连接或排序合并连接等)。
- 成本估算:优化器会基于数据库的统计信息(例如表的大小、索引的选择性等)来估算不同执行计划的成本,选择代价最低的执行方案。
经过优化后,优化器会生成一个查询执行计划,并交给执行器处理。
3. 执行器(Executor)
执行器的任务是按照优化器生成的执行计划,逐步执行查询,访问数据并返回结果。
- 权限检查:在执行之前,执行器会首先检查用户是否有权限执行相应的操作。如果没有权限,则返回错误信息。
- 执行执行计划:执行器根据生成的执行计划,依次调用存储引擎的接口来执行具体的操作。例如,如果是查询操作,执行器会调用存储引擎来读取相应的数据;如果是插入操作,执行器则会调用存储引擎来插入数据。
- 结果返回:执行器根据查询的结果,将数据以合适的格式返回给客户端。如果涉及多个步骤(如 JOIN 操作),执行器会协调各个步骤的执行,并组合最终的结果集。
三个核心组件之间的交互流程
- 解析器:SQL 语句转换为解析树。
- 优化器:生成最优的执行计划。
- 执行器:根据计划调用存储引擎执行操作并返回结果。
这三个组件相互协作,完成从接收到 SQL 查询到返回结果的整个过程。
三:一条完成的sql查询语句 执行流程 ,如下所示:
上图中 优化器 + 执行器 是哼哈二将:
-
根据sql的结构生成不同的执行计划, 是MySQL优化器 的主要任务。
-
在众多可能的执行计划中选择一个最优的计划, 这是MySQL执行器 的主要任务。
执行器最终选择最优或者执行效率最高的执行计划, 执行sql并返回数据。
四、影响执行计划选择的因素
那么这个最优的执行计划是如何选择的呢?
优化器会考虑多种因素,如每个执行计划的成本、索引的可用性、表的大小、数据分布情况、连接条件等。
因素1:每个执行计划的成本
优化器会估算每个执行计划的成本。成本主要包括 I/O 成本(从磁盘读取数据的开销)和 CPU 成本(对数据进行处理的开销)。
例如,使用索引进行查询可能会减少 I/O 成本,但如果索引需要大量的 CPU 资源来维护或者遍历,那么优化器会综合考虑这两种成本来决定是否使用该索引。
因素2:索引是否存在?
当查询语句中的列有合适的索引时,优化器会考虑使用索引来加速查询。例如,对于一个SELECT * FROM users WHERE user_id = 123
的查询,如果user_id
列有索引,优化器可能会选择使用索引来定位满足条件的行,而不是全表扫描。
因素3:复合索引的是否能最左匹配?
对于复合索引(包含多个列的索引),列的顺序也很重要。
例如,有一个复合索引(col1, col2, col3)
,如果查询条件是col1 = 'value1' AND col2 = 'value2'
,那么这个复合索引可以被有效地利用。
但如果查询条件是col2 = 'value2' AND col3 = 'value3'
,索引的使用效率可能会降低,优化器可能需要重新评估是否使用该索引。
因素4:连接类型和顺序?
不同的连接类型(如内连接、外连接、交叉连接等)会影响执行计划。例如,内连接是比较常用的连接方式,它只返回满足连接条件的行。优化器会根据连接条件和表的大小来确定连接的顺序。一般来说,会先选择较小的表作为驱动表,这样可以减少连接操作的成本。
在多表连接的情况下,连接顺序的不同组合会产生多种执行计划。例如,对于三个表A
、B
、C
的连接,可能的连接顺序有((A JOIN B) JOIN C)
、((A JOIN C) JOIN B)
和((B JOIN C) JOIN A)
等,优化器会通过计算成本来选择最优的连接顺序。
因素5:连接条件的选择性?
连接条件的选择性是指连接条件能够过滤掉多少行。如果连接条件的选择性很高,例如A.col1 = B.col1
,并且col1
列的值在两个表中都比较唯一,那么优化器可能会更倾向于使用这种连接条件来减少连接操作后的结果集大小。
因素6:数据分布情况?
如果列的数据分布不均匀,例如一个列大部分值都相同,只有少数几个不同的值,那么索引在这种情况下的作用可能会受到限制。优化器会考虑这种数据分布情况来决定是否使用索引以及如何使用索引。
其他的考察因素:如表的数据量和增长趋势
表的数据量大小直接影响查询的性能。对于大数据量的表,优化器会更倾向于寻找能够减少数据读取量的执行计划。
同时,表的增长趋势也很重要。如果一个表的数据量在不断增加,那么优化器可能需要重新评估现有的执行计划是否仍然是最优的。
五、通过EXPLAIN 查看每个执行计划的成本
使用EXPLAIN
命令查看和分析执行计划。EXPLAIN
是 MySQL 提供的一个用于查看查询执行计划的工具。
在查询语句前加上EXPLAIN
关键字,MySQL 会返回一个结果集,其中包含了执行计划的详细信息。例如:
EXPLAIN SELECT * FROM users JOIN orders ON users.user_id = orders.user_id;
这个EXPLAIN
结果会显示表的连接方式、使用的索引(如果有)、扫描的行数等信息。
通过分析这些信息,可以了解 MySQL 是如何执行这个查询的,以及是否存在优化的空间。
理解EXPLAIN
结果中的关键列
- id列:表示查询中每个 SELECT 子句的标识符。如果是简单的单表查询,
id
通常为 1。在复杂的子查询或连接查询中,id
可以帮助区分不同的子查询或连接部分。 - select_type列:描述了查询的类型,如
SIMPLE
(简单查询)、PRIMARY
(主查询)、SUBQUERY
(子查询)等。不同的查询类型可能会有不同的执行计划。 - table列:显示查询涉及的表的名称。
- type列:表示表的访问类型,这是评估执行计划效率的一个重要指标。常见的访问类型有
ALL
(全表扫描)、index
(索引扫描)、range
(范围扫描)、ref
(非唯一索引扫描)、eq_ref
(唯一索引扫描)等。一般来说,eq_ref
和ref
的效率较高,而ALL
效率较低。 - possible_keys列:显示查询可能使用的索引。这只是一个参考,优化器可能会根据实际情况选择不使用其中的某些索引。
- key列:实际使用的索引。如果这个列显示为
NULL
,表示没有使用索引,可能是因为优化器认为使用索引的成本更高或者没有合适的索引。 - key_len列:表示使用的索引的长度。这个长度可以帮助判断索引是否被充分利用。例如,对于一个复合索引,如果
key_len
只覆盖了索引的一部分列,可能表示索引没有被完全利用。 - ref列:显示索引的引用情况。如果是通过索引进行连接操作,这个列会显示连接所引用的列。
- rows列:估算的需要扫描的行数。这个数字越小,通常表示执行计划越高效。
- Extra列:包含了一些额外的信息,如是否使用了临时表、是否使用了文件排序等。这些信息可以帮助发现潜在的性能问题。
在 MySQL 中,EXPLAIN
命令用于获取查询的执行计划信息,FORMAT
参数可以指定输出的格式。
以下是一些常见的格式及说明:
-
TRADITIONAL
(默认格式):以传统的表格形式展示执行计划信息,包括
id
、select_type
、table
、type
、possible_keys
、key
、key_len
、ref
、rows
、Extra
等列。每一列都代表了执行计划的不同方面,例如: -
JSON
:以 JSON 格式输出执行计划信息,更易于解析和处理,尤其是在需要进行自动化分析或与其他工具集成时。
JSON 格式的输出包含了更多详细的信息,如成本估算、访问路径等。
六 实操:通过执行计划查看每个执行计划的成本
添加测试数据:首先创建一张测试表 test_user表, 造50W数据
创建一张user表,表中包含:id
、id_card
、age
、user_name
和height
、address字段。
CREATE TABLE `test_user` (
`id` int NOT NULL AUTO_INCREMENT,
`id_card` varchar(20) COLLATE utf8mb4_bin DEFAULT NULL,
`age` int DEFAULT '0',
`user_name` varchar(30) COLLATE utf8mb4_bin DEFAULT NULL,
`height` int DEFAULT '0',
`address` varchar(30) COLLATE utf8mb4_bin DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_id_card_age_user_name` (`id_card`,`age`,`user_name`),
KEY `idx_height` (`height`))
ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin
使用存储过程,插入50W条测试数据, 具体请参见尼恩的前面文章
美团面试:mysql 索引失效?怎么解决?(重点知识,建议收藏,读10遍+)
(1)使用二级索引的执行计划 和执行成本
执行sql如下所示:
EXPLAIN FORMAT=JSON SELECT * from `test_user` where height = 120;
sql的执行结果如下所示:
{
"query_block": {
"select_id": 1,
"cost_info": {
"query_cost": "7252.80"
},
"table": {
"table_name": "test_user",
"access_type": "ref",
"possible_keys": [
"idx_height"
],
"key": "idx_height",
"used_key_parts": [
"height"
],
"key_length": "5",
"ref": [
"const"
],
"rows_examined_per_scan": 6044,
"rows_produced_per_join": 6044,
"filtered": "100.00",
"cost_info": {
"read_cost": "6044.00",
"eval_cost": "1208.80",
"prefix_cost": "7252.80",
"data_read_per_join": "1M"
},
"used_columns": [
"id",
"id_card",
"age",
"user_name",
"height",
"address"
]
}
}
}
执行结果中的cost=7252.80,Mysql认为我们当前的sql执行的成本是7252.80。
这个命令是在 MySQL 中使用 EXPLAIN
以 JSON 格式输出 SELECT * from
test_user IGNORE index(idx_height) where height = 120;
查询的执行计划信息。
以下是对这个命令及输出的分析:
一、命令解释
EXPLAIN
:用于获取 SQL 查询的执行计划信息,帮助了解 MySQL 如何执行该查询。FORMAT=JSON
:指定输出格式为 JSON,这种格式可以更清晰地展示执行计划的各个方面,并且方便解析和处理。SELECT * from
test_userIGNORE index(idx_height) where height = 120;
:这是一个查询语句,从名为test_user
的表中选择所有列的数据,条件是height = 120
,并且明确忽略名为idx_height
的索引。
二、可能的输出内容及含义
以下是对给定 JSON 格式的执行计划结果的详细解释:
-
"query_block"
:- 代表查询块信息,描述了整个查询的执行计划相关内容。
-
"select_id": 1
:- 查询的唯一标识符为 1。
-
"cost_info"
:"query_cost": "7252.80"
: 查询的预估总成本为 7252.80。这个成本是 MySQL 优化器根据多种因素估算出来的,包括读取数据的成本、评估条件的成本等。一般来说,成本越低,查询的执行效率可能越高。
-
"table"
:-
"table_name": "test_user"
: 查询涉及的表名为test_user
。 -
"access_type": "ref"
: 访问类型为ref
,表示通过非唯一索引进行查找。在这个例子中,说明查询使用了索引进行查找,并且不是唯一索引。 -
"possible_keys": ["idx_height"]
: 可能使用的索引列表为idx_height
,这表明优化器考虑了这个索引,并最终选择了它。 -
"key": "idx_height"
: 实际使用的索引是idx_height
,说明优化器认为使用这个索引可以提高查询性能。 -
"used_key_parts": ["height"]
: 使用的索引部分是height
列,表明索引idx_height
是基于height
列创建的,并且在查询中只使用了这个索引的height
部分。 -
"key_length": "5"
: 索引的长度为 5,可能与存储height
列的值所需的空间有关。 -
"ref": ["const"]
: 索引引用的值是常量,这里可能是查询条件中的height = 120
中的 120。 -
"rows_examined_per_scan": 6044
: 每次扫描检查的行数为 6044。这表示在执行查询过程中,需要检查的行数估计为 6044 行。 -
"rows_produced_per_join": 6044
: 每次连接产生的行数为 6044。如果查询涉及多个表的连接,这个值表示从这个表中产生的行数,用于连接操作。 -
"filtered": "100.00"
: 过滤后的行数比例为 100%。这意味着经过查询条件height = 120
过滤后,所有满足条件的行数占总检查行数的比例为 100%。 -
"cost_info":
"read_cost": "6044.00"
: 读取数据的成本为 6044.00。"eval_cost": "1208.80"
: 评估条件的成本为 1208.80。"prefix_cost": "7252.80"
: 前缀成本为 7252.80,通常是指查询的总成本减去某些特定操作的成本。
-
"data_read_per_join": "1M"
: 每次连接读取的数据量为 1M(可能是 1 兆字节)。 -
"used_columns": ["id", "id_card", "age", "user_name", "height", "address"]
: 查询使用的列包括id
、id_card
、age
、user_name
、height
和address
。这意味着查询将从表中读取这些列的数据。
-
(2)执行成本的介绍
- 执行成本的单位
- MySQL 优化器的成本单位是一个相对的抽象概念,没有一个具体的物理单位(如秒、字节等)与之对应。它是一个综合衡量指标,用于比较不同执行计划的资源消耗情况。成本主要由 I/O 成本(从磁盘读取数据的开销)和 CPU 成本(对数据进行处理的开销)组成。
- I/O 成本
- I/O 成本通常与磁盘读取操作相关。在 MySQL 中,读取一个数据页(一般是 16KB)的 I/O 成本默认被估算为 1.0。例如,若一个执行计划需要读取 10 个数据页,那么其 I/O 成本估算值可能为 10.0 左右。这个值会根据存储引擎的不同特性以及系统的硬件配置等因素有所变化。
- 对于 InnoDB 存储引擎,它有自己的缓冲池(Buffer Pool)。如果数据已经在缓冲池中,那么读取这些数据的 I/O 成本会相对较低,因为不需要从磁盘进行物理读取。优化器在计算成本时会考虑数据在缓冲池中的可能性,这是基于缓冲池的命中率等因素来估算的。
- CPU 成本
- CPU 成本涉及到对数据的处理操作,如比较、排序、函数计算等。例如,在进行索引查找时,需要在索引结构中进行比较操作,这会产生 CPU 成本。CPU 成本的估算相对复杂,它取决于操作的类型和数据量等因素。
- 对于一个简单的比较操作(如判断一个列的值是否等于某个常量),其 CPU 成本相对较低;而对于复杂的操作,如对大量数据进行排序或者使用复杂的函数进行数据转换,CPU 成本会较高。在计算成本时,优化器会根据操作的复杂度和涉及的数据量来估算 CPU 成本。
- 成本的综合计算与比较
- 优化器在计算总成本时,会将 I/O 成本和 CPU 成本相加。例如,一个执行计划的 I/O 成本估算为 5.0,CPU 成本估算为 3.0,那么总成本就是 8.0。优化器会比较不同执行计划的总成本,选择成本最低的执行计划来执行查询。
- 不过,成本估算只是一个参考,实际的性能还可能受到硬件性能(如磁盘 I/O 速度、CPU 速度)、系统负载、数据分布等因素的影响。有时候,优化器选择的成本最低的执行计划在实际运行中可能并不是最优的,这就需要通过性能测试和调优等手段来进一步优化查询。
(3)禁用二级索引后的执行计划 和执行成本
执行忽略二级索引的sql如下所示:
执行sql如下所示:
EXPLAIN FORMAT=JSON SELECT * from `test_user` IGNORE index(idx_height) where height = 120;
在 SQL 语句中,“IGNORE INDEX (index_name)” 的作用是在执行查询时忽略指定的索引。
这里明确告诉数据库在执行这个查询时不要使用名为 “idx_height” 的索引,即使该索引可能与查询条件中的 “height” 列相关。
IGNORE INDEX 关键词的 几个使用场景:
- 性能调试:有时候开发人员可能怀疑某个索引没有被正确使用或者正在尝试不同的查询执行计划,通过忽略特定索引可以观察查询在没有该索引时的性能表现,从而更好地理解数据库的执行计划和索引的实际影响。
- 解决索引冲突:如果某个索引的存在导致了查询执行计划的问题,比如产生了错误的连接顺序或者不必要的索引扫描,通过忽略该索引可以强制数据库使用其他可能更优的执行方式。
- 特殊需求:在某些特定的业务场景下,可能根据具体的查询需求故意不使用某个索引,以满足特定的性能或数据一致性要求。
架构师尼恩提示: 上面的例子,就是对应到场景3.
架构师尼恩提示:谨慎使用 “IGNORE INDEX”,因为在大多数情况下,数据库的优化器会根据统计信息和各种因素自动选择最合适的索引来提高查询性能。如果随意忽略索引,可能会导致查询性能下降。
禁用二级索引后的 , sql的执行结果如下所示:
{
"query_block": {
"select_id": 1,
"cost_info": {
"query_cost": "100134.80"
},
"table": {
"table_name": "test_user",
"access_type": "ALL",
"rows_examined_per_scan": 489294,
"rows_produced_per_join": 5966,
"filtered": "1.22",
"cost_info": {
"read_cost": "98941.40",
"eval_cost": "1193.40",
"prefix_cost": "100134.80",
"data_read_per_join": "1M"
},
"used_columns": [
"id",
"id_card",
"age",
"user_name",
"height",
"address"
],
"attached_condition": "(`store`.`test_user`.`height` = 120)"
}
}
}
执行结果中的cost=100134.80,Mysql认为我们当前的sql执行的成本是100134.80。
以下是对这个命令及输出的分析:
JSON 格式的输出通常包含多个字段,以下是一些常见字段的解释:
- "query_block":
- "select_id": 查询的标识符。
- "cost_info":
- "query_cost": 查询的总成本估计。这是一个综合考虑了 I/O 成本和 CPU 成本的数值,值越小通常表示执行计划越高效。
- "table":
- "name": 表的名称,这里是
test_user
。 - "access_type": 访问表的方式,可能的值有
ALL
(全表扫描)、index
(索引扫描)、range
(范围扫描)等。如果忽略了索引,可能会出现全表扫描,即access_type
为ALL
。 - "possible_keys": 该查询可能使用的索引列表。由于使用了
IGNORE index(idx_height)
,所以这里不会显示idx_height
。 - "key": 实际使用的索引,如果没有使用任何索引,该值为
NULL
。 - "rows": 预估需要扫描的行数。
- "filtered": 表示经过筛选条件过滤后剩余行数的比例。
- "name": 表的名称,这里是
通过分析这个 JSON 格式的执行计划输出,可以了解 MySQL 在执行这个查询时的具体策略,判断是否存在性能问题,并考虑是否需要调整查询语句、创建新的索引或者优化表结构等,以提高查询性能。
两条执行计划的对比
可以生成两条执行计划,一个是走索引(idx_height)的执行计划,另一个是全表扫描的执行计划,并且通过sql分析我们发现两者的cost值不一样的,cost的值如下所示:
执行方式 | cost |
---|---|
索引执行计划 | 7252.80 |
全表扫面执行计划 | 100134.80 |
然后Mysql就选择cost最小的执行计划来执行我们的sql。
五、优化执行计划的方法
-
优化索引
根据查询语句的需求,创建合适的索引。对于频繁用于查询条件、连接条件和排序的列,应该考虑创建索引。但要注意避免创建过多的索引,因为索引本身也会占用磁盘空间,并且在插入、更新和删除数据时需要维护索引,会增加额外的开销。
-
调整查询语句
优化查询语句的写法可以影响执行计划。
如,尽量避免在查询条件中使用函数或者表达式,因为这可能会导致索引无法使用。
比如,
SELECT * FROM users WHERE YEAR(birth_date) = 1990
,这个查询中的YEAR()
函数会使得birth_date
列的索引无法使用。可以将查询改写为
SELECT * FROM users WHERE birth_date BETWEEN '1990 - 01 - 01' AND '1990 - 12 - 31'
,这样就有可能使用索引了。 -
优化表结构
合理的表结构设计也有助于优化执行计划。
例如,将经常一起查询的列放在同一个表或者同一个列族(如果是基于列存储的数据库)中,可以减少数据的读取量。
对于大数据量的表,可以考虑进行垂直或水平拆分,以提高查询性能。
关于mysql 执行计划的调优,还可以看看下面的文章:
MySQL 选择最优执行计划是一个复杂的过程,涉及到数据库的内部机制、数据特征和查询需求等多个方面。
通过深入了解执行计划的选择原理,合理利用工具查看和分析执行计划,并采取有效的优化措施,可以提高 MySQL 查询的性能,更好地满足应用程序的需求。
尼恩架构团队的塔尖 sql 面试题
- sql查询语句的执行流程:
- 索引
阿里面试:为什么要索引?什么是MySQL索引?底层结构是什么?
滴滴面试:单表可以存200亿数据吗?单表真的只能存2000W,为什么?
- 索引下推 ?
- 索引失效
美团面试:mysql 索引失效?怎么解决?(重点知识,建议收藏,读10遍+)
- MVCC
- binlog、redolog、undo log
美团面试:binlog、redolog、undo log底层原理是啥?分别实现ACID哪个特性?(尼恩图解,史上最全)
- mysql 事务
京东面试:RR隔离mysql如何实现?什么情况RR不能解决幻读?
- 分布式事务
分布式事务圣经:从入门到精通,架构师尼恩最新、最全详解 (50+图文4万字全面总结 )
- mysql 调优
说在最后:有问题找老架构取经
只要按照上面的 尼恩团队梳理的 方案去作答, 你的答案不是 100分,而是 120分。 面试官一定是 心满意足, 五体投地。
按照尼恩的梳理,进行 深度回答,可以充分展示一下大家雄厚的 “技术肌肉”,让面试官爱到 “不能自已、口水直流”,然后实现”offer直提”。
在面试之前,建议大家系统化的刷一波 5000页《尼恩Java面试宝典PDF》,里边有大量的大厂真题、面试难题、架构难题。
很多小伙伴刷完后, 吊打面试官, 大厂横着走。
在刷题过程中,如果有啥问题,大家可以来 找 40岁老架构师尼恩交流。
另外,如果没有面试机会, 可以找尼恩来改简历、做帮扶。前段时间,刚指导一个27岁 被裁小伙,拿到了一个年薪45W的JD +PDD offer,逆天改命。
狠狠卷,实现 “offer自由” 很容易的, 前段时间一个武汉的跟着尼恩卷了2年的小伙伴, 在极度严寒/痛苦被裁的环境下, offer拿到手软, 实现真正的 “offer自由” 。
技术自由的实现路径:
实现你的 架构自由:
《阿里二面:千万级、亿级数据,如何性能优化? 教科书级 答案来了》
《峰值21WQps、亿级DAU,小游戏《羊了个羊》是怎么架构的?》
… 更多架构文章,正在添加中
实现你的 响应式 自由:
这是老版本 《Flux、Mono、Reactor 实战(史上最全)》
实现你的 spring cloud 自由:
《Spring cloud Alibaba 学习圣经》 PDF
《分库分表 Sharding-JDBC 底层原理、核心实战(史上最全)》
《一文搞定:SpringBoot、SLF4j、Log4j、Logback、Netty之间混乱关系(史上最全)》
实现你的 linux 自由:
实现你的 网络 自由:
《网络三张表:ARP表, MAC表, 路由表,实现你的网络自由!!》
实现你的 分布式锁 自由:
实现你的 王者组件 自由:
《队列之王: Disruptor 原理、架构、源码 一文穿透》
《缓存之王:Caffeine 源码、架构、原理(史上最全,10W字 超级长文)》
《Java Agent 探针、字节码增强 ByteBuddy(史上最全)》