- 理解执行计划的重要性
- 执行计划是数据库管理系统(DBMS)在执行SQL语句时所采取的步骤和方法的描述。它展示了数据库如何访问表、使用索引,以及以何种顺序连接表等信息。通过分析执行计划,可以找出SQL语句执行效率低下的原因,如全表扫描、不合适的索引使用等,从而有针对性地进行优化。
- 获取执行计划
- 不同数据库的获取方式:
- MySQL:可以使用
EXPLAIN
关键字。例如,对于查询语句SELECT * FROM users WHERE age > 30;
,在MySQL中可以通过EXPLAIN SELECT * FROM users WHERE age > 30;
来获取执行计划。执行计划结果会显示诸如id
(查询的标识符)、select_type
(查询类型,如SIMPLE、SUBQUERY等)、table
(涉及的表)、type
(访问类型,如ALL表示全表扫描,ref表示通过索引查找等)、possible_keys
(可能使用的索引)、key
(实际使用的索引)、key_len
(索引长度)、ref
(连接时使用的列或常量)、rows
(预估要扫描的行数)和Extra
(额外信息,如Using where
表示使用了WHERE
条件过滤)等信息。 - Oracle:可以使用
EXPLAIN PLAN FOR
语句来获取执行计划。例如,EXPLAIN PLAN FOR SELECT * FROM employees WHERE salary > 5000;
。然后通过查询PLAN_TABLE
视图(如SELECT * FROM TABLE(dbms_xplan.display);
)来查看详细的执行计划。Oracle的执行计划包含操作(如TABLE ACCESS、INDEX RANGE SCAN等)、对象所有者、对象名称和操作的谓词等信息。 - SQL Server:可以使用
SET SHOWPLAN_ALL ON
或SET SHOWPLAN_TEXT ON
来显示执行计划。例如,SET SHOWPLAN_ALL ON; SELECT * FROM customers WHERE customer_id > 100; SET SHOWPLAN_ALL OFF;
。执行计划会展示物理操作(如Clustered Index Scan、Nested Loops等)、逻辑操作(如Select)、估计的行数、估计的I/O开销等信息。
- MySQL:可以使用
- 不同数据库的获取方式:
- 分析执行计划中的关键元素
- 访问类型(type):
- 全表扫描(ALL):这是最基本的访问方式,当没有合适的索引或者查询条件无法有效利用索引时,数据库会扫描整张表。例如,在一个没有索引的
users
表上执行SELECT * FROM users WHERE name LIKE '%abc%';
通常会导致全表扫描。全表扫描会随着表数据量的增大而性能急剧下降,因为它需要读取表中的每一行数据。 - 索引扫描(index scan):数据库会按照索引的顺序扫描索引中的条目。如果只需要索引中的部分列,这种扫描方式可以避免访问表数据,提高性能。例如,有一个索引包含
users
表中的age
和id
列,执行SELECT age FROM users WHERE age > 30;
可能会进行索引扫描。 - 索引唯一扫描(index unique scan):当查询条件可以唯一确定索引中的一行时,会使用索引唯一扫描。例如,在
users
表的user_id
(主键)列上有索引,执行SELECT * FROM users WHERE user_id = 123;
会进行索引唯一扫描,这种扫描方式效率很高。
- 全表扫描(ALL):这是最基本的访问方式,当没有合适的索引或者查询条件无法有效利用索引时,数据库会扫描整张表。例如,在一个没有索引的
- 预估行数(rows):
- 数据库会根据统计信息预估执行操作时要扫描的行数。如果预估行数和实际情况相差很大,可能会导致查询计划选择不合适的执行策略。例如,统计信息过时,可能会使数据库认为某个条件过滤后的数据量很大,从而选择全表扫描,而实际上如果统计信息准确,使用索引扫描会更高效。
- 实际使用的索引(key):
- 查看是否使用了预期的索引。如果没有使用期望的索引,可能是因为索引不适合查询条件,或者数据库认为使用索引的成本高于全表扫描。例如,在一个复合索引(如
(column1, column2)
)上,如果查询条件只涉及column2
,数据库可能不会使用这个复合索引。
- 查看是否使用了预期的索引。如果没有使用期望的索引,可能是因为索引不适合查询条件,或者数据库认为使用索引的成本高于全表扫描。例如,在一个复合索引(如
- 额外信息(Extra):
- 如
Using filesort
表示需要进行额外的排序操作。这通常发生在没有按照索引顺序获取数据,但查询中有ORDER BY
子句的情况。排序操作可能会消耗大量的资源,尤其是在处理大数据量时。Using temporary
表示需要使用临时表,这通常是因为查询中的分组(GROUP BY
)或排序操作无法在内存中完成,需要借助临时表来实现,这也会影响性能。
- 如
- 访问类型(type):
- 基于执行计划进行优化
- 添加或调整索引:
- 如果发现有全表扫描,可以考虑为经常用于查询条件的列添加索引。例如,对于经常按
product_name
查询产品信息的products
表,添加product_name
列的索引可以提高查询效率。同时,对于复合索引,要注意索引列的顺序,将选择性高(不同值的数量占比高)的列放在前面。
- 如果发现有全表扫描,可以考虑为经常用于查询条件的列添加索引。例如,对于经常按
- 优化查询条件和语句结构:
- 避免在查询条件中使用函数操作列,因为这会导致索引失效。例如,将
SELECT * FROM users WHERE UPPER(name) = 'ABC';
修改为SELECT * FROM users WHERE name = 'ABC';
(假设数据库存储的name
列已经是大写形式)。如果有子查询,可以考虑将子查询转换为连接操作,以减少嵌套查询带来的性能开销。
- 避免在查询条件中使用函数操作列,因为这会导致索引失效。例如,将
- 更新统计信息:
- 定期更新数据库的统计信息,使数据库能够更准确地预估执行计划中的行数等信息。不同数据库有不同的更新统计信息的方式。在MySQL中,可以使用
ANALYZE TABLE
语句来更新表的统计信息,如ANALYZE TABLE users;
。在Oracle中,可以使用DBMS_STATS.GATHER_TABLE_STATS
过程来收集表的统计信息,如DBMS_STATS.GATHER_TABLE_STATS('schema_name', 'table_name');
。
- 定期更新数据库的统计信息,使数据库能够更准确地预估执行计划中的行数等信息。不同数据库有不同的更新统计信息的方式。在MySQL中,可以使用
- 添加或调整索引: