首页 > 其他分享 >order by的工作流程

order by的工作流程

时间:2024-04-15 14:13:58浏览次数:38  
标签:sort name 索引 buffer 流程 order 工作 排序 age

在日常的业务开发中,使用到MySQL的order by对数据进行排序是一个很正常的行为,那么你知道order by是如何工作的嘛?

一、全字段排序

先创建一张user表,字段name,age,address,插入随机数据100w条记录,由于按照name查询,所以给name字段添加索引:
alter table user add index idx_name (name);
我们看一下这条SQL的Explain的执行计划:
EXPLAIN SELECT name,age,address FROM user WHERE name = 'Olivia Wilson' ORDER BY age

从执行计划中可以看出,Extra字段中'Using fliesort'表示的就是用到了排序,MySQL会给每一个线程分配一块内存用于排序,称为sort_buffer

通常情况下,以上排序的SQL执行流程如下:

  1. 初始化内存sort_buffer,确定放入字段:name,age,address
  2. 从name索引树上找到所有满足name='Olivia Wilson'的主键ID
  3. 到主键id索引树上取出整行,取name,age,address三个字段的值,放入sort_buffer字段中
  4. 对sort_buffer中字段按照age做快速排序

我们暂且把这个过程称之为全字段排序,因为把所有需要查询的字段都放入到了sort_buffer中进行排序了,以上步骤4中按'age排序'这个动作,可能在内存中完成,也可能需要使用外部排序,这就取决于排序所需要的内存和参数sort_buffer_size

sort_buffer_size: 就是MySQL为排序开辟的一块内存(sort_buffer)的大小。如果排序的数量小于sort_buffer_size,排序就在内存中完成,如果排序数量太大内存放不下,就利用磁盘临时文件辅助排序

二、rowid排序

在全字段排序中,只对原表的数据读了一遍,剩下的操作都是在sort_buffer和临时文件中执行的,但是这个排序算法有个问题,如果查询要返回的字段很多的话,那么sort_buffer里面要放的字段很多,这样的内存里能同时存放下的行数就很少,要分成很多个临时文件,排序性能就会变得很差

那么MySQL如果认为排序的单行长度太大会怎么做呢?

-- 控制用于排序的行数据的长度的一个参数
SETmax_length_for_sort_data = 16;

如果单行的长度超过这个值,MySQL就会认为单行太大,要换一种排序算法
新的算法放入sort_buffer字段只有需要排序的字段(age)和主键id
但这时候,排序的结果就因为少了name和address的值,就不能直接返回,此时的执行的流程就成了以下的样子:

  1. 初始化sort_buffer,确定放入字段age和id
  2. 从name索引树找到满足的name='Olivia Wilson'的主键id
  3. 到主键id索引取出整行,取出name和id两个字段放入sort_buffer
  4. 对sort_buffer中的数据按照字段name进行排序
  5. 遍历排序结果,并按照id的值回到原表中取出name,age,address三个字段返回给客户端

以上的执行流程,我们称之为rowid排序,相对于全字段排序,rowid排序多了一次访问主键索引的过程,对于InnoDB表来说,rowid排序会要求回表多造成磁盘读,因此不会被优先选择

三、优化

从以上的两种排序,可以看出MySQL做排序是一个成本比较高操作。那是不是所有的order by都需要排序操作呢?如果不排序就能得到正确的结果,那么效率就会提高很多

其实从上面分析的过程来看,之所以MySQL需要做排序操作,原因就是原来的数据都是无序的,如果在name索引上取出来的行,天然就是按照age递增排序的话,是不是就可以不用排序了呢?结果当然是是的了

针对以上疑问,创建联合索引:(name,age)
alter table user add index idx_name_age (name,age) ;
再次查看一下Explain执行计划:
EXPLAIN SELECT name,age,address FROM user WHERE name = 'Olivia Wilson' ORDER BY age

可以看到,这个过程不需要使用'Using fliesort',也就是不需要排序了
执行流程如下:

  1. 从索引树(name,age)找到满足name='Olivia Wilson'的主键id
  2. 到主键id索引取出整行数据,取name,age,address字段,作为结果集的一部分直接返回

从以上执行流程中可以看到,步骤2还是进行了回表,那么我们是不是可以优化这个回表呢?覆盖索引?覆盖索引是指,索引上的信息足够满足查询请求,不需要再回到主键索引上取数据
按照覆盖索引的概念,再创建一个联合索引:(name,age,address)
alter table user add index idx_name_age_address (name,age,address);
我们再看一下执行计划:
EXPLAIN SELECT name,age,address FROM user WHERE name = 'Olivia Wilson' ORDER BY age

可以看到Extra字段里多了'Using index',表示使用了覆盖索引,性能上会快很多,当然并不是说为了每个查询都能使用上覆盖索引,毕竟索引维护也是需要代价的,需要做一个权衡的决定


我是一零贰肆,一个关注Java技术和记录生活的博主。

欢迎扫码关注“一零贰肆”的公众号,一起学习,共同进步,多看路,少踩坑。

标签:sort,name,索引,buffer,流程,order,工作,排序,age
From: https://www.cnblogs.com/sun2020/p/18135822

相关文章

  • 04流程控制 for循环,while循环
    for循环for((初始值;循环控制条件;变量变化))do程序done或for变量in值1,值2,值3...do程序done#!/bin/bashs=0for((i=1;i<=100;i++))dos=$[$s+$i]doneecho$s 执行结果: 例子:打印所有参数#!/bin/bashforiin$*doecho"bangzhang......
  • 自己开发的App如何上架,详细解读App上架操作流程
     对于企业或个人开发的App,上架是必经之路。然而,许多人不清楚如何进行App上架。工信部在2023年规定,App必须备案才能上架。那么,让我们一起了解App上架流程吧。 1.准备上架所需材料在上架App之前,需要准备应用图标、应用截图、应用描述等材料。这些材料需要精心设计,以吸引用户......
  • 十款优质企业级Java微服务开源项目(开源框架,用于学习、毕设、公司项目,减少开发工作!)
     Java微服务开源项目前言一、pig二、zheng三、SpringBlade四、SOP五、matecloud六、mall七、jeecg-boot八、Cloud-Platform九、microservices-platform十、RuoYi-Cloud 前言这篇文章为大家推荐几款优质的Java开源项目框架,可以用于学习,毕业设计,公司项目......
  • 2、APIView执行流程以及request对象源码分析
    一、基于View编写5个接口1、创建模型表models.pyfromdjango.dbimportmodelsclassBook(models.Model):name=models.CharField(max_length=64)price=models.IntegerField()publish=models.CharField(max_length=32)2、视图函数views.pyfrom......
  • PowerDesigner 业务流程/数据建模软件和元数据管理解决方案
    拓展阅读数据库设计工具-08-概览数据库设计工具-08-powerdesigner数据库设计工具-09-mysqlworkbench数据库设计工具-10-dbdesign数据库设计工具-11-dbeaver数据库设计工具-12-pgmodeler数据库设计工具-13-erdplus数据库设计工具-14-NavicatDataModeler数据库设计工具-......
  • 【工作总结】工作累死累活,结果越做越差怎么办?
    工作无需燃烧自己在前面的文章中,笔者已经介绍了工作中没有努力一说,而是要做到四步走:了解情况,做出决策,抓住核心,运用手段。我相信同学们仍然会觉得笔者的说法过于绝对。那我凭借着这四步走,做很多很多业绩我不就能往上爬了,不也是努力工作嘛。我还是在工作中努力不是嘛,笔者想说的......
  • 传输线理论part2:负载情况下的无耗传输线工作状态
    根据负载情况的不同,分为以下几种情况讨论:一端接负载一端接匹配阻抗一端短路一端开路情形一:一端接负载(图中以负载为坐标原点)此时,入射波沿-z方向传播,反射波沿+z方向传播,传输线上电压与电流的解为:电压反射系数:反射电压/入射电压负载处z=0,所以因为ZL=VL/IL......
  • Win10专业工作站版永久密钥(支持重装)
    Windows10专业工作站版是专为满足要求苛刻的工作负载而设计的Windows10版本。它包含了Windows10专业版的所有功能,并增加了一些额外的功能,使其更适合用于数据分析、工程设计和媒体创作等任务。Windows10专业工作站版密钥主要功能包括:支持高达8个CPU和6TB的......
  • Win11专业工作站版永久密钥(支持重装)
    Windows11专业工作站版是Windows11专业版的增强版本,针对需要更高性能和可靠性的工作负载进行了优化。它具有以下一些功能:支持多达8个CPU和64TB的内存,可满足最苛刻的应用程序的需求。支持ReFS文件系统,可提供更大的弹性和可扩展性。支持直接内存访问(RDMA),可提......
  • win10专业工作站版密钥
    Windows10专业工作站版是专为满足对性能和可靠性有更高要求的用户设计的Windows10版本。它包含了许多普通版Win10Pro没有的功能,着重优化了多核处理以及大文件处理,面向大企业用户以及真正的“专业”用户,例如:科学家和工程师:可以使用Windows10专业工作站版运行要求苛......