首页 > 数据库 >SQL语句优化

SQL语句优化

时间:2024-07-06 12:53:01浏览次数:21  
标签:语句 count 索引 age phone user SQL 排序 优化

SQL语句优化

  • 插入数据优化

    • 批量插入

      注:通过测试,若插入一千万条数据,不使用批量插入,每条一个insert需要耗费时间10分钟左右,但若是通过批量插入耗费时间为十几秒左右 ,由此可见使用批量插入可以极大的提高性能,同时减少多次访问数据库对数据库造成的压力。

      注:若在springboot或springcloud中使用批量插入,需要在写连接到数据库的配置时将批量插入的开关打开,否则即使你在使用 insert in() 时也不会使用批量插入。

      如果一次性需要插入大量数据,使用insert语句插入性能较低,此时可以使用MySQL数据库提供的load命令进行插入。

      前提:本地需要插入数据的文件中文件的内容需要符合规范。每个字段使用逗号分隔。(这里的逗号可以是别的符号,但必须保持一致)

      在数据库管理工具中使用批量插入的语句:

      #客户端连接服务端时,加上参数 --local-infile
      mysql --local-infile -u root -p
      #设置全局参数local——infile为1,开启从本地加载文件导入数据的开关
      set global local_infile = 1;
      #执行load指令将准备好的数据,加载到表结构中
      load data local infile '/rooot/sql1.log' (文件名) into table 'tb_user'(表名) fileds terminated by ','(设置字段间分割符) lines terminated by '\n';(设置换行符号)
      
    • 手动提交事务

    若不手动控制事务,每条sql语句都会是一个单独的事务,降低性能,而开启手动后可以多条sql语句一起提交,优化性能。

    • 主键顺序插入(与b+tree结构有关,涉及到页分裂)
  • 主键优化

    • 数据组织方式

      在InnoDB引擎中,表数据都是根据主键顺序组织存放的,这种存储方式的表称为索组织表。(想想B+Tree底层叶子结点结构,

      之前的文章里有,也可去百度B+Tree结构模型)

      所以建议主键存储时使用自增,在符合要求的情况下,尽量降低主键的长度,且使用自增,不要使用UUID随机生成,尽量避免产生页分裂。

  • order by 优化

    1. Using filesort:通过表的索引或全表扫描,读取满足条件的数据行,然后在排序缓冲区sort buffer中完成排序操作,所有不是通过索引直接返回排序结果的排序都叫做FileSort排序。该方法进行排序性能相对较低。

    2. Using index:通过有序索引顺序扫描直接返回有序数据,这种情况即为using index,不需要额外排序,操作效率高。

      所以我们在进行优化时尽量使进行排序时使用Using index

      例:

      #没有创建索引时
      select id,age,phone from tb_user order by age,phone (Using filesort)
      #创建索引
      create index idx_user_age_phone_aa on tb_user(age,phone)
      #创建索引后,根据age,phone进行升序排序
      select id,age,phone from tb_user order by age,phone (Using index)
      #创建索引后,根据age,phone进行降序排序
      select id,age,phone from tb_user order by age desc,phone desc (Using index)
      #根据age,phone进行排序,一个使用升序,一个使用降序
      select id,age,phone from tb_user order by age asc,phone desc; (Using filesort)
      #创建索引
      create index idx_user_age_phone_ad on tb_user(age asc,phone desc); (创建索引时age根据升序创建,phone根据降序创建)
      #根据age,phone进行排序,一个降序,一个升序
      select id,age,phone from tb_user order by age asc,phone desc; (Using index)
      
      • 根据排序字段建立合适的索引,多字段排序时,也遵循最左前缀法则。(前面的文章有介绍最左前缀法则)
      • 尽量使用覆盖索引。
      • 多字段排序,一个升序一个降序,此时需要注意联合索引在创建时的规则(ASC/DESC)
      • 如果不可避免的出现filesort,大量数据排序时,可以适当增加排序缓冲区大小sort_buffer_size(默认256k)。
  • group by 优化

    #执行分组 操作,根据profession字段进行排序
    select profession,count(*) from tb_user group by profession (Using temporary 使用临时表,性能低)
    #创建索引
    create index idx_user_pro_age_sta on tb_user(profession,age,status);
    #执行分组操作,根据profession字段分组
    select profession,count(*) from tb_user group by profession (Using index)
    #执行分组操作,根据age字段分组
    select age,count(*) from tb_user group by age (Using temporary 不满足最左前缀法则)
    #执行分组操作,根据profession进行筛选,age字段排序
    select age,count(*) from tb_user where profession = ‘软件工程’ group by age;(Using index 满足最左前缀法则)
    
    
    • 在分组操作时,可以通过索引来提高效率。
    • 分组操作时,索引的使用也是满足最左前缀法则的。
  • limit 优化

    • 一个常见又非常头疼的问题就是 limit 2000000,10,此时需要MySQL排序前2000010记录,仅仅返回2000000-2000010的记录,其他记录丢弃,查询排序的代价非常大。

    • 通过覆盖索引加子查询的方式优化:

      例:

      select * from tb_sku t,(select id from tb_sku order by id limit 2000000,10) a where t.id = a.id
      #此条sql语句如果看不懂可以先了解下多表查询中的子查询和自连接查询
      
  • count 优化

    • MyISAM引擎把一个表的总行数存在了磁盘上,因此执行count(*)的时候会直接返回这个数,效率很高;

    • InnoDB引擎就很麻烦了,他执行count(*)的时候,需需要把数据一行一行的从引擎里面读出来,然后累积计数。

    • 优化思路:自己计数

    • count的几种用法:

      • count是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加一,否则不加,最后返回累计值

      • 用法:count(*)、count(主键)、count(字段)、count(1)

      • count(主键): InnoDB引擎会遍历整张表,把每一行的主键id取出来,返回给服务层。服务层拿到主键后,直接按行进行累加(主键不可能为null)。

      • count(字段):

        • 没有NOT null约束:InnoDB引擎会遍历整张表把每一行的字段都取出来,返回给服务层,服务层判断是否为null,不为null,计数累加。
        • 有NOT null 约束:InnoDB引擎会遍历整张表把每一行的字段值都取出来,返回给服务层,直接进行累加。
      • count(1):InnoDB引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字1进去,直接按行进行累加。

      • count(*):InnoDB引擎并不会把全部字段取出来,而是专门做了优化,不取值,服务层直接按行进行累加。

        所以性能:count(字段)<count(主键)<count(1)≈count(*)

  • update 优化

    update student set no='20000100' where id = 1 #id为主键,必然有索引,所以加的是行锁
    
    update student set no='199999987' where name = '韦一笑' #(若是name没有设置索引,那么在修改时会加表锁,降低性能)
    

    InnoDB的行锁是针对索引加的锁,不是针对记录加的锁,并且该索引不能失效,否则会从行锁升级为表锁

标签:语句,count,索引,age,phone,user,SQL,排序,优化
From: https://www.cnblogs.com/hjqx/p/18287132

相关文章

  • Java面试八股之MySQL存储引擎都有哪些
    MySQL存储引擎都有哪些MySQL提供了多种存储引擎,每种引擎都有其独特的特性和用途。以下是一些常用的MySQL存储引擎:InnoDB默认存储引擎(自MySQL5.5版本起)。支持事务(ACID属性)、行级锁定和外键约束。使用B+树作为索引结构。适合需要高并发的事务处理和高可靠性的场景。MyISA......
  • sqlserver数据库MDF文件修复
    针对SQLServer数据库的MDF文件修复,这是一个相对复杂的过程,具体方法取决于文件的损坏程度、是否有备份以及数据库的状态。以下是一些常见的修复方法:使用备份恢复这是最直接且最可靠的方法。如果你有数据库的备份,并且备份是在MDF文件损坏之前创建的,那么你可以通过还原备份来恢......
  • MySQL 命名使用规范
    在数据库设计和开发过程中,命名规范是确保数据库结构清晰、易于维护和扩展的关键因素之一。良好的命名规范可以提高代码的可读性、可维护性和团队协作效率。本文将详细介绍MySQL数据库的命名使用规范,包括数据库、表、列、索引、约束、存储过程、函数、视图和触发器等方面的命名......
  • 【matlab】分类回归——智能优化算法优化径向基神经网络
    径向基(RadialBasisFunction,RBF)神经网络一、基本概念径向基函数(RBF):是一个取值仅仅依赖于离原点(或某一中心点)距离的实值函数。在RBF神经网络中,最常用的径向基函数是高斯核函数,其形式为:其中,x​为核函数中心,σ为函数的宽度参数(或方差),控制了函数的径向作用范围。二、网络结......
  • Mysql 索引
     在MySQL中,索引是一种数据结构,它能够帮助快速查找和检索表中的记录,从而提高查询性能。索引在数据库中类似于书籍的目录,可以快速定位到所需的内容。下面是关于MySQL索引的详细介绍,包括其概念、类型、如何使用以及如何在建表时指定索引。什么是索引索引是存储在数据库中的一......
  • Mysql 8.4 安装(Centos7.9)
    前置准备root环境下执行#关闭selinuxvi/etc/selinux/config#SELINUX=enforcing=>SELINUX=disabled#开通防火墙3306/tcpfirewall-cmd--permanent--add-port=3306/tcp下载链接获取https://dev.mysql.com/downloads/file/?id=529414下载&安装下载mkdir-p......
  • SQL语句(DQL)
    DataQueryLanguage(数据查询语言),用来查询数据库中表的记录DQL-基本查询DQL-条件查询(WHERE) --查询姓名为2个字的员工信息select*fromempwherenamelike'__';--查询身份证号最后一位是X的员工信息select*fromempwhereidcardlike'%X';select*fromem......
  • 多表查询sql
    概述:项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,分为三种:一对多多对多一对一一、多表关系一对多案例:部门与员工的关系关系:一个部门对应多个员工,一个员工对应一......
  • 免费分享一套SpringBoot+Vue校园求职人才招聘(企业招聘)网站系统【论文+源码+SQL脚本
    大家好,我是java1234_小锋老师,看到一个不错的SpringBoot+Vue校园求职人才招聘(企业招聘)网站系统,分享下哈。项目视频演示【免费】SpringBoot+Vue校园求职人才招聘网站(企业招聘)网站系统Java毕业设计_哔哩哔哩_bilibili【免费】SpringBoot+Vue校园求职人才招聘网站(企业招聘)......
  • 深度学习项目,代码改进,模型优化
    深度学习项目代码改进 预测模型模型优化,增加模块,python,预测,微调,融合,强化学习,深度学习,机器学习程序,环境调试,代码调通,模型优化,模型修改,时间序列,机器学习数据处理等开发工程,项目主攻:Pytorch,Tensorflow,Yolo,Unet,DNN,CNN,GAN,Transformer,matlab,训练模型,优化,price增加模......