首页 > 数据库 >记录一次SQL慢查询优化

记录一次SQL慢查询优化

时间:2025-01-02 13:40:26浏览次数:1  
标签:查询 索引 muc SQL msg 优化 channel

作者:京东物流 赫占星

一、慢SqL发现

在一次需求UAT上线后,本来在测试环境没问题的接口,UAT环境出现了接口超时,通过查询接口日志发现是SQL查询超时了,原因是UAT环境的数据量比测试环境大得多。

一般来说,我们可以通过数据库本身的慢查询日志去定位出问题的慢SQL,但是对于京东,易维平台为我们提供了更为方便的慢SQL查询方式。我们可以通过应用名称和时间范围等条件筛选出自己需要定位的慢SQL。

 

通过易维平台,我们拿到了我们出问题的慢SQL语句:


select
	count(1) as planed_count,
	sum(case when muc.read_flag = 1 then 1 else 0 end) as success_count,
	m.msg_no as msg_no,
	m.msg_title as msg_title,
	m.msg_publish_time as msg_publish_time,
	m.msg_publisher_erp as msg_publish_erp,
	muc.channel,
	t.terminal_name as channel_name
from message_user_channel muc
join message m on muc.msg_no = m.msg_no
join terminal t on muc.channel = t.terminal_code
where
	muc.msg_no = ?
	and m.is_delete = 0
group by muc.channel
order by m.msg_publish_time desc
limit ?, ?;

二、慢SQL分析与优化

一提到慢SQL分析,可能大家的首先想到的就是Explain命令,但是其实我们可以先从更高的视角去看问题。

我们可以从4个方面去分析,分别是表设计、数据量级、索引、语法。

1、库表设计

好的表设计会让我们的查询变得更方便,比如在表关系比较复杂时,适当增加中间表,会减少查询的复杂度。表设计优化过后仍无法满足业务需要,可以考虑分库分表设计。

2、数据量级

大部分慢SQL是在生产上线以后才暴露的,因为生产环境数据量的急剧膨胀,导致在测试环境执行毫无问题的SQL,在生产环境出现了慢查询,甚至可能直接执行超时。因此我们在编写SQL时,要充分考虑数据量级对SQL执行的影响。

这次问题涉及的慢SQL,就命中了这个问题。message_user_channel表是一个千万量级的表,此表前后又跟另外2张表做了JOIN关联,笛卡尔积直接爆炸,我尝试将原SQL在易维平台上执行,发现直接查询超时。所以我将原SQL优化成了以下样式,通过子查询的方式,达到减少数据量的目的:


select
	count(1) as planed_count,
	sum(case when muc.read_flag = 1 then 1 else 0 end ) as success_count,
	m.msg_no as msg_no,
	m.msg_title as msg_title,
	m.msg_publish_time as msg_publish_time,
	m.msg_publisher_erp as msg_publish_erp,
	muc.channel,
	(select t.terminal_name from terminal t where muc.channel = t.terminal_code) as channel_name
from message m
join message_user_channel muc on muc.msg_no = m.msg_no
where
	muc.msg_no = ?
	and m.is_delete = 0
group by muc.channel
order by m.msg_publish_time desc
limit ?, ?;

我们将优化后的SQL放在易维上查询,发现果真可以查询出结果了,但是优化还没有结束,查询时间可以进一步缩短,我们继续往后看。

3、索引

索引可以通过减少回表大大降低SQL的执行时间。索引创建以后不一定按照设计者所想的那样生效,所以我们需要通过Explain命令来分析我们的SQL,尤其是看索引是否按照设计生效。

 

 

•id:SELECT的查询序列号,体现执行优先级,如果是子查询,id的序号会递增,id 值越大优先级越高,越先被执行

•select_type:表示查询的类型

•table:输出结果集的表,如设置了别名,也会显示

•partitions:匹配的分区

•type:对表的访问方式

•possible_keys:表示查询时,可能使⽤的索引

•key:表示实际使⽤的索引

•key_len:索引字段的长度

•ref:列与索引的比较

•rows:扫描出的行数(估算的行数)

•filtered:按表条件过滤的⾏百分比

•Extra:执行情况的描述和说明

当我们发现SQL执行没有按照设计走索引时,我们需要分析索引失效原因,以下是一些常见的会导致索引失效的场景:

1.需符合最左匹配原则

2.字段类型转换导致不用索引

3.字段前面加函数/加减运算会导致索引失效

4.模糊查询使用通配符“%”开头会导致全表扫描

5.WHERE子句中使用!=或<>操作符会导致全表扫描

6.用IN或UNION来替换OR低效查询

7.尽量避免使用NOT IN,会导致引擎走全表扫描,建议用NOT EXISTS代替

注意:不是所有的SQL都必须走索引,这需要根据数据量级、业务场景等灵活分析,走索引也不意味着一定会更快,尤其是在数据量较小的情况下。另外不是索引包含的字段越多越好,索引是需要占用存储空间的,当数据量特别大时,索引的维护也是一个问题。

4、语法

除了上述索引失效相关语法外,我们还有以下语法需要注意:

1.尽量避免使用 SELECT *,只查询业务需要的字段

2.读取适当的记录LIMIT M,N

3.尽量不要超过三个表JOIN

4.减少子查询的使用,使用JOIN代替

5.删除表中所有记录时请用TRUNCATE,不要用DELETE

6.避免不必要的ORDER BY排序

再回到我们本次问题SQL本身,我们发现优化版本1中针对terminal表的字查询会被执行多次,所以我们可以使用先查询出中间结果再JOIN的方式,进一步缩短执行时间:


select
    temp.*,
    t.terminal_name as channel_name
from
    (
    select
        count(1) as planed_count,
        sum(case when muc.read_flag = 1 then 1 else 0 end ) as success_count,
        m.msg_no as msg_no,
        m.msg_title as msg_title,
        m.msg_publish_time as msg_publish_time,
        m.msg_publisher_erp as msg_publish_erp,
        muc.channel
    from message m
    join message_user_channel muc on muc.msg_no = m.msg_no
    where
        muc.msg_no = ?
        and m.is_delete = 0
    group by muc.channel
    order by m.msg_publish_time desc
    limit ?, ?
    ) temp
join terminal t on temp.channel = t.terminal_code;

三、总结

慢SQL是我们日常开发中常见的问题,而且往往只有生产上线后才能体现出来。因为库表设计可能因为历史数据兼容的原因导致不好修改,那数据量级、索引、语法就成了我们优化慢SQL非常有效的手段,希望此文能对大家有所帮助。

 

参考文献:

[1] Mysql慢查询及优化

[2] MySql慢查询解决方案

标签:查询,索引,muc,SQL,msg,优化,channel
From: https://www.cnblogs.com/Jcloud/p/18647458

相关文章

  • 基于遗传算法优化VMD参数
    基于遗传算法优化多尺度排列熵参数,类似于粒子群算法优化参数基于遗传算法优化VMD参数程序列表基于遗传算法优化VMD参数/Code.m , 420基于遗传算法优化VMD参数/Cross.m , 1605基于遗传算法优化VMD参数/Decode.m , 1158基于遗传算法优化VMD参数/hua_fft.m , 1558基于......
  • 网站流量分析及优化策略
    在当今数字化时代,网站不仅是企业展示形象的窗口,更是与用户互动、转化潜在客户的重要平台。因此,深入分析网站流量并据此进行优化,对于提升用户体验、增加用户粘性、促进业务增长至关重要。本文将探讨网站流量分析的基本方法及其在实际中的应用,并提出有效的优化策略。一、网站流......
  • 浅谈以 Oracle 为基准,GaussDB、达梦数据库(DM)和 PostgreSQL 的差异以及信创前景
    随着国内信息技术的快速发展,尤其是在“信息技术自主可控”(即信创)政策的推动下,国内企业和政府部门逐渐对数据库技术提出了自主可控的需求。尤其在数据库领域,国产数据库技术的崛起,正逐步替代传统的国际主流数据库系统(如Oracle等),成为我国数字化转型和数据安全战略中的关键一环。本......
  • Cause: java.sql.SQLDataException: ORA-01841: (完整) 年份值必须介于 -4713 和 +999
    报错信息:###Theerrormayexistinfile[E:\IdeaProjects\FeiShuEHR\target\classes\mapper\ZzzHrOaQingJiaMapper.xml]###TheerrormayinvolvedefaultParameterMap###Theerroroccurredwhilesettingparameters###SQL:SELECTDANHAO,A0190,LEAVE_TYPEI......
  • mysql5.5安装
    回忆一下mysql5.5安装配置方法,整理mysql5.5安装配置教程笔记,分享给大家。MySQL下载地址:http://dev.mysql.com/downloads/installer/1、首先进入的是安装引导界面2、然后进入的是类型选择界面,这里有3个类型:Typical(典型)、Complete(完全)、Custom(自定义)。这里建议 选择“自定......
  • 添加mysql 8.0的gpgkey
    在安装mysql8.0的存储库后,执行aptupdate的时候会出现报错:Err:1http://repo.mysql.com/apt/ubuntubionicInRelease                                                ......
  • 工商照面:社会信用代码、注册资本、法定代表人、经营范围、所属行业、所属工商局。基于
    基于API实现企业工商信息实时查询与详细数据获取在开发企业级应用时,实时获取准确的工商信息是关键。本文介绍一个高效的API接口,支持通过企业全名、注册号或统一社会信用代码,快速查询企业的工商信息及详细数据。接口功能该API支持查询企业工商信息,包括但不限于统一社会信用代码......
  • 开票信息查询与自动补全API:轻松实现高效开票的实现方法
    关键词开票信息自动补全,税号查询,纳税人识别号查询,企业税号查询,发票抬头查询,JSON接口,RESTfulAPI,企业信息查询,数据验证,开票系统集成作者微信:xujian_cq背景介绍在开票流程中,输入错误的企业信息或税号可能导致发票无效,给企业和用户带来额外的时间和成本消耗。......
  • Dify 框架连接 PGSQL 数据库与 Sandbox 环境下的 Linux 系统调用权限问题
    Dify框架连接PGSQL数据库与Sandbox环境下的Linux系统调用权限问题背景在使用Dify框架进行开发时,遇到了两个主要的技术挑战:代码节点连接到PGSQL(PostgreSQL)数据库。解决沙盒环境中由于系统调用限制导致的“operationnotpermitted”错误。本文档将详细描述如何解......
  • 优化检索增强生成(RAG)管道:实现更智能AI回应的高级技术
    RAG系统(面向企业RAG(RetrievalAugmentedGeneration)系统的多维检索框架)通过从大规模知识库中检索相关信息,并基于这些信息进行生成,为用户提供个性化的答案。这种结合信息检索和生成的方法,使得RAG系统在处理复杂问题和生成详细回答方面具有显著优势。然而,要充分发挥RAG系统的潜力......