首页 > 数据库 >MySQL多列字段去重的案例实践

MySQL多列字段去重的案例实践

时间:2023-05-13 14:55:43浏览次数:60  
标签:code group distinct tt cdate 字段 ctotal MySQL 多列

作者:刘晨

网名 bisal ,具有十年以上信息系统建设经验,目前主要从事数据库应用研发能力提升和技术管理方面的工作,Oracle ACE (Alums),腾讯云TVP,墨天轮MVP,拥有Oracle OCM & OCP、EXIN DevOps Master 、SCJP、OBCA、腾讯云CloudLite、PCSD、GDCA等技术认证,国内首批Oracle YEP成员,OCMU成员,《DevOps 最佳实践》中文译者之一,CSDN & ITPub专家博主,公众号"bisal的个人杂货铺",长期坚持分享技术文章,多次在线上和线下分享技术主题。

本文来源:原创投稿

* 爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


 

同事提了个需求,如下测试表,有code、cdate和ctotal三列,

select * from tt;

 

现在要得到code的唯一值,但同时带着cdate和ctotal两个字段。提起"唯一值",想到的就是distinct。distinct关键字可以过滤多余的重复记录只保留一条。distinct支持单列去重和多列去重,如果是单列去重,简明易懂,即相同值只保留1个,如下所示,
select distinct code from tt;

 

多列去重则是根据指定的去重列信息进行,即只有所有指定的列信息都相同,才会被认为是重复的信息,如下所示,code、cdate和ctotal都相同,才会返回记录,因此不是字面上的理解,即只要code是distinct的,cdate和ctotal无需关注。实际上当distinct应用到多个字段的时候,其应用的范围是其后面的所有字段,而不只是紧贴着它的一个字段,即distinct同时作用了三个字段,code、cdate和ctotal,并不只是code字段,

select distinct code, cdate, ctotal from tt;

 

而且distinct只能放到所有字段的前面,如果像这种,distinct之前有其它字段,则会提示错误,

select cdate, ctotal, distinct code from tt;
SQL 错误 [1064] [42000]: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'distinct code from tt' at line 1
但是如上SQL使用distinct关键字,并没有满足需求,即得到code的唯一值,但同时带着cdate和ctotal两个字段,可以看到有很多相同的code。除了distinct,group by子句也可以去重,从需求的理解上,如果按照code做group by,应该就可以得到唯一的code了,但是实际执行,提示这个错误,
select code, cdate, ctotal from tt group by code;
SQL 错误 [1055] [42000]: Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'test.tt.code' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

很常见的错误,因为sql_mode中含only_full_group_by规则,

show variables like '%sql_mode%';
ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION
only_full_group_by规则是指对group by进行查询的SQL,不允许select部分出现group by中未出现的字段,也就是select查询的字段必须是group by中出现的或者使用聚合函数的,即校验更加严格。P.S. MySQL不同版本sql_mode默认值可能是不同的,因此在数据库升级配合的应用迁移过程中,尤其要注意像only_full_group_by这种校验规则的改变,很可能是个坑。仅针对当前这个问题,可以在会话级,修改sql_mode,调整校验的强度,删除only_full_group_by,
set session sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION';

此时,使用group by,

select code, cdate, ctotal from tt group by code;

就可以得到想要的效果了,

 

除了group by,还可以使用group_concat函数,配合distinct,达到相同效果。
我们分解来做,可以看到group_concat(code),得到的是所有记录的code值拼接成新字段,
select group_concat(code), cdate, ctotal from tt group by code;

 

group_concat中加上distinct,就可以过滤所有的重复值,满足了需求,

select group_concat(distinct code), cdate, ctotal from tt group by code;

 

当然,这种在会话级通过改动sql_mode实现的路径,还需要考虑场景,因为缺少only_full_group_by的校验,按照code聚类了,但cdate和ctotal的值很可能是不唯一的,返回的结果,只能准确描述code的数据情况,不能代表cdate和ctotal的真实数据情况。因此,任何方案的选择,都需要结合实际的场景需求,我们找的方案,不一定是最好的,但需要最合适的。

本文关键字:#SQL# #去重#

文章推荐:

故障分析 | 执行sed命令卡死CPU消耗100%一例分析

技术分享 | OceanBase写入限速源码解读

故障分析 | 租户 memstore 内存满问题排查


关于SQLE

爱可生开源社区的 SQLE 是一款面向数据库使用者和管理者,支持多场景审核,支持标准化上线流程,原生支持 MySQL 审核且数据库类型可扩展的 SQL 审核工具。

SQLE 获取
类型地址
版本库 https://github.com/actiontech/sqle
文档 https://actiontech.github.io/sqle-docs-cn/
发布信息 https://github.com/actiontech/sqle/releases
数据审核插件开发文档 https://actiontech.github.io/sqle-docs-cn/3.modules/3.7_auditplugin/auditplugin_development.html

标签:code,group,distinct,tt,cdate,字段,ctotal,MySQL,多列
From: https://www.cnblogs.com/chuangsi/p/17397394.html

相关文章

  • MySQL学习日志四,数据表的类型
    --关于数据库引擎/*INNODB默认使用MYISAM早些年使用*/区别MYISAMINNODB事务支持不支持支持数据行锁定不支持支持外键约束不支持支持全文索引支持不支持表空间大小较小较大,约为MYISAM2倍常规使用操作:MYISAM节约空间,速度较快INNOD......
  • MySql学习日志三,测试小练习
    --跟着遇见狂神说mysql进行小练习--题目--目标:创建一个schoo1数据库--创建学生表(列,字段)使用Sql创建--学号int登入密码varchar(20)姓名,性別varchar(2),出生日期Cdatatime),家庭住址,email自己敲了一遍,成功了CREATETABLEIFNOTEXISTS`student`( `id`I......
  • MySQL-----DCL数据控制语言
    MySQL-----DCL数据控制语言用来管理数据库用户,控制数据库的访问权限用户管理查询用户USEmysql;SELECT*FROMuser;创建用户CREATEUSER'用户名'@'主机名'IDENTIFIEDBY'密码';修改用户密码ALTERUSER'用户名'@'主机名'IDENTIFIEDWITHmysql_native_passwordBY�......
  • MySql学习日志二,数据库的笔记
    数据库的列类型【了解】数值tinyint十分小的数据1个字节smallint较小的数据2个字节mediumint中等大小的数据三个字节int标准的整数4个字节常用intbigint较大的数据8个字节float浮点数4个字节double浮点数8个字节decimal字符......
  • mysql常用函数、查询和事务说明笔记
    1.MySQL中内置了很多字符串函数,常用的几个如下:运用示例:示例表里初始数据:  字段title和titleImageconcat:字符串拼接selectconcat(title,titleImage)asnewtitlefrom testtablewhereid=65;lower:全部转小写select lower(title) asnewtitlefrom testta......
  • Django如何把SQLite数据库转换为Mysql数据库
    大部分新手刚学Django开发的时候默认用的都是SQLite数据库,上线部署的时候,大多用的却是Mysql。那么我们应该如何把数据库从SQLite迁移转换成Mysql呢?之前我们默认使用的是SQLite数据库,我们开发完成之后,里面有许多数据。如果我们想转换成Mysql数据库,那我们先得把旧数据从SQLite导出......
  • CQRS读写分离MySQL数据库如何部署至Linux
    FearlessGuo首先有一台可以使用的Linux服务器,可以自行购买,当然也可以白嫖。有一款可以连接Linux的软件,我用的是putty在Linux上下载docker镜像,类似应用商店。安装过程参阅下方链接Linux安装Docker完整教程_docker安装_风随心飞飞的博客-CSDN博客下载mysql镜像,查看版本本次......
  • EntityFramework Core 6.0 MySql WebApi
    Microsoft.EntityFrameworkCoreMicrosoft.EntityFrameworkCore.DesignPomelo.EntityFrameworkCore.MySqlMicrosoft.EntityFrameworkCore.Tools-----------------------------------------------------------------------------------------------------------------------......
  • MySQL导入导出命令
    1.导出整个库的数据mysqldump-hhostname-uroot-pschema_name>/mysqldata/schema_all_data_with_ddl.sql上面的是会将整个schema的数据,表结构,索引都导出来;(视图和存储过程还待测);注意不同MySQL版本导出的表结构创建语句可能不兼容;如果只想导出数据,则可以在schema_name前......
  • macos13 m1 安装 mysql8.0.32
    1、下载安装包选择MySQLCommunityServer版本MySQL::DownloadMySQLCommunityServer(ArchivedVersions)2、可视化安装选择强密码策略3、环境变量配置cat.zshrcexportPATH=$PATH:/usr/local/mysql-8.0.32-macos13-arm64/binexportPATH=$PATH:/usr/local/mysq......