【数据库】PostgreSQL中的DISTINCT ON和DISTINCT的区别

时间：2024-02-05 09:03:56浏览次数：39

标签：PostgreSQL name DISTINCT age id column1 数据库 column2

深入理解PostgreSQL中的DISTINCT ON和DISTINCT

在数据库查询中，我们经常会遇到需要去除重复数据的情况。在PostgreSQL中，我们可以使用DISTINCT和DISTINCT ON来实现这个目标。那么，它们之间有什么区别呢？本文将详细介绍这两种方法的用法、区别以及适用场景。

DISTINCT的基本用法

DISTINCT是SQL中的一个关键字，用于从查询结果中去除重复的行。它的基本语法如下：

SELECT DISTINCT column1, column2, ...
FROM table_name;

这里的column1, column2, …表示需要去重的列名，table_name表示表名。例如，我们有一个名为students的表，包含id、name和age三个字段，我们想要查询所有不重复的名字，可以使用以下语句：

SELECT DISTINCT name
FROM students;

执行上述语句后，我们会得到一个包含所有不重复名字的结果集。

DISTINCT的局限性

虽然DISTINCT可以去除重复的行，但它有一个明显的局限性：它只能作用于所有选定的列。也就是说，如果多个列的值相同，但其他列的值不同，那么这些行仍然会被当作重复行处理。为了解决这个问题，PostgreSQL提供了DISTINCT ON关键字。

DISTINCT ON的基本用法

DISTINCT ON与DISTINCT类似，也是用于去除重复行。但它允许我们对多个列进行去重操作，而且可以根据指定的列对结果集进行排序。DISTINCT ON的基本语法如下：

SELECT DISTINCT ON (column1, column2, ...) column1, column2, ...
FROM table_name
ORDER BY column1, column2, ...
;

这里的column1, column2, …表示需要去重的列名，table_name表示表名。例如，我们有一个名为students的表，包含id、name和age三个字段，我们想要查询每个班级中年龄最大的学生信息，可以使用以下语句：

SELECT id, name, age, class_id
FROM students
ORDER BY class_id, age DESC
DISTINCT ON (class_id, age);

执行上述语句后，我们会得到一个包含每个班级中年龄最大的学生信息的按班级和年龄降序排列的结果集。注意，如果有多个学生的年龄相同且最大，那么只会返回其中一个学生的信息。

DISTINCT ON与DISTINCT的区别

通过上面的介绍，我们可以看到DISTINCT和DISTINCT ON的主要区别在于：

DISTINCT作用于所有选定的列，而DISTINCT ON允许我们对多个列进行去重操作。
DISTINCT会去除所有重复的行，而DISTINCT ON只会去除部分重复的行。具体来说，它会保留每个分组中的第一个出现的行（根据ORDER BY子句排序）。如果有多个行具有相同的值，那么只有第一个出现的行会被保留。
DISTINCT不会改变查询结果的顺序，而DISTINCT ON会根据指定的列对结果集进行排序。
DISTINCT不能与其他聚合函数一起使用，而DISTINCT ON可以与GROUP BY子句一起使用。例如，我们可以使用以下语句查询每个班级的平均年龄：

SELECT class_id, AVG(age) as average_age
FROM students
GROUP BY class_id
ORDER BY class_id, average_age DESC;

总结一下，DISTINCT和DISTINCT ON都是PostgreSQL中用于去除重复行的方法，但它们的用法和限制有所不同。在实际开发中，我们需要根据具体需求选择合适的方法来优化查询性能。希望本文能帮助你更好地理解和使用这两种方法。

标签：PostgreSQL,name,DISTINCT,age,id,column1,数据库,column2
From： https://www.cnblogs.com/bigleft/p/18007342

第22天：安全开发-PHP应用&留言板功能&超全局变量&数据库操作&第三方插件引用
#数据库操作-mysqli函数&增删改查PHP函数：连接，选择，执行，结果，关闭等参考：https://www.runoob.com/php/php-ref-mysqli.html常用：mysqli_connect()打开一个到MySQL的新的连接。mysqli_select_db()更改连接的默认数据库。mysqli_query()执行某个针对数据库的查询。mysqli_fetch......
非空处理 Java非空判断非空处理及mysql数据库字段的not null
1.mysql##去掉非空,如果非空又没有默认值，这样程序在添加数据的时候i，如果没有设置值就会报错。该操作很危险。##ALTERTABLE`order_test`ADDCOLUMN`test_card_name`NOTNULLVARCHAR(200)COMMENT'卡名称';##修改允许为空..ALTERTABLE`order_test`MODIFYCOLUMN`test......
mysql数据库--行级锁，间隙锁和临键锁详解
转载链接地址：MySQL数据库——锁-行级锁（行锁、间隙锁和临键锁）介绍行级锁，每次操作锁住对应的行数据。锁定粒度最小，发生锁冲突的概率最低，并发度最高。应用在InnoDB存储引擎中。InnoDB的数据是基于索引组织的，行锁是通过对索引上的索引项加锁来实现的，而不是对记录加的锁。对于行级......
数据库设计三大范式
第一范式(1NF)：属性不可分割，即每个属性都是不可分割的原子项。(实体的属性即表中的列)比如：姓名、年龄、电话，要分三个字段，不能放一个里面，方便查询。第二范式(2NF)：满足第一范式；且不存在部分依赖，即非主属性必须完全依赖于主属性。(主属性即主键；完全依赖是针对于联合主键的情况，非主键列......
鱼和熊掌如何兼得？一文解析 RDS 数据库存储架构升级
在2023年云栖大会上，阿里云数据库产品事业部负责人李飞飞在主题演讲中提到，瑶池数据库推出“DB+存储”一体化能力，结合人工智能、机器学习、存储等方法和创新能力，实现BufferPoolExtension能力和智能冷温热数据分层能力。在大会的《云数据库RDS年度发布与最佳实践》演讲中，阿里......
java代码实现自动生成数据库表er图
最近有同事看到字节跳动产品设计文档里有数据库表er图。就想问问又没有现成的工具也给直接生成一个er图，经查找验证发现并没有。因为现在表关系都是用的逻辑外键而非物理外键约束的，所以像navicat等工具就算生成了也没有描述关系的连接线。那么为了满足需求，这边就略微出手写了个代码......
Oracle向数据库插入日期格式数据
插入系统日期insertintostudent(sno,sname,birthdate)values(007,'omit',sysdate);插入Oracle数据库指定格式的日期insertintostudent(sno,sname,birthdate)values(008,'Ding','18/11月/2022');使用todate()插入其他格式的日期(最常用)insertintostudent(sno,sname,......
解决缓存与数据库同步下的同步锁问题之分段锁
契子在实际业务会我们会使用第三方的缓存例如：Reids、Memcache等；但是，并且我们在查询使用缓存时都得尽可能的保证缓存的一致性，在读取时得保证尽可能的保证缓存拿到的是数据库的最新数据，那么在实现的逻辑上一般都为这样：1、请求线程先读取缓存实现2、如果缓存没有数据的话触发......
【PostgreSQL架构】PostgreSQL的最佳群集高可用性方案
转载：【PostgreSQL架构】PostgreSQL的最佳群集高可用性方案-腾讯云开发者社区-腾讯云(tencent.com)如果您的系统依赖PostgreSQL数据库并且您正在寻找HA的集群解决方案，我们希望提前告知您这是一项复杂的任务，但并非不可能实现。我们将讨论一些解决方案，您可以从中选择对您的容错要......
最新中国数据库排行出炉：阿里自研PolarDB首次登顶！
今天，数据库社区“墨天轮”发布了最新的一期中国数据库流行度排行榜，阿里云自研云原生数据库PolarDB首次登顶，并刷新了榜单总分纪录。该榜单根据搜索引擎数据、核心案例数、资质数量、专利数、论文数等标准，对目前主流的国产数据库进行综合评比，体现了数据库在互联网上的流行度。在2024......