MS SQL Server 删除重复行数据

时间：2023-03-27 11:15:44浏览次数：44

标签：www url Server 行号 MS SQL rn com example

您可以使用以下 SQL 语句删除 MS SQL Server 表中重复的行：

WITH CTE AS (
  SELECT ROW_NUMBER() OVER(PARTITION BY column1, column2, ... columnN ORDER BY (SELECT 0)) RN
  FROM table_name
)
DELETE FROM CTE WHERE RN > 1;

您需要将 table_name 替换为要删除重复行的表名，并将 column1, column2, ... columnN 替换为用于检查重复的列名。该语句使用 ROW_NUMBER() 函数和 PARTITION BY 子句来标识重复的行，然后使用 DELETE 语句删除其中一个副本。

这样说有些抽象，下面举一个例子：

比如我有一个deadUrlRecord_copy1 表，存的数据如下格式。

这个表存在一个问题，url列有一部分是重复的。用group by语句可以查出来，有挺多重复的，那么，如何删除多余的数据，只保留一条呢？

这就要采用文章开头给出的语句了。

WITH cte AS (
    SELECT url,
           ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn
    FROM deadUrlRecord_copy1
    WHERE status = 'NotFound'
)
DELETE FROM cte WHERE rn > 1;

乍一看一脸懵逼，但是执行发现竟然成功删除了重复数据，达到了预期效果，为什么呢？

这要解释下这一行代码：

ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn

这是一种 SQL 语法，用于对一个查询结果集的行进行编号，并且可以根据特定列来分组编号。

具体来说，ROW_NUMBER() 是一个窗口函数，它会为查询结果集中每一行计算一个行号。而 OVER 子句则是指定如何定义窗口（window），也就是要给哪些行计算行号。在这个例子中，PARTITION BY url 表示按照 url 这一列进行分组，也就是说对于每个不同的 url 分别计算行号；ORDER BY url 则表示按照 url 这一列进行排序，这样同一个 url 中的行就会按照 url 的值依次排列。最后，AS rn 则是给这个新的行号列起个名字，即 rn。

例如，假设有如下表格：

id	url
1	www.example.com
2	www.example.com
3	www.example.com/foo
4	www.example.com/bar
5	www.google.com

如果执行以下 SQL 查询：

SELECT id, url, ROW_NUMBER() OVER (PARTITION BY url ORDER BY url) AS rn FROM my_table;

则会得到以下结果：

id	url	rn
1	www.example.com	1
2	www.example.com	2
3	www.example.com/foo	1
4	www.example.com/bar	1
5	www.google.com	1

其中，同一个 url 中的行拥有相同的行号，同时这个行号是按照 url 的值进行排序的。

然后执行刚才那段代码的片段试一下，可能更好理解：

url不同的，行号都是1。相同的，会从1开始排序，所有就出现了2.

然后用 DELETE FROM cte WHERE rn > 1; 删除行号>1的数据，就成功把多余的数据删除了，非常巧妙。

转 https://www.cnblogs.com/xieweikang/p/17227386.html

标签：www,url,Server,行号,MS,SQL,rn,com,example
From： https://www.cnblogs.com/wl-blog/p/17260855.html

SQL Server 索引类型及意义
一、什么是索引拿汉语字典的目录页（索引）打比方：正如汉语字典中的汉字按页存放一样，SQLServer中的数据记录也是按页存放的，每页容量一般为4K。为了加快查找的速度，汉语字（词）典......
变量覆盖--duomicms通杀漏洞
下载源码本地测试然后进行代码审计发现这个地方可能存在变量覆盖：/duomiphp/common.php查看包含了common.php的地方先看看后台登录的地方，调......
MySQL联合索引创建规则
1、索引应该按照最常用于查询的列的顺序创建。这样可以最大程度地提高查询性能。2、如果查询中包含的列与索引中的列顺序不一致，则无法使用索引。因此，如果您有多个查询，每个......
SqlServer（七）数据库优化
1、对查询进行优化，尽量避免全表扫描(select*fromTable),首先考虑在where及OrderBy使用的列加索引。2、尽量避免在where语句中对字段进行null值条件搜索，否则将导致......
SqlServer日期格式转换
常用：SELECTCONVERT(VARCHAR(100),GETDATE(),24)--:10:57:47SELECTCONVERT(VARCHAR(100),GETDATE(),108)--:10:57:49SELECTCONVERT(VARCHAR(100),GETDATE(),......
Centos7 安装 mysql 8
安装1.配置yum仓库#更新密钥rpm-importhttps:/repo.mysql.com/RPM-GPG-KEYmysql-202#安装Mysql8.x版本yum库rpm-Uvhhttps:/dev.mysql.com/get/mysql80-commu......
[pymysql]新增数据-手工新增-自动新增-批量执行
1.手工新增importpymysql#获取连接conn=pymysql.connect(host='10.105.212.1',port=3306,user='root',password='DemoDemo',database='......
[pymysql]查询基础
importpymysql#获取连接conn=pymysql.connect(host='10.105.212.1',port=3306,user='root',password='DemoDemo',database='db',cha......
一般怎么分析一个sql
explain语句进行分析。还需要进一步分析的话可以进行optimizer_trace，一共prepare、optimizer、execute阶段，主要关注optimizer阶段。key实际使用的索引。key_len使用的......
为啥安装Mysql, 启动不了服务？
安装过程中，总是卡在这，然后我想手动启动，也是报错，有搞过的么？谢谢。手动也打不开： ......

MS SQL Server 删除重复行数据

相关文章

赞助商

阅读排行