首页 > 数据库 >SQL进阶,子查询与窗口函数

SQL进阶,子查询与窗口函数

时间:2022-10-14 15:35:34浏览次数:45  
标签:进阶 country 查询 分组 SQL payment SELECT 函数

SQL进阶,子查询与窗口函数_子查询

上一节给大家讲到SQL取数的一些基本内容,包含SQL简单查询与高级查询,需要复习相关知识的同学可以跳转至上一节,本节给大家讲解SQL的进阶应用,在实际过程中用途比较多的子查询与窗口函数,下面一起学习。



示例工具:MySQL8.0、Navicat Premium 12

本文讲解内容:子查询与窗口函数

适用范围:SQL进阶应用



子查询

子查询用于为主查询返回其所需数据,或者对检索数据进行进一步的限制,通常将一个查询(子查询)的结果作为另一个查询(主查询)的数据来源或判断条件,常见的子查询有WHERE子查询,HAVING子查询,FROM子查询,SELECT子查询,EXISTS子查询。

子查询是一种嵌套在其他 SQL 查询的 WHERE 子句中的查询,可以在 SELECT、INSERT、UPDATE 和 DELETE 语句中,同逻辑运算符一起使用。

使用子查询必须遵循以下几个规则:

  • 子查询必须括在圆括号中。
  • 子查询的 SELECT 子句中只能有一个列。
  • 子查询不能使用 ORDER BY,在子查询中,GROUP BY 可以起到同 ORDER BY 相同作用。
  • 返回多行数据的子查询只能同多值操作符一起使用,比如 IN 操作符。
  • 子查询不能直接用在聚合函数中。
  • BETWEEN 不能同子查询一起使用,但 BETWEEN 操作符可以用在子查询中。

创建数据表

通常情况下子查询都与 SELECT 语句一起使用,其基本语法如下所示:



SELECTFROMWHERE  column_name OPERATOR (SELECTFROMWHERE])

对于子查询的数据演示创建两个表,一个是薪水表,另一个是职位表,并且插入数据。


#创建薪水表SALARYCREATE TABLE(ID VARCHAR ( 10NAME VARCHAR ( 10AGE VARCHAR ( 10ADDRESS VARCHAR ( 10SAL INT(10) );

给薪水表插入数据,数据内容如下所示:



# 给薪水表插入数据INSERT INTO SALARY(ID,NAME,AGE,ADDRESS,SAL) VALUES('C001','Rmesh',35,'Ahmedabad',2000),('C002','Khilan',25,'Delhi',1500),('C003','Kaushik',23,'Kota',2000),('C004','Chaitali',25,'Mumbai',6500),('C005','Hardik',27,'Bhopal',8500),('C006','Komal',22,'MP',4500),('C007','Tom',26,'MP',5500),('C008','Muffy',24,'Indore',10000);

查询所有的薪水数据如下所示:


SELECT * FROM

SQL进阶,子查询与窗口函数_数据_02

同理创建一个职位表。


#创建职位表JOBCREATE TABLE(JID VARCHAR ( 10JB VARCHAR ( 10

给职位表插入数据,数据内容如下所示:


# 给职位表插入数据INSERT INTO JOB(JID,JB) VALUES('C001','Teacher'),('C002','Docter'),('C003','Teacher'),('C004','Worker'),('C005','Nurse'),('C006','Teacher'),('C007','Docter'),('C008','Teacher');

查询所有的职位数据如下所示:


SELECT * FROM

SQL进阶,子查询与窗口函数_窗口函数_03

子查询过滤

子查询最常见的使用是在WHERE子句的IN操作符中,以及用来填充计算列。先看一个简单的例子,要查询所有医生的薪水情况,这里首先在职位表中查询所有医生的JID,查询结果如下:


SELECTFROMWHERE JB='Docter';

SQL进阶,子查询与窗口函数_窗口函数_04

然后在薪水表中查询ID为'C002','C007'的薪水情况,查询结果如下:



SELECTFROMWHERE ID IN('C002','C007');

SQL进阶,子查询与窗口函数_子查询_05

这里使用子查询更加简便,子查询从内向外依次处理,在下面的SELECT语句中,MySQL实际上执行了两个操作,首先查询返回两个ID号:C002和C007。

然后,这两个值以IN操作符要求的逗号分隔的格式传递给外部查询的WHERE子句,可以看到输出的结果是正确的,并且与前面WHERE子句所返回的值相同。



SELECTFROMWHERE ID IN(SELECTFROMWHERE JB='Docter');

SQL进阶,子查询与窗口函数_子查询_06

使用子查询查询薪水大于8000的员工的所有信息,首先内部查询薪水大于8000的ID,然后外部使用一个WHERE查询即可得到结果。



SELECTFROMWHERE ID IN (SELECT IDFROMWHERE SAL > 8000);

SQL进阶,子查询与窗口函数_子查询_07

作为计算字段使用子查询

使用子查询的另一方法是创建计算字段,创建计算字段需要使用聚合函数,例如count,sum,avg,max,min等,这里首先计算平均薪水作为一个内查询,然后在外部使用WHERE子句进行查询,得出薪资比平均薪资低的员工的所有信息。




SELECT * FROMWHERE SAL < (SELECT AVG(SAL)FROM

SQL进阶,子查询与窗口函数_子查询_08

除使用WHERE过滤,还可以使用HAVING过滤,HAVING子句对分组统计函数进行过滤,也可以在HAVING子句中使用子查询,要查询薪资最高的人及其薪资情况,首先内部查询最高工资,然后外部以人名分组后使用HAVING子句过滤,查询结果如下。


SELECT NAME,SALFROMGROUP BY NAMEHAVING SAL = (SELECT MAX(SAL)FROM

SQL进阶,子查询与窗口函数_数据_09

窗口函数

窗口函数与数据分组功能相似,可指定数据窗口进行统计分析,但窗口函数与数据分组又有所区别,窗口函数对每个组返回多行,而数据分组对每个组只返回一行;窗口函数指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变化而变化,而数据分组是针对所有数据进行统计,窗口函数的写法如下。


<窗口函数> over (partition by <用于分组的列名>order by <用于排序的列名>)

窗口函数主要有两种,一种是专用窗口函数,包括rank、dense_rank、row_number等。另一种是聚合函数,包括sum、avg、count、max、min等,下面逐一介绍窗口函数的五个功能,分别是聚合、排序、极值、移动、切片,下面一起来学习。

创建表

首先创建一个金额表,年份、姓名、国家设置为字符串类型,交易金额设置为整型。


#创建金额表payCREATE TABLE(year VARCHAR ( 10name VARCHAR ( 10country VARCHAR ( 10payment INT(10) );

给金额表插入数值。



# 给金额表插入数据INSERT INTO pay(year,name,country,payment) VALUES(2017,'Lining','China',1119),(2018,'Lining','China',1176),(2018,'Zhaoqi','China',1388),(2019,'Zhaoqi','China',1597),(2018,'Jackie','USA',1028),(2019,'Jackie','USA',1934),(2020,'Jackie','USA',1837),(2017,'Tom','India',1578),(2018,'Tom','India',1329),(2019,'Tom','India',1578),(2020,'Tom','India',1399);

将所有的数据查询出来结果如下所示。


SELECT * from pay;

SQL进阶,子查询与窗口函数_子查询_10

一、聚合

1、计算列表总金额


SELECT *, SUM(payment) OVER() as Total_payment from

计算当前列表的总金额可以使用窗口函数,sum是求和,over()中不添加参数,则对所有数据进行求和,输出的结果都是15963。

SQL进阶,子查询与窗口函数_数据_11

2、计算各国家总金额


SELECT *, SUM(payment) OVER() asSUM(payment) OVER(PARTITION by country) asfrom

计算各国家总金额就要对各个国家分组,这里分组使用的是PARTITION by,PARTITION by的功能与GROUP BY的功能类似,指定按照那一列进行分组,用country分组求和,则每个country的输出结果一致。

SQL进阶,子查询与窗口函数_窗口函数_12

3、按国家降序累加求和金额


SELECT *, SUM(payment) OVER() as Total_payment,SUM(payment) OVER(PARTITION by country) asSUM(payment) OVER(PARTITION by country ORDER BY payment DESC) asfrom

这里使用SQL中常用的向下累计求和的方法,当使用order by时,没有rows between则意味着窗口是从起始行到当前行,所以对不同国家进行累加求和操作。

SQL进阶,子查询与窗口函数_子查询_13

4、不同国家人数计数

count()用于计数,与前面sum的用法基本一致,可以用count(distinct country)进行去重,如果用partition by进行分组,则分组后再计数。




SELECT *, COUNT(name) OVER() asCOUNT(name) OVER(PARTITION by country) asfrom

SQL进阶,子查询与窗口函数_子查询_14

5、 不同国家平均金额




SELECT *, AVG(payment) OVER() asAVG(payment) OVER(PARTITION by country) asfrom

使用avg聚合函数的用法与前面的聚合运算用法一致,PARTITION by同样用来分组,这里分组后求均值。

SQL进阶,子查询与窗口函数_窗口函数_15

6、各国家最低金额




SELECT *, MAX(payment) OVER() asMIN(payment) OVER(PARTITION by country) asfrom

这里MAX(payment)函数对整个数据计算最大值,使用PARTITION by对于不同的国家分组后然后计算最小值。

SQL进阶,子查询与窗口函数_窗口函数_16

二、排序

1、各国家按金额排序

使用窗口函数排序,会使用到三个函数,row_number,rank,dense_rank,他们的使用区别如下:

  • row_number从1开始,按照顺序,生成分组内记录的序列;
  • rank生成数据项在分组中的排名,排名相等会在名次中留下空位;
  • dense_rank生成数据项在分组中的排名,排名相等会在名词中不会留下空位。





SELECTROW_NUMBER()OVER(ORDER BY payment DESC) as '顺序排序',RANK()OVER(ORDER BY payment DESC) as '秩排序',DENSE_RANK()over(ORDER BY payment DESC) as '数据排序'from

row_number函数,按照行记录的顺序来排序,此处从1到11按顺序排列;rank函数,在排名相等会在名次中留下空位,此处共同排名为第4名,同时忽略第5名,继续往下排列;dense_rank排名相等会在名词中不会留下空位此处共同排名为第4名,不忽略第5名,继续往下排列。

SQL进阶,子查询与窗口函数_子查询_17

三、极值

1、当前行金额最高的人

first_value截止当前行的第一个,last_value截止当前行的最后一个。







selectfirst_value(name)over(order by payment desc) asfirst_value(name)over(order by payment asc) aslast_value(name)over(order by payment desc) aslast_value(name)over(partition by country order by payment desc rows between unbounded preceding and unbounded following) asfrom

first_value按分组排序后取范围内第1个值,last_value取最后1个值,因为默认窗口的关系,last_value会随着窗口的改变而改变,所以一般不用last_value,如果要用,则改变窗口为所有行,此处用来查询当前金额最大的人,以及截至当前金额最小的人。

SQL进阶,子查询与窗口函数_子查询_18

四、移动

1、按国家分组金额排名前1位和后1位人名

lag和lead是按照排序规则,取前多少位和后多少位,参数有3个,第1个是要取出来的列,第2个移动多少位,第3个是如果取不到,赋予的值,默认取不到是NULL。





selectlag(name,1,null)over(partition by country order by payment desc) aslead(name,1,'0')over(partition by country order by payment desc) asfrom

SQL进阶,子查询与窗口函数_子查询_19

五、切片

1、按金额切片

ntile(n)用于将分组数据按照顺序切分成N片,返回当前切片值,ntile把有序分区中的行分发到指定数据的组中,各个组有编号,编号从1开始,对于每一行,ntile返回此行所属的组的编号,ntile(3)表示将表切分为3组,ntile可以分组排序后切分,表示对当前的组内进行切分后排序。





selectntile(3) over(order by payment desc) asntile(2)over(partition by country order by payment desc) asfrom

SQL进阶,子查询与窗口函数_子查询_20



标签:进阶,country,查询,分组,SQL,payment,SELECT,函数
From: https://blog.51cto.com/u_15828536/5757023

相关文章

  • SQL取数,简单查询与高级查询
    一张表中通常会包含很多字段,造成数据冗余,在做数据分析时,我们仅需要提取数据分析所需要的字段,这里就需要用到数据选取的知识点,同时还可以依据特定条件筛选。本文介绍数据提取......
  • mysql创建索引的语句
     1. altertable table_name addindexindex_name(column) 2.altertabletable_nameaddprimarykey(column)/addunique主键索引或者唯一值索引 3.cre......
  • SQL基础知识及建表语句
    什么是数据库?简单来说,数据库是容纳数据的一个"容器",正如文件柜用来存放资料,冰箱用来储存食物,手机相册用来保存照片,数据库的产生极大方便存储数据,数据库不仅可以存储数据,还能......
  • MySQL索引(上)
    MySQL索引(上)该文摘抄自林晓斌老师的文章索引是一种数据结构,索引的出现其实就是为了提高数据查询的效率,就像书的目录一样。一本500页的书,如果你想快速找到其中的某一个知......
  • 1.0 Mysql索引的数据结构与算法
    索引是高效获取排序好的数据结构索引本身就是数据一部分关键信息,通过索引大大减少索引的数据量。索引信息需要额外的空间存储。创建和维护索引本身也会降低对数据的操作......
  • SQLSERVER如何正确修改主机名和IP地址
    一、 服务器改ip1.改hosts文件C:\Windows\System32\Drivers\etc\hosts修改对应ip2.注意是否为原ip指定了端口监听若未使用可不用修改start>MicrosoftSQLServe......
  • SQL软件安装
    软件介绍关系型数据库是目前最受欢迎的数据库管理系统,技术比较成熟,常见的关系型数据库有mysql、SQLServer、Oracle、Sybase、DB2等。SQLServer是Microsoft公司推出的关......
  • 使用hutool工具查询树形结构数据
    1.导入hutool工具的jar包<dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.7.22</version>......
  • SQL笔记
    日期转换函数参考:https://blog.csdn.net/qq_45515347/article/details/126457842参考:https://www.w3school.com.cn/sql/sql_create_table.asp......
  • Python进阶:全面解读高级特性之切片!
    导读:切片系列文章连续写了三篇,本文是对它们做的汇总。为什么要把序列文章合并呢?在此说明一下,本文绝不是简单地将它们做了合并,主要是修正了一些严重的错误(如自定义序列切片的......