MySQL UNION
的用法与实例
在本文中,我们讨论在 MySQL 中对两个结果集进行 UNION 运算,以及 UNION 运算的规则。
在 MySQL 中,UNION 操作符是一个集合操作符,它用于合并 【2 个结果集】
中的所有的行。
SQL 标准中定义了 3 个集合操作符: UNION, INTERSECT 和 MINUS。目前 MySQL 只支持 【UNION】
。
UNION
操作符语法
UNION 操作符用来合并两个 SELECT 语句
的结果集。UNION 操作符的语法如下:
SELECT statement
UNION [DISTINCT | ALL]
SELECT statement
说明:
- UNION 双目操作符,需要
两个 SELECT
语句作为操作数。 - UNION 中的 SELECT 语句中的
列数、列顺序必须相同
。 - UNION 运算包括 UNION DISTINCT 和 UNION ALL 两种算法,其中 UNION DISTINCT 可以简写为 UNION。
- UNION DISTINCT 或 UNION 将
过滤掉结果集中重复记录
。 - UNION ALL 将返回结果集中的
所有记录
。
UNION实例
建立测试表和测试数据
在以下实例中,我们创建 a 和 b 两个表进行演示。
创建测试表并插入测试数据
CREATE TABLE a (v INT);
CREATE TABLE b (v INT);
CREATE TABLE c (v INT);
INSERT INTO a VALUES (1), (2), (NULL), (NULL);
INSERT INTO b VALUES (2), (2), (NULL);
INSERT INTO c VALUES (3), (2);
a 表数据:
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| NULL |
+------+
4 rows in set (0.00 sec)
b 表数据:
+------+
| v |
+------+
| 2 |
| 2 |
| NULL |
+------+
3 rows in set (0.00 sec)
c 表数据:
+------+
| v |
+------+
| 3 |
| 2 |
+------+
2 rows in set (0.00 sec)
UNION 运算
以下语句对从 a 和 b 表返回的两个结果集进行 UNION 运算:
SELECT * FROM a
UNION
SELECT * FROM b;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
+------+
3 rows in set (0.00 sec)
从输出的结果可以看出,UNION 运算删除了结果集中的重复项
,返回一个唯一记录值的结果集。
UNION 是 UNION DISTINCT 的简写。
除了对两个表的记录进行 UNION 运算,也可以对 a, b 和 c 这 3 个表的记录进行 UNION 运算。如下:
SELECT * FROM a
UNION
SELECT * FROM b
UNION
SELECT * FROM c;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| 3 |
+------+
4 rows in set (0.00 sec)
本例等同于如下的运算步骤:
- 首先对 a 和 b 表的记录进行 UNION 运算,并返回结果集。
- 将第 1 步的结果集和 c 表的记录进行 UNION 运算。
UNION ALL运算
以下语句对从 a 和 b 表返回的两个结果集进行 UNION ALL 运算:
SELECT * FROM a
UNION ALL
SELECT * FROM b;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| NULL |
| 2 |
| 2 |
| NULL |
+------+
7 rows in set (0.00 sec)
从输出的结果可以看出,UNION ALL 保留了两个结果集中的所有行。
除了对两个表的记录进行 UNION ALL 运算,也可以对 a, b 和 c 这 3 个表的记录进行 UNION ALL 运算。如下:
SELECT * FROM a
UNION ALL
SELECT * FROM b
UNION ALL
SELECT * FROM c;
UNION 与 UNION ALL 组合运算
请看以下实例:
SELECT * FROM a
UNION
SELECT * FROM b
UNION ALL
SELECT * FROM c;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| 3 |
| 2 |
+------+
5 rows in set (0.00 sec)
本例的运算步骤如下:
- 首先对 a 和 b 表的记录进行 UNION 运算,并返回结果集。这一步运算删除了 a 和 b 表的重复记录。
- 将第 1 步的结果集和 c 表的记录进行 UNION ALL 运算。这一步并没有删除 c 表中与第 1 部结果集中的重复记录。
UNION排序
当需要对 UNION 运算的结果进行排序时,最需要在 SQL 语句的最后添加 ORDER BY
子句。
以下语句对从 a 和 b 表返回的两个结果集进行 UNION ALL 运算,并升序排序:
SELECT * FROM a
UNION ALL
SELECT * FROM b
ORDER BY v;
+------+
| v |
+------+
| NULL |
| NULL |
| NULL |
| 1 |
| 2 |
| 2 |
| 2 |
| 3 |
+------+
8 rows in set (0.01 sec)
UNION列数
当对两个结果集进行 UNION 运算的时候,要保证每个结果集具有相同的列数。否则就会产生错误。
请看如下的实例:
SELECT 1
UNION
SELECT 2, 3;
ERROR 1222 (21000): The used SELECT statements have a different number of columns
这是因为 SELECT 1 只有 1 列,而 SELECT 2, 3 则有 2 列数据。两个结果集列数不一样,导致了 UNION 运算产生错误。
结论
- UNION 运算用于将两个结果集合成一个,是数据行维度的组合。
- UNION 运算包括 UNION DISTINCT 和 UNION ALL 两种算法,其中 UNION DISTINCT 可以简写为 UNION。
- UNION 会删除两个结果集中的重复记录行,而 UNION ALL 则保留全部记录行。
- UNION 运算要求参与运算的两个结果集的列数必须一样。
- UNION 运算取第一个参与运算的结果集的列名作为最终的列名。
- 可以使用 ORDER BY 对 UNION 运算的结果进行排序。