首页 > 其他分享 >数据处理

数据处理

时间:2022-11-01 21:07:06浏览次数:75  
标签:COUNT price vend 数据处理 prod id SELECT

1. 汇总数据函数

1.AVG() -- 求平均值我们可以求某个字段所有行的平均值,例如:

SELECT 
AVG(prod_price)
FROM
products;

运行结果如下:

数据处理_sql

我们可以给平均值起一个名字,例如:

SELECT 
AVG(prod_price) avg_price
FROM
products;

运行结果如下:

数据处理_最小值_02

我们还可以对符合条件的行求平均值,例如:

SELECT 
AVG(prod_price)
FROM
products
WHERE
vend_id = 'BRS01';

运行结果如下:

数据处理_最小值_03

这里有两点要说明下:1.AVG() 会忽略列值为NULL的行。2.AVG()只能用来确定特定数值列的平均值。

2.COUNT() -- 计数我们使用COUNT()函数进行计数。COUNT() 函数有两种使用方式:(1). 使用 COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。(2). 使用 COUNT(column)对特定列中具有值的行进行计数,忽略 NULL 值。例如:

SELECT 
COUNT(*)
FROM
customers;

运行结果如下:

数据处理_数据_04

SELECT 
COUNT(cust_email)
FROM
customers;

运行结果如下:

数据处理_sql_05

如果指定列名,则 COUNT()函数会忽略指定列的值为 NULL 的行,但如果COUNT()函数中用的是星号(*),则不忽略。

3.MAX() -- 求最大值

SELECT 
MAX(prod_price)
FROM
products;

运行结果如下:

数据处理_sql_06

4.MIN() -- 求最小值

SELECT 
MIN(prod_price)
FROM
products;

运行结果如下:

数据处理_最小值_07

MAX(),MIN()函数会忽略值为NULL的行。

5.SUM() -- 求和

# 所有订单的金额之和。
SELECT
SUM(quantity * item_price)
FROM
orderitems;

运行结果如下:

数据处理_sql_08

汇总函数用来汇总数据,这些函数都很高效,一般比自己在程序中计算要快得多,所以能用汇总函数解决的我们就不要自己在程序中计算。

2. 分组

假设我们要求每个供应商的商品价格的平均值,如果一个供应商一个供应商的计算,显然过于麻烦。这时候我们可以使用GROUP BY子句。

SELECT 
vend_id,
AVG(prod_price)
FROM
products
GROUP BY
vend_id;

运行结果如下:

数据处理_sql_09

在使用 GROUP BY 时,除计算语句外,SELECT 语句中的每一列都必须在 GROUP BY 子句中给出。GROUP BY 子句必须出现在 WHERE 子句之后,ORDER BY 子句之前。

像对行进行过滤一样,我们也可以对分组进行过滤。与过滤行不同的是,过滤分组不能使用 WHERE 子句,因为 WHERE 子句没有分组的概念,我们可以使用另外一个子句 HAVING。WHERE 用来过滤行,HAVING 用来过滤分组。WHERE 在数据分组前进行过滤,HAVING 在数据分组后进行过滤。例如:

#  每个供应商供应商品的平均价格。
SELECT
vend_id,
AVG(prod_price) AS avg_price
FROM
products
GROUP BY
vend_id;

运行结果如下:

数据处理_数据_10

使用 having 进行过滤

# 使用 having 进行过滤
SELECT
vend_id,
AVG(prod_price) AS avg_price
FROM
products
GROUP BY
vend_id
HAVING
avg_price > 5;

运行结果如下:

数据处理_最小值_11

# 每个供应商的商品数
SELECT
vend_id,
count(*)
FROM
products
GROUP BY
vend_id;

运行结果如下:

数据处理_最小值_12

每个供应商商品价格的最大值

# 每个供应商商品价格的最大值
SELECT
vend_id,
MAX(prod_price)
FROM
products
GROUP BY
vend_id;

运行结果如下:

数据处理_数据_13

每个供应商商品价格的最小值

# 每个供应商商品价格的最小值
SELECT
vend_id,
MIN(prod_price)
FROM
products
GROUP BY
vend_id;

运行结果如下:

数据处理_sql_14

每个订单的金额

# 每个订单的金额
SELECT
order_num,
SUM(quantity * item_price)
FROM
orderitems
GROUP BY order_num;

运行结果如下:

数据处理_最小值_15

#SQL 子句的顺序 
SELECT
FROM
WHERE
GROUP BY
HAVING
ORDER BY

下列哪一个函数可以求平均值?

数据处理_sql_16

A. COUNT()

B. MAX()

C. AVG()

D. SUM()

标签:COUNT,price,vend,数据处理,prod,id,SELECT
From: https://blog.51cto.com/u_15641375/5814998

相关文章

  • ENVI5.6.2中北京三号卫星A星数据处理方法
    北京三号卫星A星于2021年6月11日,搭载了0.5米全色、2米多光谱(蓝、绿、红、近红外波段)相机,成像宽幅优于23km。ENVI5.6.2中完全支持北京三号卫星A星图像数据处理,包括数据打开......
  • js数据处理4
    <template><ModuleBox2title="数据趋势图"bgType="2":cityShow="true"moduleType="sjqs":styleObj="styleObj"><divclass="echarts-box">......
  • 大数据处理架构Hadoop
    Hadoop可以支持多种编程语言HDFS分布式文件系统MapReduce分布式并行编程框架这两大核心组件用于解决怎么实现海量数据的分布式存储和怎么实现海量数据分布式处理Hiv......
  • python3使用libpcap库进行抓包及数据处理
    python版本:python3.9libpcap版本:1.11.0b7pythonlibpcap库是底层绑定c语言libpcap库的开发包,旨在提供python应用可访问的unixclibpcap库API(以及为win32系统提供的Npca......
  • 前端项目实战68-数据处理之一个数组和一个对象
    exportfunctionmyContact(target:any,source:any){for(const[key,value]ofObject.entries(source)){const[name,index]=key.split('-')//要......
  • js数据处理4
    <template><ModuleBox2title="数据趋势图"bgType="2":cityShow="true"moduleType="sjqs":styleObj="styleObj"><divclass="echarts......
  • python3使用mutagen进行音频元数据处理
    python版本:python3.9  mutagen版本:1.46.0mutagen是一个处理音频元数据的python模块,支持多种音频格式,是一个纯粹的python库,仅依赖python标准库,可在Python3.7及以上版......
  • 复杂场景数据处理的 OLTP 与 OLAP 融合实践
    本文首发于NebulaGraph公众号DagController介绍DagController是NebulaGraph企业版的系统,经过反复测试无误后进行了发布,它主要解决的是OLTP和OLAP的融合问题......
  • python 图形的数据处理 (折线图为例)
    1.通过json模块对数据进行处理ab173.com是懒人工具-json在线解析,可以通过他对json数据进行格式化的分析。"""演示可视化需求1:折线图开发"""importjsonfrompyec......
  • openmetadata 元数据处理标准
    openmetadata对于元数据的处理也是基于了schema主要是workflow这个定义,包含了不同的定义,基于自己定义的workflow进行执行数据的获取、处理以及写入参考workflow定义......