首页 > 数据库 >牛客MySQL真题练习2(180-194)

牛客MySQL真题练习2(180-194)

时间:2022-10-19 17:47:32浏览次数:47  
标签:course 194 真题 sales 牛客 user tb id SELECT

  1. 统计每款的SPU(货号)数量,并按SPU数量降序排序
SELECT style_id, COUNT(item_id) AS SPU_num
FROM product_tb
GROUP BY style_id
ORDER BY SPU_num DESC
  1. 统计实际总销售额与客单价(人均付费,总收入/总用户数,结果保留两位小数)
SELECT SUM(sales_price) AS sales_total, ROUND(SUM(sales_price) / COUNT(DISTINCT user_id), 2) AS per_trans
FROM sales_tb
  1. 统计折扣率(GMV/吊牌金额,GMV指的是成交金额),以上例子的输出结果如下(折扣率保留两位小数)
SELECT ROUND(gmv / origin_price * 100, 2) AS 'discount_rate(%)'
FROM (
    SELECT
        SUM(sales_price) AS gmv,
        SUM(tag_price * sales_num) AS origin_price
    FROM product_tb t1 LEFT JOIN sales_tb t2 USING(item_id)
) a
  1. 统计每款的动销率(pin_rate,有销售的SKU数量/在售SKU数量)与售罄率(sell-through_rate,GMV/备货值,备货值=吊牌价*库存数),按style_id升序排序
SELECT
    style_id,
    ROUND(sku / (total_inventory - sku) * 100, 2) AS "pin_rate(%)", -- 在售SKU数量需要用总库存量减去已销售量
    ROUND(gmv / total_price * 100, 2) AS "sell-through_rate(%)"
FROM (
    ( # 1. 建立表a:计算各类商品的销量和售出总额
        SELECT
            style_id,
            SUM(sales_num) AS sku,
            SUM(sales_price) AS gmv
        FROM product_tb t1 LEFT JOIN sales_tb t2 USING(item_id)
        GROUP BY style_id
    ) a
    JOIN ( # 2. 建立表b:计算各类商品的总库存和备货值
        SELECT
            style_id,
            SUM(inventory) AS total_inventory,
            SUM(tag_price * inventory) AS total_price
        FROM product_tb
        GROUP BY style_id
    ) b USING(style_id)
) -- 命名就错了,为什么?
ORDER BY style_id

/* 重点:
1. 动销率的定义是“有销量的商品数量/所有商品数量”,而此题里指的是“有销量商品销售数量/剩余仍在销售的商品数量”
2. 直接连接两表求和存在风险:如果某个商品多次销售,则会连接后product表会出现多条行,导致求总存量 total_inventory 时增高
*/

/* # 简洁版本
SELECT style_id, ROUND(SUM(sku) / SUM(inventory - sku) * 100, 2) AS pin_rate,
                 ROUND(SUM(gmv) / SUM(inventory * tag_price) * 100,2) AS sell_through_rate
FROM
    (SELECT item_id, SUM(sales_num) AS sku, SUM(sales_price) AS gmv -- 注意这里用的是 item_id 分组
     FROM sales_tb
     WHERE sales_date BETWEEN '2021-11-01' AND '2021-11-30'
     GROUP BY item_id) t
LEFT JOIN product_tb pt USING(item_id)
GROUP by style_id
ORDER by style_id
*/
  1. 统计连续2天及以上在该店铺购物的用户及其对应的次数(若有多个用户,按user_id升序排序)
SELECT user_id, COUNT(1) AS days_count
FROM (
    SELECT # 1. 对日期进行排序
        DISTINCT sales_date, -- 可能有同一用户一天购物多次的情况
        user_id,
        DENSE_RANK() OVER (PARTITION BY user_id ORDER BY sales_date) AS ranking
    FROM sales_tb
) a
GROUP BY user_id, DATE_SUB(sales_date, INTERVAL ranking DAY)
    HAVING days_count > 1  # 2. 判断连续日期,并查询统计连续天数>=2的用户:使用date_sub()函数并聚合后判断日期连续 -> 如果 sales_date 减去ranking(天)是相同的日期,则说明他们这些天都是连续的日期(所以要使用dense_rank()并且对日期进行去重,不然重复的日期也会被记作连续的天数)
ORDER BY user_id

/* # 一个取巧的方法:连接自身
select s1.user_id AS user_id, (count(distinct s1.sales_date) + 1) AS days_count 
from sales_tb s1 join sales_tb s2 on s1.user_id = s2.user_id
    and s1.sales_date = date_add(s2.sales_date , interval 1 day)
group by user_id
order by user_id
*/

/* # 简洁版
SELECT user_id, (COUNT(user_id) + 1) AS days_count
FROM sales_tb
WHERE (user_id, sales_date) IN (SELECT user_id, DATE_ADD(sales_date, INTERVAL 1 DAY) FROM sales_tb)
GROUP BY user_id
ORDET BY user_id
*/

/* # 考虑周全的答案:同一个客户是可以有连续2天和连续2天以上的不同情况,这种需要在做一次聚合筛选
select user_id,max(days_count) days_count
from
(select distinct user_id,count(*) days_count
from(
    select distinct user_id,sales_date,
dense_rank()over(partition by user_id order by sales_date) rk
from sales_tb
) t1
group by user_id,date_sub(sales_date,interval rk day)
having days_count >=2 ) t2
group by user_id
order by user_id
*/
  1. 统计每个科目的转换率(sign_rate(%),转化率=报名人数/浏览人数,结果保留两位小数)。按照course_id升序排序。
SELECT course_id, course_name, ROUND(SUM(if_sign) / SUM(if_vw) * 100, 2) AS 'sign_rate(%)'
FROM course_tb t1 LEFT JOIN behavior_tb t2 USING(course_id)
GROUP BY course_id, course_name
ORDER BY course_id
  1. 统计直播开始时(19:00),各科目的在线人数,以上例子的输出结果为(按照course_id升序排序)
SELECT
    course_id,
    course_name,
    COUNT(user_id) AS online_num
FROM course_tb t1 LEFT JOIN attend_tb t2 USING(course_id)
WHERE DATE_FORMAT(in_datetime, '%H%i') <= 1900 AND DATE_FORMAT(out_datetime, '%H%i') > 1900
# WHERE TIME(in_datetime) <= '19:00:00' AND TIME(out_datetime) > '19:00:00'
# WHERE RIGHT(in_datetime, 8) <= '19:00:00' AND RIGHT(out_datetime, 8) > '19:00:00'
GROUP BY course_id, course_name
ORDER BY course_id

/*
关于本题对日期函数的使用考察最规范的描述:
WHERE TIME(in_datetime) <= DATE_FORMAT(course_datetime,'%H:%i:%s')
    AND TIME(out_datetime) > DATE_FORMAT(course_datetime,'%H:%i:%s')
-- DATE_FORMAT(日期,'%Y-%m-%d %H-%i-%s')
*/
  1. 统计每个科目的平均观看时长(观看时长定义为离开直播间的时间与进入直播间的时间之差,单位是分钟),输出结果按平均观看时长降序排序,结果保留两位小数。
SELECT course_name, ROUND(AVG(TIMESTAMPDIFF(MINUTE, in_datetime, out_datetime)), 2) AS avg_len
FROM course_tb t1 LEFT JOIN attend_tb t2 USING(course_id)
GROUP BY course_name
ORDER BY avg_len DESC
  1. 统计每个科目的出勤率(attend_rate(%),结果保留两位小数),出勤率=出勤(在线时长10分钟及以上)人数 / 报名人数,输出结果按course_id升序排序
 # 两个指标分开计算
SELECT 
    course_id,
    course_name,
    ROUND((SUM(len)/sign_cnt)*100, 2) 'attend_rate(%)'
FROM(
    SELECT
        course_name,
        course_id,
        SUM(if_sign) AS sign_cnt
    FROM behavior_tb
    JOIN course_tb USING(course_id)
    GROUP BY course_id, course_name) TB1
JOIN(
    SELECT 
        course_id,
        user_id,
        IF(SUM(TIMESTAMPDIFF(SECOND, in_datetime, out_datetime))>600, 1, 0) AS len -- 直接用MINUTE可能会少算。实际上还需要考虑进入时间是否在开播之前,最好也考虑离开时间
    FROM attend_tb
    GROUP BY course_id, user_id) TB2
USING(course_id)
GROUP BY course_id, course_name
ORDER BY course_id

/*
# 本题考察点是如何连接三张表。可以用不同的JOIN来直接连接三张表
select b.course_id, a.course_name,
round(count(distinct case when timestampdiff(minute, in_datetime, out_datetime) >= 10 then b.user_id else null end)/
    count(distinct case when if_sign=1 then b.user_id else null end) * 100, 2)
from attend_tb c right join behavior_tb b using (user_id,course_id) join course_tb a using (course_id) 
group by b.course_id, a.course_name
order by b.course_id
 
# 注意 b 表和 c 表连接了两个user_id, course_id,且因为 b 表包含 c 表,所以要用 right join。
进而,因为用的是right join,连接表之后,c 表中100客户一共两次登录,所以 b 表会重复100客户的情况,所以SUM(if_sign)也要去重
*/

/*
 # 只考虑一个指标的详细计算
select
    course_id,course_name,
    round(count1/sum(if_sign)*100,2) as attend_rate
from (
    select
        course_id,count(distinct user_id) as count1
    from attend_tb
    where timestampdiff(second,in_datetime,out_datetime)>=10*60
    group by course_id) a
join behavior_tb using (course_id)
join course_tb using (course_id)
group by course_id,course_name
order by course_id
*/
  1. 统计每个科目最大同时在线人数(按course_id排序)

和某度信息流T163的思路是一致的,虽然这道题中没有提到同一时间即有进来又有出去怎么处理,可以默认先计算进来的再计算出去的

  1. 统计11月份日人均回答量(回答问题数量/答题人数),按回答日期排序,结果保留两位小数
SELECT answer_date, ROUND(COUNT(*) / COUNT(DISTINCT author_id), 2) AS per_num
FROM answer_tb
WHERE MONTH(answer_date) = 11 -- DATE_FORMAT(answer_date, '%Y-%m') = '2021-11'
GROUP BY answer_date
ORDER BY answer_date
  1. 回答字数大于等于100字的认为是高质量回答,请你统计某乎问答高质量的回答中用户属于1-2级、3-4级、5-6级的数量分别是多少,按数量降序排列
/*
SELECT
    (CASE WHEN author_level IN (1, 2) THEN "1-2级"
    WHEN author_level IN (3, 4) THEN "3-4级"
    ELSE "5-6级"
    END ) AS level_cnt,
    COUNT(author_level) AS num
FROM (
    SELECT author_id, author_level
    FROM author_tb t1 LEFT JOIN answer_tb t2 USING(author_id)
    WHERE char_len >= 100
) a
GROUP BY level_cnt
ORDER BY num DESC

# 本来以为统计的是用户数,结果是回答数,所以没必要对用户去重,从而没必要想得这么复杂
*/

SELECT
    (CASE WHEN author_level <= 2 THEN "1-2级"
    WHEN author_level >= 5 THEN "5-6级"
    ELSE "3-4级"
    END ) AS level_cnt,
    COUNT(*) AS num
FROM author_tb t1 LEFT JOIN answer_tb t2 USING(author_id)
WHERE char_len >= 100
GROUP BY 1
ORDER BY 2 DESC
  1. 统计11月份单日回答问题数大于等于3个的所有用户信息(author_date表示回答日期、author_id表示创作者id,answer_cnt表示回答问题个数)。若有多条数据符合条件,按answer_date、author_id升序排序
SELECT answer_date, author_id, COUNT(*) AS answer_cnt -- 计数不需去重
FROM answer_tb
WHERE MONTH(answer_date) = 11
GROUP BY answer_date, author_id
HAVING answer_cnt >= 3
ORDER BY answer_date, author_id
  1. 统计回答过教育类问题的用户里有多少用户回答过职场类问题
SELECT COUNT(DISTINCT author_id) AS num
FROM answer_tb t1 LEFT JOIN issue_tb t2 USING(issue_id)
WHERE author_id IN (
    SELECT DISTINCT author_id
    FROM answer_tb t1 LEFT JOIN issue_tb t2 USING(issue_id)
    WHERE issue_type = 'Education'
)
    AND issue_type = 'Career'

/*
# 取巧,计数法
SELECT COUNT(*) AS num
FROM (
    SELECT author_id
    FROM answer_tb t2 LEFT JOIN issue_tb t1 ON (t1.issue_id = t2.issue_id)
        AND issue_type IN ('Education', 'Career')
    GROUP BY author_id
        HAVING COUNT(DISTINCT issue_type) = 2
) a
*/

/*
# 见题拆题法(可以直接从author_id的首字母推出这个问题分属什么类别)
SELECT COUNT(DISTINCT author_id) num
FROM answer_tb
WHERE issue_id LIKE 'E%'
      AND author_id IN (SELECT author_id
                    FROM answer_tb
                    WHERE issue_id LIKE 'C%')
*/
  1. 统计最大连续回答问题的天数大于等于3天的用户及其等级(若有多条符合条件的数据,按author_id升序排序)

与之前的题目T184类似

标签:course,194,真题,sales,牛客,user,tb,id,SELECT
From: https://www.cnblogs.com/Jojo-L/p/16803073.html

相关文章

  • 牛客 指数循环节
     题目描述请注意每次的模数不同。输入描述:第一行两个整数n,m表示序列长度和操作数接下来一行,n个整数,表示这个序列接下来m行,可能是以下两种操作之一:操作1:区间[l,r]加上......
  • 考研数学 | 关于考研数学真题使用方法和模考的个人建议
    关于22年真题建议留到最后,供自己模拟使用!配备答题卡,体验考场的感觉,也可是20、21、22这三年,这个自己斟酌一下就行!09至21年真题如何做?个人的建议是:第一遍:先按套卷做,模......
  • 真题分析:excel求季度
    案例来源:第12套真题excel部分题目:在“月份”列中计算季度,格式如“1季度”。必须使用函数。参考答案:以B3单元格为例,大猫提供两种解法解法1容易理解,书写较为麻烦;解法2书写简单......
  • 10秒搞定流程图绘制(真题)
    案例来源:第19套真题说明:本题的流程图想要严丝合缝的绘制出来,会占用大量的时间和精力,10秒搞定怎么做到?操作步骤:1.绘制画布,插入任意形状。2.右击形状,添加文字。3.剪切文字,一股......
  • React-Hooks怎样封装防抖和节流-面试真题
    Debouncedebounce原意消除抖动,对于事件触发频繁的场景,只有最后由程序控制的事件是有效的。防抖函数,我们需要做的是在一件事触发的时候设置一个定时器使事件延迟发生,在......
  • 牛客直通笔试
    一、选择题String类能否被继承答案是不能,原因是String本身是用final修饰的二、算法题......
  • 2022牛客国庆集训派对day1
    B题意:给定一个01字符串,你需要找到最长的一个子串和最长的一个子序列,分别使得其中01的个数相同。做法:子序列很好算2×min(cnt0,cnt1)子串可以考虑前缀和将0与1的个数......
  • React-Hooks怎样封装防抖和节流-面试真题
    Debouncedebounce原意消除抖动,对于事件触发频繁的场景,只有最后由程序控制的事件是有效的。防抖函数,我们需要做的是在一件事触发的时候设置一个定时器使事件延迟发生,在......
  • 最全的2021蓝桥杯算法课《算法很美》的学习笔记总目录+真题详解
    这里写目录标题​​第一章位运算​​​​第二章递归​​​​第三章查找与排序​​​​......
  • P1194 买礼物
    P1194买礼物普及的题目,而且一眼就能看出该用什么做法。我主要是决定这道题建图的思想值得借鉴,每样东西原本的价格是a,所以新建一个节点0,0向i连边,边权为a,这样一共就有b......