首页 > 数据库 >Hive SQL必刷练习题:复购率问题

Hive SQL必刷练习题:复购率问题

时间:2025-01-13 12:03:46浏览次数:3  
标签:练习题 product group 复购 Hive order date id today

在这里插入图片描述

是说这个数据表中,找到最后一天 ,也就是今天的日期,max(date) over()S today 【借助开窗函数】

截至最后一天位置,也就是“今天“,表中的最新的一天

去看90天内“某商品复购率 = 近90天内购买它至少两次的人数 ÷ 购买它的总人数”

首先分析两个度量值,统计粒度是不一样的

近90天内购买它至少两次的人数:group by user_id , product_id

购买它的总人数:group by product_id

像这种统计粒度有包含关系。就可以先去把颗粒度细的那个group by出来
然后再此基础上继续查询,如果还想要粒度粗一点的度量值
就直接再此基础上用聚合函数即可

SELECT
	product_id,
	cast(sum(IF(num>=2,1,0)) / count(*) as decimal(16,2)) cpr
from(
  SELECT
  	 user_id,
     product_id,
	 count(*) num
  from(
      SELECT
          user_id,
          product_id,
          order_date,
          max(order_date) over() today
      FROM order_detail
  )t1
  	WHERE datediff(today,order_date)<=90
	group by user_id,product_id
	
)t2
group by product_id
order by cpr desc,product_id

标签:练习题,product,group,复购,Hive,order,date,id,today
From: https://blog.csdn.net/Mikkkee/article/details/145112161

相关文章

  • 背包九讲练习题
    01背包有N种物品和一个容量为V的背包,每种物品只有1个,第i种物品的体积为v[i],价值为w[i]。问将哪些物品装入背包,可使总体积不超过背包容量,且总价值最大,输出最大值。0<N,V<=1000;0<v[i],w[i]<=1000#include<bits/stdc++.h>intmain(){intN,V;std::cin>>N>>V;......
  • 打卡信奥刷题(583)用C++信奥P7724[普及组/提高] 远古档案馆(Ancient Archive)
    远古档案馆(AncientArchive)题目背景为了揭开月光能量背后的秘密,你来到了地下的远古档案馆。远古一族的秘密与遗忘的知识悉数贮藏于这片被尘封的迷宫中,你能成功解谜,获知远古的知识吗?题目描述远古档案馆的中心是一个解谜:有一个......
  • Hive4.0.1集群安装部署(Hadoop版本为3.3.6)(详细教程)
    前置环境​​​Linux环境Zookeeper集群安装(详细教程)-CSDN博客HadoopHA高可用集群3.3.6搭建(详细教程)-CSDN博客MySQL8.0.40离线安装(详细教程)_mysql8.0.40ftp-CSDN博客Hadoop3.3.6官网下载链接地址部署规划服务器节点MetaStoreHiveServer2bigdata01√bigd......
  • 2025华为OD机试已正式切换E卷,E卷新题正在火热更新中,支持在线OJ练习题目,三种语言解答,每
    文章目录......
  • hive数据迁移
    先迁移元数据迁移mysql,保证2边的hdfsservice的location相同迁移hdfs前要设定计划,假设数据1PB,里面有很多大表,最好能统计每个表的数据量以及大小hdfsdfs-du-sh/user/hadoop/data制定计划,进行分步骤迁移(小表直接按目录迁移,大表分区迁移)预估迁移速度。假设宽带是万兆带宽......
  • 【Apache Paimon】-- 14 -- Spark 集成 Paimon 之 Filesystem Catalog 与 Hive Catalo
    目录1.背景介绍2.环境准备2.1、技术栈说明2.2、环境依赖2.3、硬件与软件环境2.4、主要工具清单2.5、Maven项目结构2.6、mavenpom.xml依赖3.Spark与Paimon FilesystemCatalog集成3.1、HDFSFileSystemcatalog3.1.1、代码内容3.1.2、运行输出结果3.1.2.......
  • 我在广州学 Mysql 系列——与索引相关的练习题
    ℹ️大家好,我是练小杰,今天星期二啦,还有三天就是星期五了,为了美好生活奋斗吧朋友们!本文将学习MYSQL中数据表内容的索引相关练习题目~~复习:......
  • 【题库】人工智能训练师练习题
    单选题1、Windows系统不能进行数据爬虫。A.正确B.错误2、自然语言处理是一门融语言学、计算机科学、心理学于一体的科学。A.正确B.错误3、文本分类是指将文本按照内容的不同判别到一个或多个预先确定的文本类别之中的过程。A.正确B.错误4、中文分词只局限于中文应......
  • 在 Windows 中,配置单元文件(Registry Hive)是 Windows 操作系统注册表的核心组成部分。W
    在Windows中,配置单元文件(RegistryHive)是Windows操作系统注册表的核心组成部分。Windows注册表是一个存储系统配置和应用程序设置的数据库,而配置单元(Hive)是这些数据库的一个逻辑分区。每个Hive存储一组与系统或用户相关的数据,结构上可以视为一个分区或区域。什么是配置单......
  • 计算机毕业设计PyHive+Hadoop深圳共享单车预测系统 共享单车数据分析可视化大屏 共享
    温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!温馨提示:文末有CSDN平台官方提供的学长联系方式的名片!作者简介:Java领域优质创作者、CSDN博客专家、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO......