首页 > 数据库 >Hive提取小时内,分组排名前3的sql

Hive提取小时内,分组排名前3的sql

时间:2023-02-02 10:36:21浏览次数:47  
标签:bea Hive times item bigint 分组 user sql id


表的结构是这样的,时间的范围我是提取了几个小时内的数据

create table  `alibaba.user_bea` (
user_id bigint,
item_id bigint,
cate_id bigint,
times string,
bea int

)
PARTITIONED BY (dt STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
STORED AS orc;

提取时间

select item_id,ranks from (Select item_id, from_unixtime(cast(times as bigint),'yyyyMMdd HH')  as  times,row_number() over (partition by times,cate_id  order by count(*)  desc )as  ranks  from user_bea  group by cate_id ,times,item_id)t1 where ranks<=3;

Hive提取小时内,分组排名前3的sql_hive

​​数据下载地址​​ 导入方法如下

#hdfs路径
load data inpath "/flinkworkspace/work/input.har/part-0" overwrite into table user_bea_tmp;
#本地路径
load data local inpath "/home/lin/part-0" overwrite into table user_bea_tmp;


标签:bea,Hive,times,item,bigint,分组,user,sql,id
From: https://blog.51cto.com/u_15063934/6033045

相关文章

  • hive的Caused by: org.apache.hadoop.hdfs.BlockMissingException: Could not obtain
    早上起来去跑个hive的sql,稍微复杂点sql,就会报错如Causedby:org.apache.hadoop.hdfs.BlockMissingException:Couldnotobtainblock:BP-572947236等,经过一个一个小时......
  • Mysql事务
    事务的基本概念谈到事务,首先要谈到事务的ACID机制,ACID包括原子性,一致性,隔离性和永久性.原子性,分别概述一下这四个概念原子性要么全部成功,要么全部失败一致性一致性是......
  • Mysql索引相关的知识复盘一
    索引的作用和分类索引的优缺点优点:加快数据检索速率排序分组时候,使用索引将降低资源的消耗缺点:增加了索引维护的成本降低了更新的速度提高了数据维护的成本索引会占据更多的......
  • mysql命令
    一、权限1.授权grant[权限]on[库.表]to[用户名]@[IP]例:grantSYSTEM_VARIABLES_ADMINon*.*to'opsdev'@'%'2.刷新权限flushprivile......
  • gbase慢sql优化案例
    Sql:selecta.u_id,b.b_id,c.c_id,froma.aaleftjoinb.bbona.uid=b.u_idleftjoinc.cconb.c_id=c.c_idlimit100000; 首先把sql拿到生产测试发现确认......
  • SQL - where条件里的!=会过滤值为null的数据
    !=会过滤值为null的数据在测试数据时忽然发现,使用如下的SQL是无法查询到对应column为null的数据的:select*fromtestwherename!='Lewis';本意是想把表里name的值不为​......
  • sql数据练习
    ---组内排名select*from(selectbrank,keyword,sum(price)as`营业额`,dense_rank()over(partitionbykeywordorderbysum(price)desc)as`排名`fromCityReco......
  • flinksql的初始化
    Mavn的依赖<properties><java.version>1.8</java.version><maven.compiler.source>${java.version}</maven.compiler.source><maven.compiler.targ......
  • Mysql的锁机制
    Mysql的锁机制是除了Mysql的MVCC机制外,解决并发过程的幻读等问题的另外的方案,当然性能比mvcc机制较低,因为不允许读写操作并列执行,但是一些特殊机制,必须使用Mysql的锁方案锁......
  • sql基本知识
    当我在将大小写忽略的时候之前使用大写的数据库的名字就进不去了,因为系统自动将我打的大写换成了小写.....每一个检查点都会记录他自己的操作对象的信息状态,当共用的是......