自定义聚合函数(统计每种行为的触发次数排名前三的商品id)

时间：2022-09-05 21:34:07浏览次数：64

标签：每种自定义 val goodsId session behavior sql id row

package SparkSQL.fun.project

import org.apache.spark.SparkConf
import org.apache.spark.sql.expressions.{MutableAggregationBuffer, UserDefinedAggregateFunction}
import org.apache.spark.sql.types.{DataType, DataTypes, StructField, StructType}
import org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}

/**
 * 统计每种行为的触发次数排名前三的商品id
 */
object BehaviorCode2 {
  def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setAppName("project01").setMaster("local[*]")
    val session = SparkSession.builder().config(sparkConf).getOrCreate()
    val map = Map("mode"->"dropMalformed","inferSchema"->"true")
    val frame = session.read.options(map).csv("G:\\shixunworkspace\\sparkcode\\src\\main\\java\\SparkSQL\\fun\\project\\b.csv")

    // "userId", "goodsId", "categoryId", "behavior", "time"

    import session.implicits._
    val frame1: Dataset[UserBehaviorBean] = frame.map(row => {
      UserBehaviorBean(row.getInt(0), row.getInt(1),
        row.getInt(2), row.getString(3), row.getInt(4))
    })
    val frame3 = frame1.toDF("userId", "goodsId", "categoryId", "behavior", "time")
    frame3.createTempView("tmp")

    val frame2 = session.sql("select behavior, goodsId, count(*) count from tmp group by behavior, goodsId")
    frame2.show()

    frame2.createTempView("tmp1")
    val frame4 = session.sql("select behavior, goodsId, count, row_number() over(partition by behavior, goodsId order by count) rn from tmp1")
    frame4.show()

    frame4.createTempView("temp2")
    val frame5 = session.sql("select behavior, goodsId, count, rn from temp2 where rn <= 3")
    frame5.show()

    session.stop()
  }
}

标签：每种,自定义,val,goodsId,session,behavior,sql,id,row
From： https://www.cnblogs.com/jsqup/p/16659672.html

IDEA的安装准备
IDEA的安装1234......
Android.mk 文件编写
Android.mk以下内容通常够用，如需添加其他变量，百度查看LOCAL_PATH:=$(callmy-dir)//源码所在目录，写法固定include$(CLEAR_VARS)//清除除外LOCAL_PATH变量以外的其......
Matlab GUI_guide模式编程快速入门教程
摘要：GUI设计是交互设计，关联界面和软件本体之间的联系，然后一般设计包括实现计算和绘图等等，在软件著作中需要要求是计算严谨，绘图吸引，功能丰富以及具体的实际用途目录1.界......
delphi TcxGrid网格组件：OnCustomDrawCell 自绘网格事件的应用
onCustomDrawCell事件分为两种: 一个是整个表格的事件,需要判断单元格所在的字段,符合了之后,才能进行下一步取得单元格所在字段的字段名:TcxGridColumn(AV......
IntelliJ IDEA（2020.2）的下载、安装
IntelliJIDEA（2020.2）的下载、安装一、找到IntelliJIDEA的官网地址：https://www.jetbrains.com/idea/，下载安装包以社区版.exe为例二、找到下载好的安装包，双击开始......
无法连接虚拟设备 ide1:0，因为主机上没有相应的设备。您要在每次开启此虚拟机时都尝试
无法连接虚拟设备ide1:0，因为主机上没有相应的设备。您要在每次开启此虚拟机时都尝试连接此虚拟设备吗?问题无法连接虚拟设备ide1:0，因为主机上没有相应的设备。您......
八、Spring Boot 实现一个自定义start
http://springboot.javaboy.org/2019/0520/springboot-starterstarter的作用用来做依赖导入、自动配置Starter的核心就是条件注解@Conditional当classpath下存在......
idea的查找与替换
查找当前文件内容：ctrl+F如上图片查找全局文件：ctrl+shift+F或doubleshift（按两下）或ctrl+shift+N替换当前文件内容：ctrl+R如上图片你想通过编辑器快速的将所有的......
android | adb找不到夜神模拟器 | 查看android手机cpu架构
adb找不到夜神模拟器|查看android手机cpu架构找不到模拟器参考：https://www.jianshu.com/p/8af043534fc4先手动建立连接就行：然后查看手机的cpu架构：这条是android特有......
八、Spring Boot 中自定义 SpringMVC 配置
转发：https://www.javaboy.org/2019/0816/spring-boot-springmvc.html先说结论，使用Java8的，自定义配置使用实现WebMvcConfigurer接口，Java8之前使用WebMvcConfigurerAdapte......

自定义聚合函数(统计每种行为的触发次数排名前三的商品id)

相关文章

赞助商

阅读排行