首页 > 其他分享 >一个简单的实操案例

一个简单的实操案例

时间:2024-03-14 19:01:42浏览次数:23  
标签:-- 发送 案例 消息 简单 msg 接收 统计 实操

需求

统计今日总消息量 统计今日每小时消息量、发送和接收用户数

统计今日各地区发送消息数据量

统计今日发送消息和接收消息的用户数

统计今日发送消息最多的Top10用户

统计今日接收消息最多的Top10用户

统计发送人的手机型号分布情况

统计发送人的设备操作系统分布情况

约30万条数据,需要文件的同学可以找我免费领取

操作

--如果数据库已存在就删除

drop database if exists db_msg cascade ;

--创建数据库

create database db_msg ;

--切换数据库

use db_msg ;

--列举数据库

show databases ;

然后进行上传文件到HDFS中

将数据插入到表中并验证:

数据清洗:

问题1:当前数据中,有一些数据的字段为空,不是合法数据

        where过滤,where length(sender_gps)>0

问题2:需求中,需要统计每天、每个小时的消息量,但是数据中没有天和小时字段,只有整体时间字段,不好处理

        date hour 函数 date(msg_time),hour(msg_time)

问题3:需求中,需要对经度和维度构建地区的可视化地图,但是数据中GPS经纬度为一个字段,不好处理

        split函数split(sender_gps,',')[0] 

                      split(sender_gps,',')[0] 维度

需求4:将ETL以后的结果保存到一张新的Hive表中

     

需求指标统计

指标1:统计今日消息总量

        

指标2:统计每小时消息量、发送和接收用户数

指标3:统计今日各地区发送消息总量

指标4:统计今日发送和接收用户人数

指标5:统计接收消息条数最多的Top10用户

指标6:统计发送人的手机型号分布情况

再通过FineBI

标签:--,发送,案例,消息,简单,msg,接收,统计,实操
From: https://blog.csdn.net/fly66666666/article/details/136690250

相关文章

  • 移动端,手机端布局案例
    很简单一句话:父盒子宽度不用管,子盒子宽度用百分数设置第一步body百分百根据页面大小变化,最大宽度,最小宽度。因为他检测到是手机端,而且写了max-width,所以只有当换成手机显示时才能沾满,换成浏览器显示的话只能显示640px这种写法会是图片和文字的基线对其,实际上左边的×号是底......
  • ECharts案例
    目录一、柱状图二、条形图三、折线图​编辑四、堆积图定义x轴和y轴的配置项,包括标题和数据等​编辑如何使用ECharts来求取最大值、最小值和平均值一、柱状图<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8">//设置文档的字符编码为UTF-8<meta......
  • 实验1_C语言输入输出和简单程序编写
    task1_11#include<stdio.h>2#include<stdlib.h>3intmain()4{5printf("O\n");6printf("<H>\n");7printf("II\n");8printf("O\n");9printf("<H>\n");10p......
  • 多线程(代码案例: 单例模式, 阻塞队列, 生产者消费者模型,定时器)
    设计模式是什么类似于棋谱一样的东西计算机圈子里的大佬为了能让小菜鸡的代码不要写的太差针对一些典型的场景,给出了一些典型的解决方案这样小菜鸡们可以根据这些方案(ACM里面叫板子,象棋五子棋里叫棋谱,咱这里叫设计模式),略加修改,这样代码再差也差不到哪里去......
  • gbase简单实用
    gbase简单实用gbase数据库版本号:9.5.3.6注意:1.gbase创建完表之后,无法修改数据字段类型与属性(notnull,默认值)2.gbasesql不支持注释--,写sql的时候不要添加注释。3.即使表中添加了主键,也不会有主键约束(列如:主键相同的数据,也会insert进去)4.uuid()是gbase生......
  • odoo17开发教程(5):权限的简单介绍
    在之前的文章中,我们创建了第一个用于存储业务数据的表。在Odoo这样的商业应用程序中,首先要考虑的问题之一是谁可以访问数据。Odoo提供了一种安全机制,允许特定用户组访问数据。本章旨在对权限有个最低要求对了解数据文件(CSV)Odoo是一个高度数据驱动的系统。虽然行为是通过......
  • 简单查重系统
    作业要求作业所属班级软件工程2024链接作业要求作业要求链接作业目标设计一个论文查重算法,给出一个原文文件和一个在这份原文上经过了增删改的抄袭版论文的文件,在答案文件中输出其重复率。PSPPSP2.1PersonalSoftwareProcessStages预估耗时(分钟)实际......
  • YoloV8实战:YoloV8-World应用实战案例
    摘要YOLO-World模型确实是一个突破性的创新,它结合了YOLOv8框架的实时性能与开放式词汇检测的能力,为众多视觉应用提供了前所未有的解决方案。以下是对YOLO-World模型的进一步解读:模型架构与功能YOLO-World模型充分利用了YOLOv8框架的先进特性,并引入了开放式词汇检测功能。......
  • 【5V 转 3.3V,3V,2.5V芯片首选】PW2162高效恒压转换器,外围电路超简单
    在现代电子设备高速发展的今天,一款高效、稳定的电源管理芯片对于设备的性能至关重要。PW2162,作为一款完全集成、高效的2A同步整流降压转换器,凭借其出色的性能和广泛的应用领域,正引领着电源管理领域的新纪元。首先,让我们深入了解一下PW2162的独特之处。这款转换器在宽输出电流负载......
  • CSS实际案例,布局结构
    目前自己的问题:1所有东西都想用div,比如头部几个导航,不是用几个div而是用ui,li。搜索框不是div套两个div,而是div套input,buttom。且h,p,ul,ol等这种块级元素,都可以直接设置height,width当盒子用。全用div他的语义就不好了。【靠经验】2看见盒子老想去设置宽高,很多时候子盒子都不用设......