首页 > 其他分享 >10 15日总结

10 15日总结

时间:2023-10-15 23:45:47浏览次数:36  
标签:总结 10 15 string 数据库 video 2016 数据

石家庄铁道大学2023年秋季

  2021 课堂测试试卷—数据清洗

课程名称: 大型数据库应用技术  任课教师: 王建民   考试时间: 180 分钟

 

Result文件数据说明:

Ip:106.39.41.166,(城市)

Date:10/Nov/2016:00:01:02 +0800,(日期)

Day:10,(天数)

Traffic: 54 ,(流量)

Type: video,(类型:视频video或文章article)

Id: 8701(视频或者文章的id)

测试要求:

1、 数据清洗:按照进行数据清洗,并将清洗后的数据导入hive数据库中。

两阶段数据清洗:

(1)第一阶段:把需要的信息从原始日志中提取出来

ip:    199.30.25.88

time:  10/Nov/2016:00:01:03 +0800

traffic:  62

文章: article/11325

视频: video/3235

(2)第二阶段:根据提取出来的信息做精细化操作

ip--->城市 city(IP)

date--> time:2016-11-10 00:01:03

day: 10

traffic:62

type:article/video

id:11325

(3)hive数据库表结构:

create table data(  ip string,  time string , day string, traffic bigint,

type string, id   string )

2、数据分析:在HIVE统计下列数据。

(1)统计最受欢迎的视频/文章的Top10访问次数 (video/article)

(2)按照地市统计最受欢迎的Top10课程 (ip)

(3)按照流量统计最受欢迎的Top10课程 (traffic)

3、数据可视化:

将统计结果倒入MySql数据库中,通过图形化展示的方式展现出来。

五个步骤。

1、数据导入:

①启动hive之后,打开dbeaver,把result文件拖到你个文件夹中,最好不要是系统文件夹、

②在dbeaver创教数据库,然后创建表,这个表就是存放(result.txt文件转化为表结构的结果=>也称为第一次数据清洗)

③在dbeaver输入sql语句导入数据

2、数据清洗:

这个步骤是在dbeaver中进行的。将 10/Nov/2016:00:01:02 +0800 修改为 2016-11-10 00:01:03 形式

3、数据分析处理:

4、Sqoop导入Hive数据到MySQL:

在mysql数据库中创建数据库和相应的表,使用命令将dbeaver中的表导入到mysql

5、通过javaweb+echarts进行数据可视化

具体实现:10.13每日总结 - 风·华正茂 - 博客园 (cnblogs.com)

标签:总结,10,15,string,数据库,video,2016,数据
From: https://www.cnblogs.com/fengjiale/p/17766466.html

相关文章

  • 学期:2023-2024-1 学号:20231426 《计算机基础与程序设计》第三周学习总结
    作业信息这个作业属于哪个课程2022-2023-1-计算机基础与程序设计这个作业要求在哪里2022-2023-1计算机基础与程序设计第一周作业这个作业的目标通过教材内容了解计算机信息层作业正文(https://www.cnblogs.com/hhaxx/p/17766468.html)教材学习内容总结......
  • 10.15
    SpringBoot提供了多个常用的注解,用于在应用程序的各个组件(类、方法、字段等)上添加元数据,以实现不同的功能。以下是一些常用的SpringBoot注解:1.@SpringBootApplication:主要用于启动类上,表示这是一个SpringBoot应用程序的入口点。它组合了@Configuration、@EnableAutoConf......
  • 可观测 AIOps 的智能监控和诊断实践丨QCon 全球软件开发大会总结
    作者:董善东(梵登)本文是作者于9月5日在QCon北京2023(全球软件开发大会)上做的《阿里云可观测AIOps的智能监控和诊断实践》专题演讲文字版。大家上午好,很高兴可以在QCon稳定性和可观测的场子来分享阿里云可观测AIOps的智能监控和诊断实践。我是来自阿里云云原生可观测团队......
  • 10 月 15 日模拟赛总结
    Before本文章在洛谷博客同步发布Contest-Link预期\(30+0+0+20=50\)。实际\(30+0+100+60=190\)。挂分\(-140\)。rk6,行。开题首先瞄了眼T1,想dp感觉挺玄乎,写了个暴力,跳T2发现什么鬼题面,直接跳T3,感觉T3可做,维护区间\(1\)的个数不直接用线段树?写了个......
  • 2023.10.15——每日总结
    学习所花时间(包括上课):9h代码量(行):0行博客量(篇):1篇今天,上午休息,下午校内算法比赛;我了解到的知识点:1.写对四道;明日计划:学习......
  • 2023-10-15 #73 就等待吧
    ——COP《雪来临时》如题,所以抱歉这次鸽了。511P8354[SDOI/SXOI2022]多边形三角剖分是我们已解决的经典问题,答案是卡特兰数。我们尝试通过一些手段去除题目中的限制,求出系数\(c_3,c_4,\cdots,c_m\),将问题规约至求若干次多边形的三角剖分数量,最后答案为\(\sum_ic_i\text{C......
  • 2023-2024-1 20231310《计算机基础与程序设计》第三周学习总结
    作业信息这个作业属于哪个课程https://edu.cnblogs.com/campus/besti/2023-2024-1-CFAP/homework/12999这个作业要求在哪里https://www.cnblogs.com/rocedu/p/9577842.html#WEEK03这个作业的目标计算机科学概论第2、3章,《C语言程序设计》第2章并完成云班课测试......
  • 2023-2024-1 202314125 《计算机基础与程序设计》第三周学习总结
    2023-2024-1202314125《计算机基础与程序设计》第三周学习总结 教材学习内容总结《计算机科学概论》第二、三章文本、字符集、压缩方法、音频、图像、视频表示法。进制转化Unicode与UTF-8,UTF-16之间的联系《c语言程序设计》第二章基本数据类型整型int字符char浮......
  • 2023-2024-1 20231415《计算机基础与程序设计》第三周学习总结
    这个作业属于哪个课程https://edu.cnblogs.com/campus/besti/2023-2024-1-CFAP这个作业要求在哪里https://www.cnblogs.com/rocedu/p/9577842.html#WEEK03这个作用的目标学习计算机科学概论第2章第3章和《C语言程序设计》第2章,并完成作业要求作业正文https://i.cn......
  • 2023-2024-1 20231323 《计算机基础与程序设计》第三周学习总结
    2023-2024-120231323《计算机基础与程序设计》第3周学习总结作业信息作业所属课程2023-2024-1-计算机基础与程序设计作业要求2023-2024-1计算机基础与程序设计第三周作业作业目标学习进制转换与数据表示法作业正文https://www.cnblogs.com/besti-Wangmingxu......