首页 > 其他分享 >今日总结

今日总结

时间:2023-10-13 23:13:20浏览次数:30  
标签:总结 数据库 hive 学习 UDF 今日 清洗

首先上午花费两小时完成了数据清洗和可视化的展示,在数据清洗过程中主要遇到两个问题,第一个问题是如何将ip地址转化为省份,我初步思路是通过现有的数据库加上javaApi封装一个自定义UDF函数,然后打成jar包导入至hive控制台就可以使用了,但是错误有很多,第一个就是需要和第三方库一并打包,二是hive似乎不能读取到我的数据库文件。

最后考虑到因为数据量只有三十万条,因此我直接通过buffer缓冲流去进行数据清洗。

第二个问题是将美国的时间戳转化为标准格式,现有的unixTimeStamp并不能解决问题,这次我定义了一个UDF函数并成功实现。

其次今天从下午开始一共学习5小时。还是准备软考。

学习了下午第三道题的解法。

学习了UML九种图的画法以及作用。

学习了上午题操作系统之同步,互斥以及使用PV操作进行进程管理。今日笔记如下所示:

 

标签:总结,数据库,hive,学习,UDF,今日,清洗
From: https://www.cnblogs.com/laohei114514/p/17763490.html

相关文章

  • 洛谷4363总结
    什么叫做博弈论DP呢?这里也是双方采取最佳策略,但是与普通博弈论不同的是,这里问的不是先手必胜or必败,而是问的最优值因此称作博弈论DP那么这种DP也是像SG游戏一样,我们想出博弈图然后倒推同时这题也是轮廓线DP,具体见这篇题解那么为什么菲菲要max,牛牛要min呢?我们就考虑dp数组的......
  • 每日总结
    10.12从今天开始写总结,其实之前就想开始的,但是操作太复杂了,而且我也懒,不想开始。但是时间一长有些写过的题技巧和方法都忘了,还是写写吧。P7828[CCO2021]SwapSwapSorthttps://www.luogu.com.cn/problem/P7828 这题根号分治,对出现次数不大于S的数直接双指针暴力,对出现次数......
  • 10.13总结
    1.完成了课堂测试2.学习了关于maven项目编写UDF自定义函数,打包到hive中使用,用于清洗数据将hive上的数据表导出到linux的目录下,再导出到本机后导入可视化SQLspingboot创建工程将数据库中的数据进行echart显示......
  • 10/3~10/13总结
    最近老毛病又开始犯了。10/3之前几场考试感觉问题不大,可能10/1松懈下来了,毛病一直不好。以后考试写完要从头读一遍代码,写对拍,等到熟练度提上去时间就足够了。10/13考试总结T1简单题,线段树水过T2没思路,赛后明白是性质贪心题。T3大粪讨,明明写的100分,不用心,挂60,还是要再......
  • 8088/8086微处理器与总线学习笔记总结
    目录一、微处理器与总线1.微处理器的概述1.1运算器1.2控制器1.2.1指令控制1.2.2时序控制1.2.3操作控制二、8086/8088微处理器1.8086/8088CPU的指令特点1.1指令流水线1.2内存的分段管理技术1.3支持多处理器系统2.8088/8086的外部引脚及其功能3.8086/8088的功能结构3.1内部......
  • Linux第二次周总结
    第三章用户管理3.1用户/组概览Linux系统是多用户、多任务的分时操作系统,系统上每一个进程都有一个特定的文件,每个文件都被一个特定的用户所拥有。每个用户都属于一个用户组或者多个组,系统可以对一个用户组中的所有用户进行集中管理。3.1.1用户标识:UID与GIDLinux系统并不能......
  • 2023-2024-1 20231413 《计算机基础与程序设计》第三周学习总结
    班级:2023-2024-1-计算机基础与程序设计作业要求:2023-2024-1《计算机基础与程序设计》教学进程目标:自学教材:计算机科学概论第2、3章并完成云班课测试《C语言程序设计》第2章并完成云班课测试教材学习内容总结:了解了进制转换、图像/音频压缩,计算机数学的基础知识教材学习中的......
  • 2023-2024-1 20231301 《计算机基础与程序设计》第三周学习总结
    2023-2024-120231301《计算机基础与程序设计》第三周学习总结作业信息作业链接作业课程<班级>(2023-2024-1-计算机基础与程序设计)作业要求<作业>(2023-2024-1计算机基础与程序设计第三周学习总结)作业目标<《计算机基础与程序设计》预习第二、三章>《计算机......
  • 博学谷学习记录 自我总结 用心分享 | Tomcat源码刨析
    Tomcat系统架构设计1.前言很多人谈到架构感觉是一个非常高大尚的东西,觉得自己目前不太可能接触到或者没有实力接触和学习它。这其实是一个非常错误的认识,事实上我们作为开发人员每天都在和架构打交道。比如当你接到一个功能模块的需求时,你首先要做的就是分析和设计,例如技术选型......
  • 博学谷学习记录 自我总结 用心分享 | Spring源码刨析
    别再盲目的说spring有三级缓存了,两个缓存只是启动时为了解决循环依赖,spring启动后只有一个缓存有用一、什么是循环依赖循环依赖指的就是循环引用,就是两个或多个bean相互之间的持有对方,比如CircleA引用CircleB,CircleB引用CircleC,CircleC引用CircleA,则它们最终......