1.实验目的

（1）理解Hive作为数据仓库在Hadoop体系结构中的角色。

（2）熟练使用常用的HiveQL。

2.实验平台

操作系统：Ubuntu18.04（或Ubuntu16.04）。

Hadoop版本：3.1.3。

Hive版本：3.1.2。

JDK版本：1.8。

3.数据集

由《Hive编程指南》(O'Reilly系列，人民邮电出版社)提供，下载地址：

https://raw.githubusercontent.com/oreillymedia/programming_hive/master/prog-hive-1st-ed-data.zip

备用下载地址：

https://www.cocobolo.top/FileServer/prog-hive-1st-ed-data.zip

解压后可以得到本实验所需的stocks.csv和dividends.csv两个文件。

4.实验步骤

（1）创建一个内部表stocks，字段分隔符为英文逗号，表结构如表14-11所示。

表14-11 stocks表结构

col_name	data_type
exchange	string
symbol	string
ymd	string
price_open	float
price_high	float
price_low	float
price_close	float
volume	int
price_adj_close	float

（2）创建一个外部分区表dividends（分区字段为exchange和symbol），字段分隔符为英文逗号，表结构如表14-12所示。

表14-12 dividends表结构

col_name	data_type
ymd	string
dividend	float
exchange	string
symbol	string

（3）从stocks.csv文件向stocks表中导入数据。

（4）创建一个未分区的外部表dividends_unpartitioned，并从dividends.csv向其中导入数据，表结构如表14-13所示。

表14-13 dividends_unpartitioned表结构

col_name	data_type
ymd	string
dividend	float
exchange	string
symbol	string

（5）通过对dividends_unpartitioned的查询语句，利用Hive自动分区特性向分区表dividends各个分区中插入对应数据。

（6）查询IBM公司(symbol=IBM)从2000年起所有支付股息的交易日(dividends表中有对应记录)的收盘价(price_close)。

（7）查询苹果公司(symbol=AAPL)2008年10月每个交易日的涨跌情况，涨显示rise，跌显示fall,不变显示unchange。

（8）查询stocks表中收盘价(price_close)比开盘价(price_open)高得最多的那条记录的交易所(exchange)、股票代码(symbol)、日期(ymd)、收盘价、开盘价及二者差价。

（9）从stocks表中查询苹果公司（symbol=AAPL）年平均调整后收盘价(price_adj_close) 大于50美元的年份及年平均调整后收盘价。

（10）查询每年年平均调整后收盘价(price_adj_close)前三名的公司的股票代码及年平均调整后收盘价。

5.实验报告

题目：	姓名	日期：
实验环境：
实验内容与完成情况：
出现的问题：
解决方案（列出遇到的问题和解决办法，列出没有解决的问题）：

标签：string,dividends,symbol,float,12.2,stocks,price
From： https://www.cnblogs.com/ljh1688/p/17871760.html

今日总结12.2
实验25：访问者模式本次实验属于模仿型实验，通过本次实验学生将掌握以下内容：1、理解访问者模式的动机，掌握该模式的结构；2、能够利用访问者模式法解决实际问题。 [实验任务一]：打包员在我们课堂上的“购物车”的例子中，增加一个新的访问者：打包员，负责对购物车中货物装包。实验要......
12.2闲话
树剖树剖调了好久的板子终于过了，主要原因是建线段树出了问题，警钟长鸣本来应该是t[q].dat=a[T[l].rnk];然后我打的是t[q].dat=a[l];DFS序2点击查看代码#include<bits/stdc++.h>#defineMAXM0X66CCFF#defineintlonglongnamespaceIO{inlinevoidclose(){std::i......
12.2
均分纸牌P1031[NOIP2002提高组]均分纸牌-洛谷|计算机科学教育新生态(luogu.com.cn)这道题贪心没有想出来，有时间再看看。。。。。。。。。砍龙头哈哈哈P2695骑士的工作-洛谷|计算机科学教育新生态(luogu.com.cn)这道题排序+贪心乱搞就行，然后发现了佬的解法，可......
12.2每日总结
final:Final用于修饰类、成员变量和成员方法。final修饰的类，不能被继承（String、StringBuilder、StringBuffer、Math，不可变类），其中所有的方法都不能被重写(这里需要注意的是不能被重写，但是可以被重载，这里很多人会弄混)，所以不能同时用abstract和final修饰类（abstract修饰的类是抽象类......
文心一言 VS 讯飞星火 VS chatgpt （147）-- 算法导论12.2 2题
二、用go语言，写出TREE-MINIMUM和TREE-MAXIMUM的递归版本。灵捷3.5。文心一言：以下是用Go语言编写的树的最大值和最小值的递归版本代码：packagemainimport("fmt")typeTreeNodestruct{ValintLeft*TreeNodeRight*TreeNode}......
文心一言 VS 讯飞星火 VS chatgpt （146）-- 算法导论12.2 1题
一、用go语言，假设一棵二叉搜索树中的结点在1到1000之间，现在想要查找数值为363的结点。下面序列中哪个不是查找过的序列?a.2，252，401，398，330，344，397，363。b.924，220，911，244，898，258，362，363。c.925，202，911，240，912，245，363。d.2，399，387，219，266，382，381，278，363。e.935，278，347，621，299，392，358，363。灵捷3......
文心一言 VS 讯飞星火 VS chatgpt （146）-- 算法导论12.2 1题
一、用go语言，假设一棵二叉搜索树中的结点在1到1000之间，现在想要查找数值为363的结点。下面序列中哪个不是查找过的序列?a.2，252，401，398，330，344，397，363。b.924，220，911，244，898，258，362，363。c.925，202，911，240，912，245，363。d.2，399，387，219，266，382，381，278，363。e.935，278，347，621，299，392，358，363。灵......
Cisco SD-WAN (Viptela) version 20.12.2 ED - 软件定义广域网
CiscoSD-WAN(Viptela)version20.12.2ED-软件定义广域网请访问原文链接：https://sysin.org/blog/cisco-sd-wan-20/，查看最新版。原创作品，转载请保留出处。作者主页：sysin.org支持SASE的架构，其集成了面向多云、安全、统一通信和应用优化的各种功能，可用于轻松安全地将任何......
Parallels Desktop 12.2.1 (41615) Mac 中文版下载
软件介绍ParallelsDesktop是一款虚拟化软件，允许你在Mac上创建一台运行Windows和其他操作系统的虚拟机，就好像它们是另一款Mac应用程序一样。与苹果的BootCamp不同，Parallels可以让你同时并行运行Mac和Windows应用程序。这意味着你可以在Mac桌面上浮动的窗口中查看Windows桌面，将Wi......
[Mac软件]Adobe XD(Experience Design) v57.1.12.2一个功能强大的原型设计软件
AdobeXD是一个直观、强大的UI/UX开发工具，旨在设计、原型设计、用户之间共享材料，以及通过数字技术设计交互。AdobeXD为您提供开发网站、应用程序、语音界面、游戏界面、电子邮件模板等所需的一切。无限制地创建设计各种互动，创建看起来和感觉真实的互动原型。感谢你的时间使用基于......

12.2

1.实验目的

2.实验平台

3.数据集

4.实验步骤

5.实验报告

相关文章

赞助商

阅读排行