mysql

前提：Hadoop集群、hive配置完成

1、在node01开启hadoop集群： start-dfs.sh , start-yarn.sh

2、node01 : 开启 metastore

hive所在路径/hive/bin/hive --service metastore

3、克隆node01-->node01(1)，开启 hive

hive所在路径/hive/bin/hive

4、将本地文件上传至虚拟机

5、在hive中创建表

create table lingshou_csv (InvoiceNo String,
                         StockCode String,
                         Description String,
                         Quantity String,
                         InvoiceDate String,
                         UnitPrice String,
                         CustomerID String,
                         Country String) 
                         ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

6、本地文件导入hive

load data  local inpath  '/kkb/install/hive/lingshou.csv' into table lingshou_csv;

7、查看是否导入成功

select * from lingshou_csv limit 10;

注意要用 limit 限制，否则数据过多等待时间太长

8、在mysql中的node01数据库（hive中对应mysql）中新建表

create table lingshou_csv (InvoiceNo VARCHAR(255),
                         StockCode VARCHAR(255),
                         Description  VARCHAR(255),
                         Quantity  VARCHAR(255),
                         InvoiceDate  VARCHAR(255),
                         UnitPrice  VARCHAR(255),
                         CustomerID  VARCHAR(255),
                         Country  VARCHAR(255)); 
                         ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

9、hive数据表导入mysql

bin/sqoop export \
--connect jdbc:mysql://node01:3306/lingshu_csv \
--username root \
--password 20194023 \
--table testtable \
--num-mappers 1 \
--export-dir /user/hive/warehouse/lingshu_csv \
--input-fields-terminated-by ","

10、完成，可通过可视化工具查看

原文链接：本地excel/csv文件-->hive-->mysql - 第厘 - 博客园 (cnblogs.com)

标签：VARCHAR,String,--,十月,十二日,hive,csv,255
From： https://www.cnblogs.com/binglinll/p/18509608

十月二十五日总结（阅读笔记）
我读的是《程序员修炼之道：从小工到专家》。下面是阅读前三章总结的内容。第一章重点讲述了程序员的职业定位和自我提升的必要性。作者指出，作为一名程序员，首先要清楚自己的职业目标和定位。只有了解自己在职业生涯中想成为什么样的人，才能制定出切实可行的发展计划。书中提到，许多程......
十月十四日《程序员修炼之道：从小工到专家》阅读笔记1
软件开发的复杂性：阅读这部分内容后，我意识到软件开发的复杂性远远超出了编码本身。它涉及到项目管理、团队协作、需求理解等多个方面。这让我认识到，作为一个程序员，需要具备更全面的技能和视野。持续学习的重要性：书中强调了持续学习和适应新技术的重要性。在技术日新月异的今天，只有......
十月十五《程序员修炼之道：从小工到专家》阅读笔记2
重复劳动是软件开发中常见的问题，它不仅浪费时间，还可能导致错误。通过自动化测试、构建脚本和使用代码生成器，可以减少重复性工作，提高开发效率。正交性是指系统的不同功能之间相互独立，改变一个功能不应该影响到其他功能。在设计软件时，应该追求高内聚低耦合，这样有助于降低复杂性，提高......
十月十八《程序员修炼之道：从小工到专家》阅读笔记3
纯文本的威力：纯文本文件易于创建、编辑和版本控制。它们是跨平台的，不需要特定的软件来打开。在可能的情况下，使用纯文本格式（如JSON、YAML）来存储配置文件和数据。Shell游戏：熟练掌握命令行界面（CLI）可以提高工作效率。学习常用的命令行工具，如grep、sed、awk，以及如何编写简单的shell脚......
十月
很久没有记录了，写过的题都忘了，彻底废了。arc183_b考虑把他转化为一个交换问题，可以交换的两个条件是\(k\ge2\)和\(\existsi,j|b_i=b_j,j-i\lek(i<j)\)。这是\(k\neq1\)的情况，\(k=1\)即转化为子序列问题。CF1310EStrangeFunction对于\(n\)一定，\(k\)越大，则\(......
十月十四号周一
一、下午上了java,了解了static变量、static方法和static块的一些知识。1.static变量静态变量是被static关键字声明的类变量，它们属于类而不是类的实例。所有实例共享同一个静态变量。在类加载时初始化，且在程序运行期间始终存在。2.static方法静态方法是被声明为static的方法......
十月最新植物大战僵尸杂交版下载
在2.5.1版本中，游戏对“两面夹击”关卡和植物进行了调整：关卡调整怪物设置：出怪倍率和种类降低，初始阳光量调整，增强策略性。挑战难度：脑子血量提升至4.5倍。植物调整拗桩亡语：不影响其他树推升级。炫彩杨桃：冷却时间缩短至20秒。头脑风暴：亡语可被其他植物触发。禁忌寒冰......
高一上十月中旬日记
10.11闲话做题纪要luoguP3345[ZJOI2015]幻想乡战略游戏luoguP5311[Ynoi2011]成都七中[ABC373F]KnapsackwithDiminishingValues暴力分组背包写个常数小点的加\(C++20\)加手动开\(O3\)就过了（赛时直接把火车头粘上了），算下来\(AT\)神机能跑\(1e10\)。点......
【学校训练记录】十月个人训练赛1题解
A只需按照题目意思扩展h倍即可，先记录初始字符，打印时扩展为2*h根据题目公式打印`include<bits/stdc++.h>defineintlonglongusingnamespacestd;constintMAXN=100005;intn;inta[MAXN];charmp[105][105];signedmain(){inth,w;cin>>h>>w;for(inti=......
十月初 AT/CF
ABC374E最大最小值，想到二分，问题是怎么check。其实就是对两个种有价值有重量的物品，求达到规定价值的最小重量。只有两种物品，而且数据范围很小，考虑贪心。假设\(a\)的性价比较高，\(b\)的性价比较低，那么不可能选太多\(b\)。也就是如果能用\(a\)代替的就用\(a\)代替。所......

十月十二日

本地excel/csv文件-->hive-->mysql

相关文章

赞助商

阅读排行