首页 > 其他分享 >十月十二日

十月十二日

时间:2024-10-28 08:58:19浏览次数:6  
标签:VARCHAR String -- 十月 十二日 hive csv 255

本地excel/csv文件-->hive-->mysql

 

前提:Hadoop集群、hive配置完成

1、在node01开启hadoop集群 : start-dfs.sh   ,   start-yarn.sh

2、node01 : 开启 metastore 

 
hive所在路径/hive/bin/hive --service metastore

3、克隆node01-->node01(1),开启 hive

 
hive所在路径/hive/bin/hive

4、将本地文件上传至虚拟机

 

5、在hive中创建表

 
create table lingshou_csv (InvoiceNo String,
                         StockCode String,
                         Description String,
                         Quantity String,
                         InvoiceDate String,
                         UnitPrice String,
                         CustomerID String,
                         Country String) 
                         ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

6、本地文件导入hive

 
load data  local inpath  '/kkb/install/hive/lingshou.csv' into table lingshou_csv;

7、查看是否导入成功

 
select * from lingshou_csv limit 10;

注意要用 limit 限制 ,否则数据过多等待时间太长

8、在mysql中的node01数据库(hive中对应mysql)中新建表

 
create table lingshou_csv (InvoiceNo VARCHAR(255),
                         StockCode VARCHAR(255),
                         Description  VARCHAR(255),
                         Quantity  VARCHAR(255),
                         InvoiceDate  VARCHAR(255),
                         UnitPrice  VARCHAR(255),
                         CustomerID  VARCHAR(255),
                         Country  VARCHAR(255)); 
                         ROW format delimited fields terminated by ',' STORED AS TEXTFILE;

9、hive数据表导入mysql

 
bin/sqoop export \
--connect jdbc:mysql://node01:3306/lingshu_csv \
--username root \
--password 20194023 \
--table testtable \
--num-mappers 1 \
--export-dir /user/hive/warehouse/lingshu_csv \
--input-fields-terminated-by ","

10、完成,可通过可视化工具查看

原文链接:本地excel/csv文件-->hive-->mysql - 第厘 - 博客园 (cnblogs.com)

标签:VARCHAR,String,--,十月,十二日,hive,csv,255
From: https://www.cnblogs.com/binglinll/p/18509608

相关文章

  • 十月二十五日总结(阅读笔记)
    我读的是《程序员修炼之道:从小工到专家》。下面是阅读前三章总结的内容。第一章重点讲述了程序员的职业定位和自我提升的必要性。作者指出,作为一名程序员,首先要清楚自己的职业目标和定位。只有了解自己在职业生涯中想成为什么样的人,才能制定出切实可行的发展计划。书中提到,许多程......
  • 十月十四日《程序员修炼之道:从小工到专家》阅读笔记1
    软件开发的复杂性:阅读这部分内容后,我意识到软件开发的复杂性远远超出了编码本身。它涉及到项目管理、团队协作、需求理解等多个方面。这让我认识到,作为一个程序员,需要具备更全面的技能和视野。持续学习的重要性:书中强调了持续学习和适应新技术的重要性。在技术日新月异的今天,只有......
  • 十月十五《程序员修炼之道:从小工到专家》阅读笔记2
    重复劳动是软件开发中常见的问题,它不仅浪费时间,还可能导致错误。通过自动化测试、构建脚本和使用代码生成器,可以减少重复性工作,提高开发效率。正交性是指系统的不同功能之间相互独立,改变一个功能不应该影响到其他功能。在设计软件时,应该追求高内聚低耦合,这样有助于降低复杂性,提高......
  • 十月十八《程序员修炼之道:从小工到专家》阅读笔记3
    纯文本的威力:纯文本文件易于创建、编辑和版本控制。它们是跨平台的,不需要特定的软件来打开。在可能的情况下,使用纯文本格式(如JSON、YAML)来存储配置文件和数据。Shell游戏:熟练掌握命令行界面(CLI)可以提高工作效率。学习常用的命令行工具,如grep、sed、awk,以及如何编写简单的shell脚......
  • 十月
    很久没有记录了,写过的题都忘了,彻底废了。arc183_b考虑把他转化为一个交换问题,可以交换的两个条件是\(k\ge2\)和\(\existsi,j|b_i=b_j,j-i\lek(i<j)\)。这是\(k\neq1\)的情况,\(k=1\)即转化为子序列问题。CF1310EStrangeFunction对于\(n\)一定,\(k\)越大,则\(......
  • 十月十四号 周一
    一、下午上了java,了解了static变量、static方法和static块的一些知识。1.static变量静态变量是被static关键字声明的类变量,它们属于类而不是类的实例。所有实例共享同一个静态变量。在类加载时初始化,且在程序运行期间始终存在。2.static方法静态方法是被声明为static的方法......
  • 十月最新植物大战僵尸杂交版下载
    在2.5.1版本中,游戏对“两面夹击”关卡和植物进行了调整:关卡调整怪物设置:出怪倍率和种类降低,初始阳光量调整,增强策略性。挑战难度:脑子血量提升至4.5倍。植物调整拗桩亡语:不影响其他树推升级。炫彩杨桃:冷却时间缩短至20秒。头脑风暴:亡语可被其他植物触发。禁忌寒冰......
  • 高一上十月中旬日记
    10.11闲话做题纪要luoguP3345[ZJOI2015]幻想乡战略游戏luoguP5311[Ynoi2011]成都七中[ABC373F]KnapsackwithDiminishingValues暴力分组背包写个常数小点的加\(C++20\)加手动开\(O3\)就过了(赛时直接把火车头粘上了),算下来\(AT\)神机能跑\(1e10\)。点......
  • 【学校训练记录】十月个人训练赛1题解
    A只需按照题目意思扩展h倍即可,先记录初始字符,打印时扩展为2*h根据题目公式打印`include<bits/stdc++.h>defineintlonglongusingnamespacestd;constintMAXN=100005;intn;inta[MAXN];charmp[105][105];signedmain(){inth,w;cin>>h>>w;for(inti=......
  • 十月初 AT/CF
    ABC374E最大最小值,想到二分,问题是怎么check。其实就是对两个种有价值有重量的物品,求达到规定价值的最小重量。只有两种物品,而且数据范围很小,考虑贪心。假设\(a\)的性价比较高,\(b\)的性价比较低,那么不可能选太多\(b\)。也就是如果能用\(a\)代替的就用\(a\)代替。所......