首页 > 其他分享 >【Sqoop篇】----Sqoop从搭建到应用案例

【Sqoop篇】----Sqoop从搭建到应用案例

时间:2022-12-30 17:35:29浏览次数:54  
标签:HDFS sqoop -- Sqoop hive ---- mysql dir 搭建



=========================================================

声明:由于不同平台阅读格式不一致(尤其源码部分),所以获取更多阅读体验!!

个人网站地址:​http://www.lhworldblog.com/

==========================================================



一、前述

今天开始讲解Sqoo的用法搭建和使用。Sqoop其实功能非常简单。主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

二、 配置

flume配置很简单:

第一步:将flume-env.sh.template模板文件改名为flume-env.sh文件

【Sqoop篇】----Sqoop从搭建到应用案例_hive

第二步 :更改里面的JAVA_HOME

【Sqoop篇】----Sqoop从搭建到应用案例_HDFS_02

第三步:配置环境变量

【Sqoop篇】----Sqoop从搭建到应用案例_hive_03

三、 使用

官方参考手册:​http://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_connecting_to_a_database_server​

举几个简单例子:

【Sqoop篇】----Sqoop从搭建到应用案例_sqoop_04

导入:

案例一(步骤是Mysql---HDFS)的顺序):

import
--connect
jdbc:mysql://node3:3306/test
--username
root
--password
123
--as-textfile
--columns
id,name,msg
--table
psn
--delete-target-dir
--target-dir
/sqoop/data
-m
1
可以将上述命令定义在一个脚本里面:

使用如下命令:
sqoop --options-file sqoop1

 案例二(步骤是Mysql---Hive)的顺序):实际上就是Mysql-HDFS-Hive里面

 

【Sqoop篇】----Sqoop从搭建到应用案例_sqoop_05


import
--connect
jdbc:mysql://node3/test
--username
root
--password
123
--as-textfile
--query
'select id, name, msg from psn where id like "1%" and $CONDITIONS'
--delete-target-dir
--target-dir
/sqoop/tmp  
-m
1
--hive-home
/home/hive-1.2.1
--hive-import
--create-hive-table
--hive-table
t_test

 PS:先导入到hdfs上的一个临时目录,然后再导入到Hive的数据管理目录/home/hive-1.2.1。

and $CONDITIONS是一个查询规则,必须加上。

 

 

导出:
案例一。将HDFS上的数据导出到Mysql中去

export
--connect
jdbc:mysql://node3/test
--username
root
--password
123
-m
1
--columns
id,name,msg
--export-dir
/sqoop/data
--table
h_psn

【Sqoop篇】----Sqoop从搭建到应用案例_sqoop_06

 

标签:HDFS,sqoop,--,Sqoop,hive,----,mysql,dir,搭建
From: https://blog.51cto.com/u_11936913/5980856

相关文章

  • 基于AI边缘智能网关的工业质检应用
    成品质量检验是工业生产最后必不可少的环节,随着我国工业化的蓬勃发展,工业产品日益迈向高端化、精密化,对于工业产品的质量检验要求和投入成本也在不断提高,产品质检涉及到比......
  • 【机器学习】--Kmeans从初识到应用
    一.前述Kmeans算法一般在数据分析前期使用,选取适当的k,将数据分类后,然后分类研究不同聚类下数据的特点。Kmeans算法是一种无监督的算法。二.概念及原理Kmeans原理:随机选取k......
  • 大白话5分钟带你走进人工智能-第十四节过拟合解决手段L1和L2正则
                                                                    第十四节过拟合解决手段L1和L2正......
  • Android 教程
    Android是一个开源的,基于Linux的移动设备操作系统,主要使用于移动设备,如智能手机和平板电脑。Android是由谷歌及其他公司带领的开放手机联盟开发的。本教程将教会你基本......
  • 如何定义一个注解Annotation,以定义操作日志为例。
    /***定义操作日志注解*/@Target(ElementType.METHOD)#它表明注解使用的目标范围是方法METHOD,即该注解使用在一个方法上@Retention(RetentionPolicy.RUNTIME)#注解......
  • 一个PHP7.3的SWOOLE镜像
    公司的swoole镜像是基于centos6.10,php版本是7.3,swoole的版本是4.5,但php没有安装yasd扩展!用这个镜像的容器跑项目,要想进行swoole的debug,还必须安装它!而这个扩展偏偏无法通......
  • Func<T>、Action<T> 的区别于说明
    一、FuncFunc是一个.Net内置的委托。Func<Result>,Func<T1,Result>是一个.Net内置的泛型委托。Func<TResult>Func<T,TResult>Func<T1,T2,TResult>Func<T1,T2,T3,TRes......
  • 新年第一篇---算法浅谈
    一、前述2020是不平凡的一年。展望2021,希望大家都能有所收获。在此谈下算法方面的工作。二、工作类别目前算法工作的话,第一类是数据挖掘,它包含的知识,跟机器学习相关度会更大......
  • Comic Life - 超棒的漫画制作工具,拥有多种动画模版,创作属于自己的漫画
    ComicLife是一个照片编辑器,能够添加各种效果,并基于它们创建漫画。该工具包包括各种各样的模板,可以很容易地将照片放置在工作表上,还有大量各种形状的标注。除了拼贴画上的......
  • 大白话5分钟带你走进人工智能-第35节神经网络之sklearn中的MLP实战(3)
    本节的话我们开始讲解sklearn里面的实战:先看下代码:fromsklearn.neural_networkimportMLPClassifierX=[[0,0],[1,1]]y=[0,1]clf=MLPClassifier(solver='sgd......