首页 > 其他分享 >Sqoop(一)介绍及安装

Sqoop(一)介绍及安装

时间:2024-09-05 13:22:12浏览次数:10  
标签:1.4 bin Sqoop sqoop hadoop 介绍 export HOME 安装

在大数据时代,组织通常需要处理存储在不同系统和格式中的大量数据。Sqoop:是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具,是一个强大的数据传输工具,可以在关系型数据库和Apache Hadoop生态系统组件之间提供无缝的数据导入和导出。

功能:

导入数据:MySQL,Oracle导入数据到hadoop的HDFS、HIVE、HBASE等数据存储系统;

导出数据:从hadoop的文件系统中导出数据到关系数据库;

环境要求:具有java和hadoop的环境

安装步骤

1.wget https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz  # 只用到里面的jar包

wget https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.tar.gzwget https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.tar.gz

2:提取sqoop-1.4.7.bin__hadoop-2.6.0根目录下的sqoop-1.4.7.jar放到sqoop-1.4.7根目录.提取出sqoop-1.4.7.jar放在hadoop的lib下

3:提取lib目录下的这三个必须的jar包放到sqoop-1.4.7/lib/目录下,正常纯净版sqoop的lib目录下是没有文件的。如果没有从网上下载传上去

修改配置文件

cd /export/software/sqoop-1.4.7/conf

复制文件:

cp sqoop-env-template.sh sqoop-env.sh

编辑文件:vim sqoop-env.sh

在文件尾部添加:

export HADOOP_COMMON_HOME=/export/software/hadoop-3.2.4
export HADOOP_MAPRED_HOME=/export/software/hadoop-3.2.4
export HIVE_HOME=/export/software/hive3.1.3
export ZOOKEEPER_HOME=/export/software/zookeeper-3.4.14
export ZOOCFGDIR=/export/software/zookeeper-3.4.14/conf

保存退出,重新生效:

source sqoop-env.sh

进入Sqoop安装目录的lib目录

cd ../lib

添加MySQL的连接驱动包

之前上传过,版本为mysql-connector-java-5.1.27.jar 

配置环境变量:

vim /etc/profile

在文件末尾添加:

export SQOOP_HOME=/export/software/sqoop-1.4.7
export PATH=$PATH:$SQOOP_HOME/bin

保存退出,重新生效:

source /etc/profile

检查是否配置正确:

sqoop version

启动Sqoop作业时会出现下面的警告信息:
Warning: /opt/modules/sqoop-1.4.7.bin__hadoop-2.6.0/../hcatalog does not exist! HCatalog jobs will fail.
Please set $HCAT_HOME to the root of your HCatalog installation.
Warning: /opt/modules/sqoop-1.4.7.bin__hadoop-2.6.0/../accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
Warning: /opt/modules/sqoop-1.4.7.bin__hadoop-2.6.0/../zookeeper does not exist! Accumulo imports will fail.
Please set $ZOOKEEPER_HOME to the root of your Zookeeper installation.

解决方法:
进入$SQOOP_HOME/bin下,修改configure-sqoop文件,将下面的内容注释掉:

##user define note#####
## Moved to be a runtime check in sqoop.
if false;then
if [ ! -d "${HCAT_HOME}" ]; then
  echo "Warning: $HCAT_HOME does not exist! HCatalog jobs will fail."
  echo 'Please set $HCAT_HOME to the root of your HCatalog installation.'
fi

if [ ! -d "${ACCUMULO_HOME}" ]; then
  echo "Warning: $ACCUMULO_HOME does not exist! Accumulo imports will fail."
  echo 'Please set $ACCUMULO_HOME to the root of your Accumulo installation.'
fi
if [ ! -d "${ZOOKEEPER_HOME}" ]; then
  echo "Warning: $ZOOKEEPER_HOME does not exist! Accumulo imports will fail."
  echo 'Please set $ZOOKEEPER_HOME to the root of your Zookeeper installation.'
fi
##
fi

再次启动作业的时候,就不会有警告的信息了。

标签:1.4,bin,Sqoop,sqoop,hadoop,介绍,export,HOME,安装
From: https://blog.csdn.net/sadfasdfsafadsa/article/details/141744920

相关文章

  • Sqoop(二)遇到的问题
    sqooplist-databases--connectjdbc:mysql://m1:[email protected]连接数据库报错,报错信息为:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/commons/lang/StringUtilsatorg.apache.sqoop.manager.MySQ......
  • Sqoop(四)将HDFS上的数据导出到MySQL中
    将HDFS上的数据导出到MySQL中 在MySQL中建表createtableorders(orderidintprimarykey,orderdatevarchar(10),productidint,numint);导出到MySQL中hdfs中准备数据hadoopfs-chmod777/orders/orders/order.txt1,202406,12,300002,202406,13,350003,2024......
  • 开源文档管理系统 MinDoc 安装和使用教程
    说到文档管理,很多团队的文档管理都是一团糟,每个员工在自己本地写了各种Word文档、Excel表格、甚至还有手写的便签,到处都是,找起来就像大海捞针。有些聪明的团队开始用飞书来管理团队文档,但是并不适合所有团队,有的团队可能更倾向于使用开源的方案。今天就给大家介绍一款开源的文......
  • SAP B1 三大基本表单标准功能介绍-物料主数据(下)
    背景在SAPB1中,科目表、业务伙伴主数据、物料主数据被称为三大基本表单,其中的标准功能是实施项目的基础。本系列文章将逐一介绍三大基本表单各个字段的含义、须填内容、功能等内容。附上SAPB110.0的帮助文档:SAPBusinessOne10.0|SAPHelpPortal本文介绍的是:库存......
  • DNF110 仿官单机安装教程 + 虚拟机一键端
    前言今天给大家带来一款单机游戏的架设:地下城与勇士110仿官版本单机安装教程。另外:本人承接各种游戏架设(单机+联网)本人为了学习和研究软件内含的设计思想和原理,带了架设教程仅供娱乐。教程是本人亲自搭建成功的,绝对是完整可运行的,踩过的坑都给你们填上了。如果你是小白也......
  • 最新热门火爆小程序项目 在线敲木鱼小程序源码系统 功能强大 带完整的安装代码包以及
    系统概述本系统采用微信小程序框架开发,充分利用了微信平台庞大的用户基础及丰富的生态资源。技术架构上,主要包括前端界面设计、后端逻辑处理、数据库管理以及云服务等部分。前端采用微信小程序提供的WXML、WXSS等语言进行页面布局与样式设计,确保良好的用户体验;后端则根据业务......
  • 自定义界面布局的行预约小程序源码系统 适合各行各业的 带完整的安装代码包以及搭建部
    系统概述随着移动互联网的普及,小程序以其无需下载、即用即走的特点,成为了用户获取服务的新宠。行预约小程序,作为小程序领域的一个细分应用,旨在为用户提供便捷、高效的预约服务体验。然而,传统的小程序开发往往受限于固定的模板和复杂的开发流程,难以满足各行业差异化的需求。因......
  • windows系统Redis安装,启动与客户端连接,redis-python模块安装
    1、https://www.cnblogs.com/chunyouqudongwuyuan/p/16475220.html#redis%E5%9F%BA%E6%9C%AC%E8%BF%9E%E6%8E%A5Redis安装,启动与客户端连接,redis-python模块安装redis安装由于windows对redis支持不好,所以在windows下只能使用较老版本的redis只维护到3.x https://github.c......
  • Centos 安装 Docker
    文章目录卸载旧版Docker(如果之前装过Docker的话)配置Docker的yum库和源sudu安装Docker启动和校验配置镜像加速卸载旧版Docker(如果之前装过Docker的话)yumremovedocker\docker-client\docker-client-latest\docker-common\docker-l......
  • 2024最新最全【Android Studio 】下载及安装和【Gradle配置】零基础入门到精通
    文章目录下载安装修改Sdk的位置创建项目修改Gradle的位置查看AS版本工具栏–View项工具栏–Build下的功能说明BuildVariants视图说明下载模拟器(avd)/安卓虚拟设备屏幕熄灭功能关闭虚拟设备功能删除自己开发的应用软件将开发的应用运行到虚拟设备上。修改模拟器的位置下......