热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Sqoop安装配置

简介Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递。利用Sqoop可以将一个关系
简介

Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递。利用Sqoop可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

Sqoop2的最新版本是1.99.7。请注意,2与1不兼容,且特征不完整,它并不打算用于生产部署。

Sqoop将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

Sqoop官网:http://sqoop.apache.org/

安装

注意:前提是已经安装好Java和Hadoop环境。

1.下载上传解压


  1. 下载地址:http://www.apache.org/dyn/closer.lua/sqoop/1.4.7
    在这里插入图片描述
    在这里插入图片描述
  2. 上传安装包到虚拟机中
  3. 解压sqoop安装包到指定目录

2.修改配置文件

Sqoop的配置文件与大多数大数据框架类似,在sqoop根目录下的conf目录中。

  1. 重命名配置文件
    $ mv sqoop-env-template.sh sqoop-env.sh
  2. 修改配置文件 sqoop-env.sh
    export HADOOP_COMMON_HOME=/usr/local/hadoop3.1.2/hadoop-standalone
    export HADOOP_MAPRED_HOME=/usr/local/hadoop3.1.2/hadoop-standalone
    export HIVE_HOME=/usr/local/apache-hive-3.1.1
    #export HBASE_HOME=/usr/local/hbase-2.1.3
    #export ZOOKEEPER_HOME=/usr/local/zookeeper-3.4.13-standalone
    #export ZOOCFGDIR=/usr/local/zookeeper-3.4.13-standalone

注:上面Hadoop是必需的,其它可以根据需要进行配置。
关联Hbase时,如果报错“找不到或无法加载类GetJavaProperty”,可以参考博客:HBase报错:找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaProperty

3.拷贝JDBC驱动

拷贝jdbc驱动到sqoop的lib目录下:
在这里插入图片描述

4.验证Sqoop配置

我们可以通过bin/sqoop help来验证sqoop配置是否正确:
在这里插入图片描述
在这里插入图片描述

5.测试Sqoop是否能够成功连接数据库


$ bin/sqoop list-databases --connect jdbc:mysql://hcmaster:3306/ --username root --password root

在这里插入图片描述


推荐阅读
  • MySQL数据 实时同步到KafkaBinlog canal、Maxwell、Kafka Connect 实现MySQL增量同步
    一、需求分析早期业务借助Sqoop将Mysql中的数据同步到Hive、hdfs来进行数据分析,使用过程中也带来了一些问题:虽然Sqoop支持增量同步但还属于粗粒度的离线同步,无法满 ... [详细]
  • 前言本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出, ... [详细]
  • 马蜂窝数据总监分享:从数仓到数据中台,大数据演进技术选型最优解
    大家好,今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数 ... [详细]
  • 数据仓库中基本概念
    一、数据仓库数据仓库(DataWarehouse)是一个面向主题的、集成的、稳定的且随时间变化的数据集合,用于支持管理人员的决策面向主题主题就是类型的意思。传统数 ... [详细]
  • ftp和文件服务器,ftp和文件服务器的区别
    ftp和文件服务器的区别内容精选换一换obsftp工具于2021年2月9日正式下线,下线后OBS不再对此工具提供维护和客户支持服务,给您带来不便敬请谅解 ... [详细]
  • 【数据结构与算法】——快速排序
    Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,O ... [详细]
  • 大数据开发笔记(一):HDFS介绍
    ✨大数据开发笔记推荐:大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试​本文详细介绍大数据hadoop生态圈各部分知识,包括不限 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • ubuntu用sqoop将数据从hive导入mysql时,命令: ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 过期时间为指定毫秒时间戳(未来某个日期)###过期键删除策略**三种策略:定时删除、惰性删除、定期删除**定时删除:在设置过期时间的同时, ... [详细]
  • mysql 4核_RDS MySQL 5.7 4核和8核共享规格性能压测阿里云开发者社区
    写在前面这次压测只用了一台ECS,也没有调整各种压测比和压测参数,把实例压到最高;这里的压测只是为了说明不同的参数对性能影响, ... [详细]
author-avatar
井上英精_824
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有