热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

sqoop理论和安装部署

1.Sqoop是什么?Sqoop是apache旗下的一款”Hadoop和关系数据库之间传输数据”的工具导入数据将MySQL,Oracle导入数据到Hadoop的HDF

1. Sqoop是什么 ?


  • Sqoop是apache旗下的一款 ”Hadoop和关系数据库之间传输数据”的工具

    • 导入数据

      • 将MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统

    • 导出数据

      • 从Hadoop的文件系统中导出数据到关系数据库


2. Sqoop工作原理

      sqoop将导入和导出的命令翻译成mapreduce程序实现


  • 在翻译出的mapreduce中主要是对inputformat和outputformat进行定制


3. Sqoop安装部署

1、下载安装包
  下载sqoop安装包
  sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
2、规划安装目录
  /opt/bigdata
3、上传安装包到服务器
4、解压安装包到指定的规划目录
  tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt/bigdata
5、重命名解压目录
  mv sqoop-1.4.7.bin__hadoop-2.6.0  sqoop-1.4.7
6、修改配置
  进入到sqoop安装目录下的conf文件夹中
    先重命名文件  cp sqoop-env-template.sh  sqoop-env.sh
    修改文件,添加java环境变量
      vim sqoop-env.sh
          #Set path to where bin/hadoop is available
          export HADOOP_COMMON_HOME=/opt/bigdata/hadoop-2.7.3
          
          #Set path to where hadoop-*-core.jar is available
          export HADOOP_MAPRED_HOME=/opt/bigdata/hadoop-2.7.3
          
          #set the path to where bin/hbase is available
          export HBASE_HOME=/opt/bigdata/hbase-1.2.1
          
          #Set the path to where bin/hive is available
          export HIVE_HOME=/opt/bigdata/hive-1.2.2

7、添加mysql驱动jar包
  把mysql的驱动jar包添加到sqoop的lib目录下,可以拷贝之前hive的lib目录下的mysql驱动
      cp /opt/bigdata/hive/lib/mysql-connector-java-5.1.46.jar /opt/bigdata/sqoop-1.4.7/lib/

8、配置sqoop环境变量
  vim  /etc/profile
      export SQOOP_HOME=/opt/bigdata/sqoop-1.4.7
      export PATH=$PATH:$SQOOP_HOME/bin

9、让sqoop环境变量生效
  source .bash_profile


4.几个常用的命令:


  • 命令行查看帮助文档

sqoop list-databases --help

  • 列出node1上mysql数据库中所有的数据库名称

sqoop-list-databases --connect jdbc:mysql://node2:3306/ --username root --password QQ@cf123456


  • 查看某一个数据库下面的所有数据表

sqoop list-tables --connect jdbc:mysql://node2:3306/user_cf_db --username root --password QQ@cf123456


推荐阅读
  • Hadoop——Hive简介和环境配置
    一、Hive的简介和配置1.简介Hive是构建在Hadoop之上的数据操作平台lHive是一个SQL解析引擎,它将SQL转译成MapReduce作业,并 ... [详细]
  • 本文_大数据之非常详细Sqoop安装和基本操作
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了大数据之非常详细Sqoop安装和基本操作相关的知识,希望对你有一定的参考价值。大数据大数据之 ... [详细]
  • Java开发实战讲解!字节跳动三场技术面+HR面
    二、回顾整理阿里面试题基本就这样了,还有一些零星的问题想不起来了,答案也整理出来了。自我介绍JVM如何加载一个类的过程,双亲委派模型中有 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • PHP连接MySQL的2种方法小结以及防止乱码【PHP】
    后端开发|php教程PHP,MySQL,乱码后端开发-php教程PHP的MySQL配置报错信息:ClassmysqlinotfoundinAnswer:1.在confphp.ini ... [详细]
  • 伸缩性|发生_分布式文件系统设计,该从哪些方面考虑?
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了分布式文件系统设计,该从哪些方面考虑?相关的知识,希望对你有一定的参考价值。点击上方关注“ ... [详细]
  • 我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]
  • Azkaban(三)Azkaban的使用
    界面介绍首页有四个菜单projects:最重要的部分,创建一个工程,所有flows将在工程中运行。scheduling:显示定时任务executing:显示当前运行的任务histo ... [详细]
  • HBase系列之hbase2.2.3安装
    1.下载地址hbase-2.2.3下载地址2.解压安装1)解压tarzxvfhbase-2.2.3-bin.tar.gz2)环境变量配置vim ... [详细]
  • 本文介绍了在MacOS系统上安装MySQL的步骤,并详细说明了如何设置MySQL服务的开机启动和如何修改MySQL的密码。通过下载MySQL的macos版本并按照提示一步一步安装,在系统偏好设置中可以找到MySQL的图标进行设置。同时,还介绍了通过终端命令来修改MySQL的密码的具体操作步骤。 ... [详细]
  • Python项目实战10.2:MySQL读写分离性能优化
    本文介绍了在Python项目实战中进行MySQL读写分离的性能优化,包括主从同步的配置和Django实现,以及在两台centos 7系统上安装和配置MySQL的步骤。同时还介绍了创建从数据库的用户和权限的方法。摘要长度为176字。 ... [详细]
  • mapreduce源码分析总结
    这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的ÿ ... [详细]
  • MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法,就会将job提交给本地执行器localjobrunner执行-- ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
author-avatar
书友40416624
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有