热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

goldengate_Goldengate抽取ORACLE数据到Hbase

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Goldengate抽取ORACLE数据到Hbase相关的知识,希望对你有一定的参考价值。1、&n

篇首语:本文由编程笔记#小编为大家整理,主要介绍了Goldengate抽取ORACLE 数据 到 Hbase相关的知识,希望对你有一定的参考价值。


1、        软件版本说明:

Goldengate 12c  12.2.0.1 forOracle (源端

Goldengate 12c  12.2.0.1  for Bigdata ( 目标端)

Oracle 11g 11.2.0.4.0 (oracle 数据库必须是11.2.0.4之后的版本,之前的oracle 数据库版本不支持ogg 12c )

HBase 1.1.2

Java 1.8.0_91

2、        机器IP 说明

源端IP地址(192.168.45.176安装  Oracle 11g 11.2.0.4  Goldengate 12c 

目标端 IP地址(192.168.45.175),安装 hbase,Goldengate 12c ,软件安装

hbase已采用ambari 进行安装,安装过程不作详细说明,在此主要说明下各软件的安装目录,以及使用的端口。

 

Oracle 12c  for Oracle 192.168.45.176 安装目录为:/home/oracle/oggdb

Oracle 12c for bigdata  (192.168.45.175)    安装目录为:/ogg

Hbase 安装目录: /usr/hdp/2.4.2.0-258/hbase

 

3、        源端(192.168.45.176 的配置

#连接数据库

sqlplus / as sysdba

SQL> shutdownimmeidate;

SQL> startup mount;

#开启归档日志

SQL> alter database archivelog;

SQL> archive log list  

#开启数据库级日志

SQL> alter database force logging;

#开启 goldengate 复制功能(注:此参数必须开启,oracle 11.2.0.4 之后的数据库才支持此参数

SQL> alter system set enable_goldengate_replication=true scope=both;

#关闭 垃圾回收站

SQL> alter system set recyclebin=off scope=spfile;

#开启数据库

SQL> alter databaseopen;

#创建ogg 管理用户

SQL>  create user oggidentified by ogg account unlock;

SQL> grant execute on utl_file to ogg;

 SQL>grant restricted session to ogg;

 SQL> grant dba to ogg

 

进入源端(192.168.45.176OGG 目录,配置数据初始化。

# cd /home/oracle/oggdb

#进入ogg

[[email protected] oggdb]$ ./ggsci

#配置源端mgr进程

GGSCI (oracle) 10> edit params mgr

PORT 7809

#配置同步用户

GGSCI (oracle) 7> dblogin userid ogg,password ogg

Successfully logged into database.

#scott用户下的所有表开启附加日志

GGSCI (oracle) 8> add trandata scott.*

#源端配置initload extract 进程

GGSCI (oracle) 8> add extract fafainih, sourceistable

EXTRACT added.

            #配置extract进程 fafainie 参数

            extractfafainih

useridogg,password ogg

rmthost192.168.45.175,mgrport 7809

--rmttaskreplicat,group fafainir

RMTFILE./dirdat/hh

tablescott.*;

 

4、        目标 端的配置。(192.168.45.175)

#在用户家目录下的 ~/.bash_profile中配置用户的JAVA_HOME,以及LIB_PATH 环境变量。

exportJAVA_HOME=/usr/java/jdk1.8.0_91/jre/

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/java/jdk1.8.0_91/jre/lib/amd64/libjsig.so:/usr/java/jdk1.8.0_91/jre/lib/amd64/server/libjvm.so:/usr/java/jdk1.8.0_91/jre/lib/amd64/server:/usr/java/jdk1.8.0_91/jre/lib/amd64

#使新加入的环境变量生效

source ~/.bash_profile

#进入 OGG安装目录

cd  /ogg

#复制 hbase对应的配置文件。

cp AdapterExamples/big-data/hbase/*   dirprm/

cd /ogg/dirprm

 

[[email protected] dirprm]# vi hbase.props

 

 

gg.handlerlist=hbase

 

gg.handler.hbase.type=hbase

gg.handler.hbase.hBaseColumnFamilyName=cf

gg.handler.hbase.keyValueDelimiter=CDATA[=]

gg.handler.hbase.keyValuePairDelimiter=CDATA[,]

gg.handler.hbase.encoding=UTF-8

gg.handler.hbase.pkUpdateHandling=abend

gg.handler.hbase.nullValueRepresentation=CDATA[NULL]

gg.handler.hbase.authType=none

gg.handler.hbase.includeTokens=false

 

gg.handler.hbase.mode=tx

 

goldengate.userexit.timestamp=utc

goldengate.userexit.writers=javawriter

javawriter.stats.display=TRUE

javawriter.stats.full=TRUE

 

gg.log=log4j

gg.log.level=INFO

 

gg.report.time=30sec

 

#配置hbase 所用库的路径

gg.classpath=/usr/hdp/2.4.2.0-258/hbase/lib/*:/usr/hdp/2.4.2.0-258/hbase/conf/:/usr/hdp/2.4.2.0-258/hadoop/client/*

 

javawriter.bootoptiOns=-Xmx512m -Xms32m-Djava.class.path=ggjava/ggjava.jar

 

 

#进入ogg

cd  /ogg

./ggsci

GGSCI (hbase) 2> edit params mgr

Port 7809

#配置复制进程

GGSCI (hbase) 5> add replicat irhbase, specialrun

SPECIALRUN

END RUNTIME

EXTFILE ./dirdat/hh

TARGETDB LIBFILE libggjava.so SETproperty=dirprm/hbase.props

REPORTCOUNT EVERY 1 MINUTES, RATE

GROUPTRANSOPS 10000

MAP scott.*, TARGET BDTEST.*;

 

5、        源端(192.168.45.176)

cd /home/oracle/oggdb

./ggsci

#启动fafainie 进程

GGSCI (oracle) 1> start fafainih

#查看进程的执行情况

GGSCI (oracle) 2> view report fafainih

 

 

 

6、        目标端(192.168.45.175)

cd /ogg

 #启动复制进程

./replicat paramfile ./dirprm/irhbase.prm reportfile ./dirrpt/irhbase.rpt -p INITIALDATALOAD

#进入hbase 环境

Hbase shell

技术分享

#查看表中的数据

技术分享

发现表中的数据已经存在,说明oracle 数据成功加载至 hbase.

源端(192.168.45.176)配置数据的动态抓取

cd  /home/oracle/oggdb

     sqlplus / as sysdba

     SQL> @marker_setup

       #在以下提示中输入:ogg

Enter Oracle GoldenGate schema name:ogg

    #创建OGG表空间,授予OGG用户相应的权限

SQL> CREATE TABLESPACE TBS_OGG DATAFILE ‘/home/oracle/app/oracle/oradata/oggdb/tbs_ogg_01.dbf‘SIZE 2G AUTOEXTEND ON NEXT 50M MAXSIZE UNLIMITED;

Tablespace created.

SQL> alter user ogg DEFAULT TABLESPACE TBS_OGG;

User altered.

SQL> grant connect,resource,unlimited tablespace to ogg;

Grant succeeded.

 

SQL> @ddl_setup.sql 

#在以下提示中:输入ogg

Enter Oracle GoldenGate schema name:ogg

 

SQL> @role_setup

  # 在以下提示中:输入ogg

Enter GoldenGate schema name:ogg

SQL> GRANT GGS_GGSUSER_ROLE TO OGG; 

 

#配置OGG 日志抓取进程

cd  /home/oracle/oggdb

./ggsci

 

#源端创建OGG 抽取进程

GGSCI (oracle) 1> add extract scotthb, tranlog, begin now

 

# 指定抽取进程trail文件的位置

GGSCI (oracle) 2> add rmttrail /ogg/dirdat/ha,extract scotthb   

# 编辑 scotthb 进程参数

GGSCI (oracle) 3> edit params scotthb

  extract scotthb

  userid ogg,password ogg

  rmthost 192.168.45.175, mgrport 7809

  rmttrail /ogg/dirdat/ha

  discardfile /home/oracle/oggdb/dirrpt/trail.dsc,append,megabytes 100

  ddl include mapped

table scott.*;

7、目标端(192.168.45.175)配置数据复制进程

       cd /ogg

        ./ggsci

        #配置全局参数

 GGSCI (hbase) 1> edit params ./GLOBALS

  ggschema ogg

  checkpointtable ogg.chkpnt_fafa

       #配置解析进程

GGSCI (hbase) 2> add replicat rscott,exttrail /ogg/dirdat/ha

      #编辑解析进程参数

 GGSCI (hbase) 3> edit params  rscott

       REPLICAT rscott

-- Trail file for this example is located in"AdapterExamples/trail" directory

-- Command to add REPLICAT

-- add replicat rhbase, exttrail AdapterExamples/trail/tr

TARGETDB LIBFILE libggjava.so SET property=dirprm/hbase.props

REPORTCOUNT EVERY 1 MINUTES, RATE

GROUPTRANSOPS 10000

MAP scott.*, TARGET bdtest.*;

 

8、源端(192.168.45.176)启动抓取进程

cd  /home/oracle/ogdb

./ggsci

GGSCI (oracle) 1> start scotthb

9、 目标端(192.168.45.173)启动复制进程

cd /home/oracle/oggdb

./ggsci

GGSCI (kafka) 1> start rscott

 

至此,整个配置过程完成,配置完成后,可以通过在源端(192.168.45.176)中的oracle 数据库中,进行DML操作,测试新变化的数据,是否能同步到hbase。

10、源端数据库做测试(192.168.45.176)

sqlplus / as sysdba

SQL> Alter user scott account unlock;

SQL> conn scott/tiger

#向scott.dept表中新插入一条数据

SQL> insert into scott.deptvalues(50,‘DEVELOP‘,‘SHANGHAI‘);

SQL> commit;

 

11、在目标端(192.168.45.175)上查看数据

Hbase shell

技术分享

在hbase中,已经可以查询到新增加的数据。

 

12、在源端(192.168.45.176)修改oracle 数据. 

sqlplus / as sysdba

           SQL> update scott.dept set loc=‘HANGZHOU‘where deptno=50;

SQL> commit;

13、在目标端(192.168.45.175) 查看数据

Hbase shell

技术分享

发现hbase 数据对应的记录已经相应的修改。


推荐阅读
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 本文介绍了如何找到并终止在8080端口上运行的进程的方法,通过使用终端命令lsof -i :8080可以获取在该端口上运行的所有进程的输出,并使用kill命令终止指定进程的运行。 ... [详细]
  • Metasploit攻击渗透实践
    本文介绍了Metasploit攻击渗透实践的内容和要求,包括主动攻击、针对浏览器和客户端的攻击,以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码,以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]
  • 本文介绍了Perl的测试框架Test::Base,它是一个数据驱动的测试框架,可以自动进行单元测试,省去手工编写测试程序的麻烦。与Test::More完全兼容,使用方法简单。以plural函数为例,展示了Test::Base的使用方法。 ... [详细]
  • 本文介绍了为什么要使用多进程处理TCP服务端,多进程的好处包括可靠性高和处理大量数据时速度快。然而,多进程不能共享进程空间,因此有一些变量不能共享。文章还提供了使用多进程实现TCP服务端的代码,并对代码进行了详细注释。 ... [详细]
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
author-avatar
道义信_686
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有