热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

InfoSphereCDC实时同步本地数据到云端的BigInsights

IBMInfoSphereCDC是一款功能强大的数据实时复制软件,不仅广泛应用于传统ODS、数据仓库、数据集市及BI系统的异构平台集成,同时也提供对Cloud的全面支持;对于各种Cloud应

IBM InfoSphere CDC 是一款功能强大的数据实时复制软件,不仅广泛应用于传统ODS、数据仓库、数据集市及BI系统的异构平台集成,同时也提供对Cloud的全面支持;对于各种 Cloud 应用场景,CDC 不仅能提供低影响、近实时的海量数据复制,同时还可确保数据在传输过程中的完整性和安全性。

大数据处理

作为IBM重金打造的旗舰品牌,Bluemix 公有云平台是一个基于 Cloud Foundry 开源项目的平台即服务(PaaS)产品,它使得组织和开发人员能够快速而又轻松地在云上创建、部署和管理应用程序。Bluemix 为全球广大用户提供丰富的应用和服务,这其中也包括云端的 IBM Hadoop产品:BigInsights。

大数据处理

通过IBM InfoSphere CDC,可以轻松将本地数据库(On Premise)的数据实时同步到位于 Bluemix 云端的BigInsights,从而解决在大数据分析中所面对的几大问题:

  • 海量数据的处理
  • 数据来源的多样性
  • 数据分析的敏捷性
  • 数据分析的持久性
大数据处理

接下来,我们将通过以下步骤来演示如何利用CDC搭建本地数据库(例如DB2)到云端BigInsights的实时同步场景。

On Premise 系统配置

1. 配置并确认当前DB2数据库正常运行。

2. 安装InfoSphere CDC for DB2(位于源端的CDC引擎,通过实时解析DB2日志来捕获增量数据变化)。

3. 安装InfoSphere CDC for DataStage(位于目标端的CDC引擎,将源端的实时增量数据应用于目标端Hadoop平台/HDFS文件系统)。

4. 配置CDC服务器到Bluemix的内部网络连接(防火墙)。

5. 安装CDC配置管理监控平台(Management Console 和 Access Server)。

大数据处理

创建 BigInsights for Apache Hadoop 服务

大数据处理

1. 登录Bluemix平台(要求使用Bluemix ID)。

https://console.ng.bluemix.net/

2. 点击页面上方的"目录",并在页面左侧的"服务"栏中勾选"数据与分析",然后选择"BigInsights for Apache Hadoop"。

3. 进入"BigInsights for Apache Hadoop"页面,指定相关属性并创建服务。

大数据处理

检查 BigInsights for Apache Hadoop 服务

1. 从Bluemix的用户仪表盘中,点击新创建的"BigInsights for Apache Hadoop"服务。

大数据处理

2. 检查当前服务的有效期,通常免费使用一个月。

3. 检查当前服务的凭证及配置信息,例如用户名、密码。

启动 BigInsights for Apache Hadoop 服务

1. 在BigInsights for Apache Hadoop页面中点击"Launch" 以启动服务。

大数据处理

2. 检查BigInsights for Apache Hadoop的主机名,端口(8443)及URL前缀(/gateway/default/),以供CDC配置使用。

大数据处理

创建CDC预订和配置表映射

1. 在CDC配置管理监控平台(Management Console)中,创建预订并运行表映射向导。

大数据处理

2. 选择目标端交付方法为 Apache Hadoop -> Web HDFS。

大数据处理

3. 选择需要复制的DB2源表,并指定目标端BigInsights的Web HDFS目录路径。

大数据处理

配置CDC预订的Hadoop属性

1. 右键点击预订,选择Hadoop Properties。

大数据处理

2. 可修改Batch Size值(生成落地文件的触发条件),并输入通过Web HDFS连接BigInsights的连接信息。

大数据处理

3. 启动预订,开始实时复制。

验证数据实时同步结果

1. 在本地DB2数据库上运行若干个交易,使得CDC所监控的源表数据产生变更。

2. 在目标端BigInsights for Apache Hadoop主页上点击BigSheets,便可监控到数据从源端

DB2已实时同步过来,整个过程完全自动化,低延迟且准确无误。

大数据处理
对BigInsights感兴趣的朋友可以点击下面链接查看详情并下载:
http://bigdata.evget.com/product/385.html
推荐阅读
  • CentOS 7配置SSH远程访问及控制
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • Skywalking系列博客1安装单机版 Skywalking的快速安装方法
    本文介绍了如何快速安装单机版的Skywalking,包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 本文介绍了一些Java开发项目管理工具及其配置教程,包括团队协同工具worktil,版本管理工具GitLab,自动化构建工具Jenkins,项目管理工具Maven和Maven私服Nexus,以及Mybatis的安装和代码自动生成工具。提供了相关链接供读者参考。 ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • LVS-DR直接路由实现负载均衡示例
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • Spark Streaming和Kafka整合之路(最新版本)
    2019独角兽企业重金招聘Python工程师标准最近完成了SparkStreaming和Kafka的整合工作,耗时虽然不长,但是当中还是遇到了不少 ... [详细]
  • Nginx使用(server参数配置)
    本文介绍了Nginx的使用,重点讲解了server参数配置,包括端口号、主机名、根目录等内容。同时,还介绍了Nginx的反向代理功能。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • Windows下配置PHP5.6的方法及注意事项
    本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项,包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法,如下载缺失的msvcr110.dll文件等。通过本文的指导,读者可以轻松地在Windows系统下配置PHP5.6,并解决一些常见的配置问题。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记
    本文介绍了大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记,包括outputFormat接口实现类、自定义outputFormat步骤和案例。案例中将包含nty的日志输出到nty.log文件,其他日志输出到other.log文件。同时提供了一些相关网址供参考。 ... [详细]
  • 目录浏览漏洞与目录遍历漏洞的危害及修复方法
    本文讨论了目录浏览漏洞与目录遍历漏洞的危害,包括网站结构暴露、隐秘文件访问等。同时介绍了检测方法,如使用漏洞扫描器和搜索关键词。最后提供了针对常见中间件的修复方式,包括关闭目录浏览功能。对于保护网站安全具有一定的参考价值。 ... [详细]
  • Apache Shiro 身份验证绕过漏洞 (CVE202011989) 详细解析及防范措施
    本文详细解析了Apache Shiro 身份验证绕过漏洞 (CVE202011989) 的原理和影响,并提供了相应的防范措施。Apache Shiro 是一个强大且易用的Java安全框架,常用于执行身份验证、授权、密码和会话管理。在Apache Shiro 1.5.3之前的版本中,与Spring控制器一起使用时,存在特制请求可能导致身份验证绕过的漏洞。本文还介绍了该漏洞的具体细节,并给出了防范该漏洞的建议措施。 ... [详细]
author-avatar
小曾
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有