当前位置: 开发笔记 > 编程语言 > 正文

开发笔记:CDHHadoop+HBaseHA部署详解

作者：葬宝御用小奶瓶2004 | 来源：互联网 | 2023-08-29 10:34

本文由编程笔记#小编为大家整理，主要介绍了CDHHadoop+HBaseHA部署详解相关的知识，希望对你有一定的参考价值。

本文由编程笔记#小编为大家整理，主要介绍了CDH Hadoop + HBase HA 部署详解相关的知识，希望对你有一定的参考价值。

CDH 的部署和 Apache Hadoop 的部署是没有任何区别的。这里着重的是 HA的部署，需要特殊说明的是NameNode HA 需要依赖 Zookeeper

准备

Hosts文件配置：

CDH Hadoop + HBase HA 部署详解

各个节点服务情况

CDH Hadoop + HBase HA 部署详解

对几个新服务说明下：

JournalNode 用于同步 NameNode 元数据，和 Zookeeper 一样需要 2N+1个节点存活集群才可用。

DFSZKFailoverController（ZKFC）用于主备切换，类似 Keepalived 所扮演的角色。

NTP 服务
设置时区

CDH Hadoop + HBase HA 部署详解

配置NTP Server

CDH Hadoop + HBase HA 部署详解

启动并设置开机自启动

CDH Hadoop + HBase HA 部署详解

配置 NTP Client

CDH Hadoop + HBase HA 部署详解

启动并设置开机自启动

CDH Hadoop + HBase HA 部署详解

检查 NTP 同步

CDH Hadoop + HBase HA 部署详解

JDK
创建目录

CDH Hadoop + HBase HA 部署详解

创建运行账户

useradd -u 600 run

安装包
http://archive.cloudera.com/cdh5/cdh/5/

CDH Hadoop + HBase HA 部署详解

安装 Zookeeper

CDH Hadoop + HBase HA 部署详解

设置环境变量

CDH Hadoop + HBase HA 部署详解

删除无用文件

CDH Hadoop + HBase HA 部署详解

创建数据目录

CDH Hadoop + HBase HA 部署详解

配置

CDH Hadoop + HBase HA 部署详解

修改Zookeeper的日志打印方式，与日志路径设置
编辑

$ZOOKEEPER_HOME/bin/zkEnv.sh

在27行后加入两个变量

CDH Hadoop + HBase HA 部署详解

创建 myid文件

CDH Hadoop + HBase HA 部署详解

设置目录权限

chown -R run.run /data/{app,appData,logs}

启动、停止

CDH Hadoop + HBase HA 部署详解

安装 Hadoop

CDH Hadoop + HBase HA 部署详解

设置环境变量

CDH Hadoop + HBase HA 部署详解

删除无用文件

CDH Hadoop + HBase HA 部署详解

新建数据目录

mkdir -p /data/appData/hdfs/{name,edits,data,jn,tmp}

配置
切换到配置文件目录

cd $HADOOP_HOME/etc/hadoop

编辑 core-site.xml

CDH Hadoop + HBase HA 部署详解

编辑 hdfs-site.xml

CDH Hadoop + HBase HA 部署详解

小于5个DataNode建议添加如下配置

CDH Hadoop + HBase HA 部署详解

在 hadoop-env.sh 中添加如下变量

CDH Hadoop + HBase HA 部署详解

Heap 设置，单位 MB

export HADOOP_HEAPSIZE=1024

权限设置

chown -R run.run /data/{app,appData,logs} chmod 777 /data/pid

格式化
格式化只需要执行一次,格式化之前启动Zookeeper

切换用户

su - run

启动所有 JournalNode

hadoop-daemon.sh start journalnode

格式化 Zookeeper（为 ZKFC 创建znode）

hdfs zkfc -formatZK

NameNode 主节点格式化并启动

hdfs namenode -format hadoop-daemon.sh start namenode

NameNode 备节点同步数据并启动

hdfs namenode -bootstrapStandby hadoop-daemon.sh start namenode

启动 ZKFC

hadoop-daemon.sh start zkfc

启动 DataNode

hadoop-daemon.sh start datanode

启动与停止
切换用户

su - run

集群批量启动
需要配置运行用户ssh-key免密码登录，与$HADOOP_HOME/etc/hadoop/slaves

# 启动 start-dfs.sh # 停止 stop-dfs.sh

单服务启动停止
启动HDFS

hadoop-daemon.sh start journalnode hadoop-daemon.sh start namenode hadoop-daemon.sh start zkfc hadoop-daemon.sh start datanode

停止HDFS

hadoop-daemon.sh stop datanode hadoop-daemon.sh stop namenode hadoop-daemon.sh stop journalnode hadoop-daemon.sh stop zkfc

测试
HDFS HA 测试
打开 NameNode 状态页：
http://cdh-m1:50010
http://cdh-m2:50010

在 Overview 后面能看见 active 或 standby，active 为当前 Master，停止 active 上的 NameNode，检查 standby是否为 active。

HDFS 测试

hadoop fs -mkdir /test hadoop fs -put /etc/hosts /test hadoop fs -ls /test

结果:

CDH Hadoop + HBase HA 部署详解

HDFS 管理命令

# 动态加载 hdfs-site.xml hadoop dfsadmin -refreshNodes

HBase安装配置

cd /data/install tar xf hbase-1.0.0-cdh5.4.5.tar.gz -C /data/app cd /data/app ln -s hbase-1.0.0-cdh5.4.5 hbase

设置环境变量

CDH Hadoop + HBase HA 部署详解

删除无用文件

CDH Hadoop + HBase HA 部署详解

配置
进入配置文件目录

cd $HBASE_HOME/conf

编辑 hbase-site.xml

CDH Hadoop + HBase HA 部署详解

在 hbase-env.sh 中添加如下变量

Heap 设置，单位 MB

export HBASE_HEAPSIZE=1024

可选设置 regionservers 中添加所有RegionServer主机名，用于集群批量启动、停止

启动与停止
切换用户

su - run

集群批量启动
需要配置运行用户ssh-key免密码登录，与$HBASE_HOME/conf/regionservers

# 启动 start-hbase.sh # 停止 stop-hbase.sh

单服务启动停止
HMaster

# 启动 hbase-daemon.sh start master # 停止 hbase-daemon.sh stop master

HRegionServer

# 启动 hbase-daemon.sh start regionserver # 停止 hbase-daemon.sh stop regionserver

测试
HBase HA 测试
浏览器打开两个HMaster状态页:
http://cdh-m1:60010
http://cdh-m2:60010

可以在Master后面看见其中一个主机名，Backup Masters中看见另一个。
停止当前Master，刷新另一个HMaster状态页会发现Master后面已经切换，HA成功。

HBase 测试
进入hbase shell 执行：

create 'users','user_id','address','info' list put 'users','anton','info:age','24' get 'users','anton' # 最终结果 COLUMN CELL info:age timestamp=1465972035945, value=24 1 row(s) in 0.0170 seconds

清除测试数据：

disable 'users' drop 'users'

微信扫一扫

推荐阅读

request
解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法

本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法，包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时，还介绍了修改nginx的error.log日志级别为debug，以便查看详细日志信息。 ... [详细]

蜡笔小新 2023-12-12 13:19:04
get
Linux下Kafka单机安装配置方法（实操成功）

本文介绍了在Linux下安装和配置Kafka的方法，包括安装JDK、下载和解压Kafka、配置Kafka的参数，以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例，帮助读者快速完成Kafka的安装和配置。 ... [详细]

蜡笔小新 2023-12-12 18:14:32
get
伸缩性|发生_分布式文件系统设计，该从哪些方面考虑？

篇首语：本文由编程笔记#小编为大家整理，主要介绍了分布式文件系统设计，该从哪些方面考虑？相关的知识，希望对你有一定的参考价值。点击上方关注“ ... [详细]

蜡笔小新 2023-10-16 17:43:40
get
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
request
页面请求方法参数最长_关于 HTTP GET/POST 请求参数长度最大值的一个理解误区

http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的，最大不能超过XX ... [详细]

蜡笔小新 2023-12-13 19:20:03
get
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
get
ABAP开发发送邮件程序的配置和代码整理

本文介绍了通过ABAP开发往外网发邮件的需求，并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定，可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度：184字。 ... [详细]

蜡笔小新 2023-12-13 15:50:17
default
HDFS2.x新特性

一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]

蜡笔小新 2023-12-13 13:52:40
request
如何在codeigniter中识别angularjs请求

本文讨论了如何在codeigniter中识别来自angularjs的请求，并提供了两种方法的代码示例。作者尝试了$this->input->is_ajax_request()和自定义函数is_ajax()，但都没有成功。最后，作者展示了一个ajax请求的示例代码。 ... [详细]

蜡笔小新 2023-12-12 12:37:07
get
在虚拟服务器上安装oracle 10g客户端的问题及解决方法

本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题，并提供了解决方法。错误日志显示了异常访问违例，通过分析日志中的问题帧，找到了解决问题的线索。文章详细介绍了解决方法，帮助读者顺利安装oracle 10g客户端。 ... [详细]

蜡笔小新 2023-12-11 13:08:10
get
HTTP服务器超时情况下出现两个请求的原因分析

本文探讨了在设置了HTTP客户端超时时间后，向HTTP服务器发送请求时出现两个请求的情况。其中一个请求正常，另一个请求无法获取请求参数。文章分析了可能导致此问题的原因，并提供了解决方案。 ... [详细]

蜡笔小新 2023-12-11 12:03:08
timestamp
生产环境下JVM调优参数的设置实例

正文前先来一波福利推荐：福利一：百万年薪架构师视频，该视频可以学到很多东西，是本人花钱买的VIP课程，学习消化了一年，为了支持一下女朋友公众号也方便大家学习，共享给大家。福利二 ... [详细]

蜡笔小新 2023-10-17 14:08:49
timestamp
Hadoop源码解析1Hadoop工程包架构解析

1 Hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster：ht ... [详细]

蜡笔小新 2023-10-17 13:28:20
timestamp
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
timestamp
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42

葬宝御用小奶瓶2004

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章