hbase伪集群搭建

作者：麦豪小仙 | 来源：互联网 | 2023-10-13 19:16

hbase数据存储有三种跑法，跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------额。。。官网的文档挺坑爹的，结合官网、百度、谷歌的各种

hbase 数据存储有三种跑法，跑在本地磁盘上、跑在伪分布式上、跑在完全分布式上--------
额。。。官网的文档挺坑爹的，结合官网、百度、谷歌的各种文档看，只要理解原理，搭建也不算难（当然照的官网文档个看就比较坑爹了）
单机模式 ------->> 这个最简单，免写了，下了包直接解压配置个路径就可以启动了，zk 和 hbase 都是起在同一个 jvm 中的，数据落到本地磁盘。
伪分布式部署方式 ------->> 先部署 hdfs ，再部署 hbase ，它们的各个进程跑在不同的 jvm 中， hbase只是将数据落到了 hdfs 上。
完全分布式 ------->> 完全分布式用大白话来说，我理解的就是个伪分布式的升级款，只是把伪分布式的一台服务器变成了 n 台。。。

完全分布式一定要部署在物理机上

上边蛋扯的差不多了，下面直接入正题，开始部署
下载什么版本的包自己解决，要想下载最轻松的全部安装包，直接到 cdh 上去下载，百度搜索 cdh ，你懂的、、、然后配置文件每个版本的基本上差不多，没有太大的出入
下面是以 hadoop-2.7.2 、 hbase-1.1.2 为例

一、新系统的话，自己先处理一下系统，这个习惯相信所有运维同行的哥哥们都是有这习惯的。。。关闭不用的防火墙、最大文件打开数、jdk全局变量、dns、主机名解析
建议配置时用 ip 的最后用内网的域名，这样的话，开发的代码也好接入做好的 hbase，用主机名的话，开发的还得自己的 hosts ，我这里用的内网的 dns 域名。

二、部署 hdfs

包传到服务器上，解压

hadoop-2.7.2.tar.gz
tar xvf  hadoop-2.7.2.tar.gz  -C /home
cd /home/hadoop-2.7.2
vim etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_72

配置HDFS 之 core-site.xml

mkdir data
vim etc/hadoop/core-site.xml

 
    fs.defaultFS
    hdfs://pretend.hdfs.gag.cn:9000
            
 
 
    hadoop.tmp.dir
    /home/hadoop-2.7.2/data/tmp

配置HDFS 之 hdfs-site.xml

vim etc/hadoop/hdfs-site.xml
   
   
    dfs.replication
    1

配置HDFS 之 YARN，这原配置文件里什么也没有，都是注释内容，直接改名就行

mv etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml
vim etc/hadoop/mapred-site.xml

  
  
    mapreduce.framework.name
    yarn

配置HDFS 之 yarn-site.xml

 vim etc/hadoop/yarn-site.xml
  
  
    yarn.nodemanager.aux-services
    mapreduce_shuffle

启动 hdfs
初次启动 hdfs 先要初始化文件系统，也可以说是格式化文件系统

    bin/hdfs namenode -format

hbase伪集群搭建

格式化完毕，启动NameNod和DataNode进程
启动之前如果修改 jvm 参数的话，在 vim etc/hadoop/hadoop-env.sh 修改 HADOOP_HEAPSIZE 这一项就可以了，默认应该是 1024M

sbin/start-dfs.sh

启动以后，有这里显示有三个配置文件，是 out 后缀的，看日志的话，看 log 后缀的，看有没有 error 级别的报错
hbase伪集群搭建

启动YARN

     sbin/start-yarn.sh

同样是去看这两个的 log 后缀的日志
这里了 hdfs 就算启动完毕了，这时再 jps 命令可以看到除 jps 进程外有 5 个
hbase伪集群搭建

查看端口已经有这么多了， 50070 是 hdfs 的 web 端口，以后输入 ip:port 或者域名:port 来查看 web 页面
hbase伪集群搭建

======================================================================

以上 hdfs 启动没问题后，就可以启动 hbase 了

     tar xvf hbase-1.1.2-bin.tar.gz -C /home/        
     cd /home/hbase-1.1.2/   
     vim conf/hbase-env.sh   
     export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_72

配置Hbase

mkdir data
vim conf/hbase-site.xml 

     
   
      hbase.rootdir
      hdfs://pretend.hdfs.gag.cn:9000/hbase
            
  
  
     hbase.zookeeper.property.dataDir
     /home/hbase-1.1.2/data
             
  
  
     hbase.cluster.distributed
     true

hbase 集群内的服务器，如果是启动完全分布式，这里要填写hbase所有的服务器域名或者 ip 或者主机名，顺便说一下，hbase和 hadoop 集群全部是已 ssh 远程调用命令的方式启动其他节点的

    vim conf/regionservers      
    pretend.hbase.gag.cn

这里的话，我把内存调整了一下，因为开发那边要用，服务器是 8G 的

    vim conf/hbase-env.sh 
    export HBASE_MASTER_OPTS="$HBASE_MASTER_OPTS -XX:PermSize=512m -XX:MaxPermSize=512m"
export HBASE_REGIONSERVER_OPTS="$HBASE_REGIONSERVER_OPTS -XX:PermSize=512m -XX:MaxPermSize=512m"

启动Hbase

先启动 zookeeper，如果是完全分布式的话，所有的 hbase节点会以临时节点的方式注册在 zk 里，伪分布式也一样，只不过zk 里只有一个节点，zk 也只有一个节点

 bin/hbase-daemon.sh start zookeeper         启动后查看日志
 bin/hbase-daemon.sh start master               启动后查看日志
 bin/hbase-daemon.sh start regionserver      启动后查看日志

此时的 jps 可以查看到除 jps 外 8 个进程
hbase伪集群搭建

hbase 的 web 页面端口是 16010
hbase伪集群搭建

如果要加开机启动的话，最好加上sleep等待，我是这样加的
hbase伪集群搭建

正常停止方式：
一定要按照顺序停止
停止 hbase、zookeeper、hdfs

推荐阅读

version
Hadoop2.6.0 + 云centos +伪分布式只谈部署

3.0.3玩不好，现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0，rm掉3.0.32.在etcp ... [详细]

蜡笔小新 2023-10-17 19:28:24
split
mapreduce源码分析总结

这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型，它最初是由Google工程师设计并实现的ÿ ... [详细]

蜡笔小新 2023-10-17 12:36:35
split
Hadoop学习笔记1：伪分布式环境搭建

在搭建Hadoop环境之前，请先阅读如下博文，把搭建Hadoop环境之前的准备工作做好，博文如下： 1、CentOS6.7下安装JDK,地址：http:b ... [详细]

蜡笔小新 2023-10-16 16:04:04
ip
Hadoop之Yarn

目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ... [详细]

蜡笔小新 2023-10-15 12:16:30
ip
HDFS2.x新特性

一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]

蜡笔小新 2023-12-13 13:52:40
ip
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
ip
java filesystem 追加_Java DistributedFileSystem.append方法代码示例

importorg.apache.hadoop.hdfs.DistributedFileSystem;导入方法依赖的package包类privatevoidtestHSyncOpe ... [详细]

蜡笔小新 2023-10-17 17:01:46
ip
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
version
hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码...

对于开源的东东，尤其是刚出来不久，我认为最好的学习方式就是能够看源代码和doc，測试它的样例为了方便查看源代码，关联导入源代 ... [详细]

蜡笔小新 2023-10-17 09:49:38
version
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
version
伸缩性|发生_分布式文件系统设计，该从哪些方面考虑？

篇首语：本文由编程笔记#小编为大家整理，主要介绍了分布式文件系统设计，该从哪些方面考虑？相关的知识，希望对你有一定的参考价值。点击上方关注“ ... [详细]

蜡笔小新 2023-10-16 17:43:40
version
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42
hash
Java开发实战讲解！字节跳动三场技术面+HR面

二、回顾整理阿里面试题基本就这样了，还有一些零星的问题想不起来了，答案也整理出来了。自我介绍JVM如何加载一个类的过程，双亲委派模型中有 ... [详细]

蜡笔小新 2023-10-15 19:48:25
client
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
shell
Hadoop框架之HDFS的shell操作

既然HDFS是存取数据的分布式文件系统，那么对HDFS的操作，就是文件系统的基本操作，比如文件的创建、修改、删除、修改权限等，文件夹的创建、删除、重命名等。对HDFS的操作命令类似于Linux的she ... [详细]

蜡笔小新 2023-10-15 16:12:13

麦豪小仙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章