热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ClouderaManager5和CDH5离线安装参考

0.?主机规划ClouderaManager需要一台单独的主机debugo01ClouderaManager,yumrepodebugo02NameNode,DataNode,YarnRM,SparkMaster,SparkWorkerdebugo03DataNode,SparkWorker,SeconderyNameNode1.准备工作(需要在所有节点操作)a).网

0. ?主机规划 Cloudera Manager需要一台单独的主机 debugo01 Cloudera Manager, yum repo debugo02 NameNode, DataNode, Yarn RM, Spark Master, Spark Worker debugo03 DataNode, Spark Worker, Secondery NameNode 1. 准备工作(需要在所有节点操作) a). 网

0. ?主机规划

Cloudera Manager需要一台单独的主机
debugo01 Cloudera Manager, yum repo
debugo02 NameNode, DataNode, Yarn RM, Spark Master, Spark Worker …
debugo03 DataNode, Spark Worker, Secondery NameNode …

1. 准备工作(需要在所有节点操作)

a). 网络配置、 /etc/hosts或DNS 、hostname配置(略)
b). 时区和ntp

cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
chkconfig ntpd on

c). 关闭selinux和iptables

chkconfig iptables off
chkconfig ip6tables off
sed -i 's/^SELINUX.*/SELINUX=disabled/' /etc/selinux/config

d). 配置ISO源

/etc/yum.repos.d/CentOS-ISO.repo
[base]
name=CentOS-$releasever - ISO
baseurl=http://debugo01/CentOS_6.5_Final
enabled=1
gpgcheck=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-6
# 在debugo01上挂载镜像文件到http目录下
yum install -y httpd
mount -o loop CentOS*.iso /var/www/html

e). 安装包
所有主机都需要安装mysql-connector、jdk和scala(需要去Oracle和Scala官方下载1.7最新版)

yum install -y mysql-connector-java
rpm -qa | grep java    #(需要卸载openjdk-1.6)
rpm -ivh jdk-1.7.0_67-fcs.x86_64.rpm
rpm -ivh scala-2.10.4-400.noarch.rpm

f). 重启主机

2. CM Server配置

离线安装有两种方式,官方推荐使用parcel来进行离线安装。但是一直尝试失败,下面使用yum repo进行离线安装。
a). 安装软件包

yum install mysql-server mysql createrepo
chkconfig mysqld on

b). 下载Cloudera Manager

wget http://archive-primary.cloudera.com/cm5/cm/5/cloudera-manager-el6-cm5.1.1_x86_64.tar.gz
tar xvzf cloudera-manager-el6-cm5.1.1_x86_64.tar.gz -C /opt

c). 创建MySQL用户

mysql -uroot -e "CREATE DATABASE cm DEFAULT CHARSET utf8 COLLATE utf8_general_ci"
mysql -uroot -e "CREATE DATABASE cdh DEFAULT CHARSET utf8 COLLATE utf8_general_ci"
mysql -uroot -e 'GRANT all on cm.* TO cm@"%" IDENTIFIED BY "cm"'
mysql -uroot -e 'GRANT all on cdh.* TO cdh@"%" IDENTIFIED BY "cdh"'
mysqladmin flush-privileges

d).同步yum repo
最新的repo请在http://archive.cloudera.com/ 中下载

vim /etc/yum.repo.d/cloudera-cdh5.repo 
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat	or CentO
S 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/5/
gpgkey = http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloude
ra    
gpgcheck = 1
[cloudera-manager]
name = Cloudera Manager, Version 5.1.1
baseurl = http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.1.1/
gpgkey = http://archive.cloudera.com/redhat/cdh/RPM-GPG-KEY-cloudera
gpgcheck = 1
enabled=1
cd /var/www/html
mkdir cdh5 && cd cdh5
reposync -r cloudera-cdh5
createrepo .
ln -s /var/www/html/cdh5/cloudera-cdh5/RPMS /var/www/html/cdh5/RPMS
# 漫长得等待...
mkdir ../cm && cd cm
reposync -r cloudera-manager
createrepo .

在debugo02,debugo03上测试http访问,并配置下面的repo信息。
[cloudera-cdh5]
# Packages for Cloudera’s Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera’s Distribution for Hadoop, Version 5
baseurl=http://debugo01/cdh5
gpgcheck = 0
enabled = 1

[cloudera-manager]
name = Cloudera Manager, Version 5.1.1
baseurl = http://debugo01/cm
gpgcheck = 0
enabled=1
e). 配置cm

sed -i 's/^server_host.*/server_host=debugo01/' /opt/cm-5.1.1/etc/cloudera-scm-agent/config.ini
/opt/cm-5.1.1/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot -p --scm-host localhost scm scm scm
Enter database password: 
Verifying that we can write to /opt/cm-5.1.1/etc/cloudera-scm-server
Creating SCM configuration file in /opt/cm-5.1.1/etc/cloudera-scm-server
Executing:  /usr/java/latest/bin/java -cp /usr/share/java/mysql-connector-java.jar:/usr/share/java/oracle-connector-java.jar:/opt/cm-5.1.1/share/cmf/schema/../lib/* com.cloudera.enterprise.dbutil.DbCommandExecutor /opt/cm-5.1.1/etc/cloudera-scm-server/db.properties com.cloudera.cmf.db.
[main] DbCommandExecutor              INFO  Successfully connected to database.
All done, your SCM database is configured correctly!

f). 启动cm

/opt/cm-5.1.1/etc/init.d/cloudera-scm-agent start
/opt/cm-5.1.1/etc/init.d/cloudera-scm-server start

3. 安装CDH

a). 通过浏览器访问debugo01,使用admin/admin登录
b). 选择Cloudera Express来创建cluster。express是cloudera的免费版,相比企业版只是少了升级和一些高级特性(http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM5/latest/Cloudera-Manager-Installation-Guide/cm5ig_feature_differences.html?scroll=cmfeig_topic_5_1)
c). 接下来Specify hosts for your CDH cluster installation, 添加新主机debugo02,并将Currently Managed Hosts中的cm-server主机debugo01也勾选上。
d). Select Repository – Use Parcel, CDH – CDH-5.1.0-1.cdh5.1.0.p0.53
e). Provide SSH login credentials. 使用root并输入root密码
f). Cluster Installation
这里会遇到一个DNS反向解析错误,不能正确解析Cloudera Manager Server主机名的问题,解决方法将host工具改名,安装成功后再修改回来。
mv /usr/bin/host /usr/bin/host.bak
为了加快安装,可以在安装开始后手工删除debugo02、debugo03中/etc/yum.repos.d/新生成的repo文件,让cluster的直接使用本地源。
g). 安装后进入集群配置界面,输入前面创建的cdh数据库。根据需求配置角色。完成查看host和集群状态正常,安装完成。很多细节的配置警告可以根据提示来调整。
1

^^

推荐阅读
  • CentOS 7配置SSH远程访问及控制
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  • Centos7.6安装Gitlab教程及注意事项
    本文介绍了在Centos7.6系统下安装Gitlab的详细教程,并提供了一些注意事项。教程包括查看系统版本、安装必要的软件包、配置防火墙等步骤。同时,还强调了使用阿里云服务器时的特殊配置需求,以及建议至少4GB的可用RAM来运行GitLab。 ... [详细]
  • 本文介绍了在Win10上安装WinPythonHadoop的详细步骤,包括安装Python环境、安装JDK8、安装pyspark、安装Hadoop和Spark、设置环境变量、下载winutils.exe等。同时提醒注意Hadoop版本与pyspark版本的一致性,并建议重启电脑以确保安装成功。 ... [详细]
  • 本文介绍了Linux系统中正则表达式的基础知识,包括正则表达式的简介、字符分类、普通字符和元字符的区别,以及在学习过程中需要注意的事项。同时提醒读者要注意正则表达式与通配符的区别,并给出了使用正则表达式时的一些建议。本文适合初学者了解Linux系统中的正则表达式,并提供了学习的参考资料。 ... [详细]
  • Ubuntu 9.04中安装谷歌Chromium浏览器及使用体验[图文]
    nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]
  • mac php错误日志配置方法及错误级别修改
    本文介绍了在mac环境下配置php错误日志的方法,包括修改php.ini文件和httpd.conf文件的操作步骤。同时还介绍了如何修改错误级别,以及相应的错误级别参考链接。 ... [详细]
  • 本文介绍了在CentOS 6.4系统中更新源地址的方法,包括备份现有源文件、下载163源、修改文件名、更新列表和系统,并提供了相应的命令。 ... [详细]
  • CentOS7.8下编译muduo库找不到Boost库报错的解决方法
    本文介绍了在CentOS7.8下编译muduo库时出现找不到Boost库报错的问题,并提供了解决方法。文章详细介绍了从Github上下载muduo和muduo-tutorial源代码的步骤,并指导如何编译muduo库。最后,作者提供了陈硕老师的Github链接和muduo库的简介。 ... [详细]
  •     这里使用自己编译的hadoop-2.7.0版本部署在windows上,记得几年前,部署hadoop需要借助于cygwin,还需要开启ssh服务,最近发现,原来不需要借助cy ... [详细]
  • Hadoop2.6.0 + 云centos +伪分布式只谈部署
    3.0.3玩不好,现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0,rm掉3.0.32.在etcp ... [详细]
  •        在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下:       1、CentOS6.7下安装JDK,地址:http:b ... [详细]
  • 前言折腾了一段时间hadoop的部署管理,写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动,我已经把部署的步骤写成脚本,各位只需要按着本文把脚本执行完,整个环境基本就部署 ... [详细]
  • bat大牛带你深度剖析android 十大开源框架_请收好!5大领域,21个必知的机器学习开源工具...
    全文共3744字,预计学习时长7分钟本文将介绍21个你可能没使用过的机器学习开源工具。每个开源工具都为数据科学家处理数据库提供了不同角度。本文将重点介绍五种机器学习的 ... [详细]
author-avatar
此女人不嫁_
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有