热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

开发笔记:CDH6.0.1搭建过程及所遇到的错误处理

篇首语:本文由编程笔记#小编为大家整理,主要介绍了CDH6.0.1搭建过程及所遇到的错误处理相关的知识,希望对你有一定的参考价值。一、集群服务器配置说明(

篇首语:本文由编程笔记#小编为大家整理,主要介绍了CDH6.0.1 搭建过程及所遇到的错误处理相关的知识,希望对你有一定的参考价值。



一、集群服务器配置说明(整个过程中我会提前把一些小坑填上,有的坑后面没有提到
















































IP 节点名OSCoresMemoryDiskRemark
172.25.16.1cdh1CentOS7.5401284Tcloudera Server、cloudera agent
172.25.16.2cdh2CentOS7.546440Tcloudera agent
172.25.16.3cdh3CentOS7.546440Tcloudera agent
172.25.16.4cdh4CentOS7.546440Tccloudera agen

 

 

 

 

 

注1:这里主机名尽量小写,后面配置主机是会出警告


二、CDH6.0.1配套软件配置

  •        JDK1.8.0_131

  •         mysql5.7
















































































name


版本


来源


CM


6.0.1


https://archive.cloudera.com/cm6/6.0.1/


CDH


6.0.1


https://archive.cloudera.com/cdh6/6.0.1/parcels/


hadoop


3.0.0-cdh6.0.1


cdh自带包


hive


2.1.1-cdh6.0.1


cdh自带包


hbase


2.0.0-cdh6.0.1


cdh自带包


solr


7.0.0+cdh6.0.1


cdh自带包


impala


3.0.0-cdh6.0.1


cdh自带包


hue


3.9.0+cdh6.0.1


cdh自带包


sqoop


1.4.7-cdh6.0.1


cdh自带包


kafka


1.0.0-cdh6.0.1


cdh自带包


spark


2.2.0+cdh6.0.1


cdh自带包


oozie


5.0.0-beta1-cdh6.0.1


cdh自带包


kudu


1.6.0-cdh6.0.1


cdh自带包


flume-ng


flume-ng


cdh自带包


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

注意:其他组件需要单独安装部署,eg:flink,kylin,ELK等


三、基础环境配置

1、关闭防火墙[CDH1-4]


1 临时关闭防火墙
2
3 # systemctl stop firewalld
4
5 永久防火墙开机自启动
6
7 # systemctl disable firewalld
8
9 查看防火墙状态
10
11 # systemctl status firewalld

 


2、selinux关闭[CDH1-4]


1 # vim /etc/sysconfig/selinux SELINUX=disabled
2
3 重启机器,命令:
4
5 # reboot
6
7 重启后检查:
8
9 # sestatus –v

 


3、配置各节点之间ssh免密登录[CDH1-4]


1 1. CentOS默认没有启动ssh无密登录,
2
3 # vim /etc/ssh/sshd_config
4
5 2、去掉其中3行的注释,每台服务器都要配置
6
7 开启 RSAAuthentication yes
8
9 开启 PubkeyAuthentication yes
10
11 开启 AuthorizedKeyFile .ssh/authorized_keys
12
13 # ssh-keygen -t rsa 一直按回车
14
15 # ls /root/.ssh/ id_rsa 和 id_rsa.pub # cp id_rsa.pub authorized_keys 两个woker节点执行
16
17 # cat ~/.ssh/authorized_keys | ssh root@172.20.32.1 cat >> ~/.ssh/authorized_keys
18
19 3、CDH1上执行
20
21 # scp authorized_keys root@172.20.32.2:/root/.ssh/
22
23 # scp authorized_keys root@172.20.32.3:/root/.ssh/
24
25 # scp known_hosts root@172.20.32.2:/root/.ssh/
26
27 # scp known_hosts root@172.20.32.3:/root/.ssh/
28
29 4、CDH2-4执行
30
31 # chmod 700 ~/.ssh
32
33 # chmod 600 ~/.ssh/authorized_keys
34
35 5、重启ssh服务
36
37 # systemctl restart sshd.service
38
39 6、验证能否无密码ssh,在master服务器上执行操作
40
41 # ssh cdh1
42
43 7、不同用户之间退出
44
45 # logout

 


4、hostname config[master,slave1-3]


1 master上执行
2
3 # vim /etc/hosts
4
5 172.25.16.1 cdh1
6
7 172.25.16.2 slave1
8
9 172.25.16.3 slave2
10
11 172.25.16.4 slave3
12
13 通过scp 发送给其他机器
14
15 # for i in 2 3 4 ;do scp /etc/hosts $cdh$i:/etc ;done

 

 


5、NTP服务器设置[CDH1-4]

自行配置或看我博客NTP配置文章


6、安装jdk[CDH1-4]


1 方法一:自行安装
2
3 1.下载“jdk-8u131-linux-x64.tar.gz”,放到/usr/java/目录下
4
5 2.解压 # tar -xzvf jdk-8u131-linux-x64.tar.gz
6
7 3.在任何目录下均可编辑
8
9 # vim /etc/profile.d/java_home.sh
10
11 export JAVA_HOME=/usr/java/jdk1.8.0_141
12
13 export JRE_HOME=$JAVA_HOME/jre
14
15 export PATH=$PATH:$JAVA_HOME/bin
16
17 export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib
18
19 4、刷新环境变量
20
21 # source /etc/profile
22
23 方法二:采用cdh自带jdk包
24
25 下载 对应JAVA包
26
27 wget https://archive.cloudera.com/cm6/6.0.1/redhat7/yum/RPMS/x86_64/oracle-j2sdk1.8-1.8.0+update141-1.x86_64.rpm
28
29 安装rpm包
30
31 rpm -ivh oracle-j2sdk1.8-1.8.0+update141-1.x86_64.rpm
32
33 修改环境变量
34
35 export JAVA_HOME=/usr/java/jdk1.8.0_141-cloudera export JRE_HOME=$JAVA_HOME/jre
36
37 export PATH=$PATH:$JAVA_HOME/bin export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib

 

 

注2!必须在该目录下安装JDK,后续cdh默认加载此路径的JDK**


7.优化虚拟内存需求率[cdh1-4]


1 cdh1
2
3 # cat /proc/sys/vm/swappiness
4
5 显示如下: 30
6
7 临时降低虚拟内存需求率
8
9 # sysctl vm.swappiness=0
10
11 永久降低虚拟内存需求率
12
13 # echo vm.swappiness = 0 > /etc/sysctl.d/swappiness.conf
14
15 并运行如下命令使生效
16
17 # sysctl -p
18
19 ---------------------------
20
21 CDH2-4 检查虚拟内存需求率
22
23 # cat /proc/sys/vm/swappiness
24
25 显示如下: 30 临时降低虚拟内存需求率
26
27 # sysctl vm.swappiness=10
28
29 永久降低虚拟内存需求率 # echo vm.swappiness = 10 > /etc/sysctl.d/swappiness.conf
30
31 并运行如下命令使生效
32
33 # sysctl -p

 


8. 解决透明大页面问题[cdh1-4]


1 检查透明大页面问题
2
3 # cat /sys/kernel/mm/transparent_hugepage/defrag
4
5 如果显示为: [always] madvise never
6
7 临时关闭透明大页面问题
8
9 # echo never > /sys/kernel/mm/transparent_hugepage/defrag
10
11 确认配置生效
12
13 # cat /sys/kernel/mm/transparent_hugepage/defrag
14
15 应该显示为: always madvise [never]
16
17 配置开机自动生效
18
19 # echo never > /sys/kernel/mm/transparent_hugepage/enabled

 

 


9.mysql安装[任选择一台机器]


1 下载源文件
2
3 # wget https://dev.mysql.com/get/mysql57-community-release-el7-9.noarch.rpm
4
5 安装源文件
6
7 # rpm -ivh mysql57-community-release-el7-9.noarch.rpm
8
9 安装数据库
10
11 # yum install mysql-server
12
13 启动数据库
14
15 # systemctl restart mysqld

 

 


10 、拷贝mysql-connector-java到各个节点指定目录下[cdh1-4]


1 1、下载文件
2
3 wget https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.46.tar.gz
4
5 2、解压文件
6
7 tar zxvf mysql-connector-java-5.1.46.tar.gz
8 3、创建目录
9
10 mkdir -p /usr/share/java/ cd mysql-connector-java-5.1.46
11
12 4、复制jar包
13
14 cp mysql-connector-java-5.1.46-bin.jar /usr/share/java/mysql-connector-java.jar

 


11、创建数据库[172.25.16.2]


1 mysql -u root -p
2
3 CREATE DATABASE db_cdh6_amon DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
4
5 CREATE DATABASE db_cdh6_hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
6
7 CREATE DATABASE db_cdh6_metastore DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
8
9 CREATE DATABASE db_cdh6_sentry DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
10
11 CREATE DATABASE db_cdh6_oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
12
13 CREATE DATABASE db_cdh6_hive DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
14
15 GRANT ALL ON db_cdh6_scm.* TO cdh6@% IDENTIFIED BY 123123;
16
17 GRANT ALL ON db_cdh6_amon.* TO cdh6@% IDENTIFIED BY 123123;
18
19 GRANT ALL ON db_cdh6_hue.* TO cdh6@% IDENTIFIED BY 123123;
20
21 GRANT ALL ON db_cdh6_metastore.* TO cdh6@% IDENTIFIED BY 123123;
22
23 GRANT ALL ON db_cdh6_sentry.* TO cdh6@% IDENTIFIED BY 123123;
24
25 GRANT ALL ON db_cdh6_oozie.* TO cdh6@% IDENTIFIED BY 123123;
26
27 GRANT ALL ON db_cdh6_hive.* TO cdh6@% IDENTIFIED BY 123123;
28
29 FLUSH PRIVILEGES;

 

 


四、Cloudera Manager安装

 


1、配置 Cloudera Manager 仓库CDH1-4(可以选择,也可下载rpm自行手动安装)

 


1 下载
4 wget https://archive.cloudera.com/cm6/6.0.1/redhat7/yum/RPMS/x86_64/cloudera-manager-agent-6.0.1-610811.el7.x86_64.rpm
5
6 wget https://archive.cloudera.com/cm6/6.0.1/redhat7/yum/RPMS/x86_64/cloudera-manager-daemons-6.0.1-610811.el7.x86_64.rpm
7
8 wget https://archive.cloudera.com/cm6/6.0.1/redhat7/yum/RPMS/x86_64/cloudera-manager-server-6.0.1-610811.el7.x86_64.rpm

 

 


2.安装 CM Server 和 Agent

 


1 1、安装依赖
4 yum -y install bind-utils redhat-lsb psmisc cyrus-sasl-plain cyrus-sasl-gssapi portmap httpd mod_ssl openssl-devel python-psycopg2 MySQL-python
7 2、cdh1安装:
9
10 [root@cdh1~]# yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server
12
13 3、cdh2-4安装:
14
15 [root@cdh2~]# yum install cloudera-manager-daemons cloudera-manager-agent
16
17 [root@cdh3 ~]# yum install cloudera-manager-daemons cloudera-manager-agent
18
19 [root@cdh4 ~]# yum install cloudera-manager-daemons cloudera-manager-agent

 

 

 

 


3.设置 Cloudera Manager 数据库

 


1 mysql在本地时执行:
2
3 [root@master ~]# rm -rf //cloudera-scm-server/db.mgmt.properties
4
5 [root@master ~]# /opt/cloudera/cm/scm_prepare_database.sh mysql db_cdh6_scm -h172.25.16.206 -uroot -p123123 --scm-host 172.25.16.206 db_cdh6_scm root 123123
6
7 JAVA_HOME=/usr/java/jdk1.8.0_131-cloudera
8
9 Verifying that we can write to /etc/cloudera-scm-server
10
11 Creating SCM configuration file in /etc/cloudera-scm-server
12
13 Executing: /usr/java/jdk1.8.0_131/bin/java -cp /usr/share/java/mysql-connector-java.jar:/usr/share/java/oracle-connector-java.jar:/usr/share/java/postgresql-connector-java.jar:/opt/cloudera/cm/schema/../lib/* com.cloudera.enterprise.dbutil.DbCommandExecutor /etc/cloudera-scm-server/db.properties com.cloudera.cmf.db.
14
15 [         main] DbCommandExecutor INFO Successfully connected to database.
16
17 All done, your SCM database is configured correctly!

 

 

注3  Hive报错:


1 JDBC driver cannot be found. Unable to find the JDBC database... Validate Hive Metastore schema (70)) 已失败
2
3 <property>
4
5   <name>javax.jdo.option.ConnectionURLname>
6
7   <value>jdbc:mysql://my_cluster.com:3306/hive1?useUnicode=true&characterEncoding=UTF-8value>
8
9 property>
10
11 <property>
12
13   <name>javax.jdo.option.ConnectionDriverNamename>
14
15   <value>com.mysql.jdbc.Drivervalue>
16
17 property>

 

 

 

 


4.安装 CDH[master]

 

配置CDH的软件包 parcels(namenode01)

 

CM安装成功之后,接下来我们就可以通过CM安装CDH的方式构建企业大数据平台。所以首先需要把CDH的parcels包下载到CM主服务器上。

 


1 [root@master ~]# cd /opt/cloudera/parcel-repo
2
3 [root@master ~]# wget https://archive.cloudera.com/cdh6/6.0.1/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678-el7.parcel
4
5 [root@master ~]# wget https://archive.cloudera.com/cdh6/6.0.1/parcels/manifest.json
6
7 [root@master ~]# wget https://archive.cloudera.com/cdh6/6.0.1/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678-el7.parcel.sha256
8
9 [root@master ~]# mv CDH-6.0.1-1.cdh6.0.1.p0.590678-el7.parcel.sha256 CDH-6.0.1-1.cdh6.0.1.p0.590678-el7.parcel.sha

 

 

注意!上面最好指定ip,切勿使用hostname很容易出现问题

 

也可以执行下面的操作

 

在manifest.json文件中,找到对应版本的秘钥,复制到.sha文件中

 


1 [root@master ~]# echo "2e650f1f1ea020a3efc98a231b85c2df1a50b030" > CDH-6.0.1-1.cdh6.0.1.p0.590678-el7.parcel.sha
2
3 修改属主属组
4
5 [root@master ~]# chown cloudera-scm.cloudera-scm /opt/cloudera/parcel-repo/ *
6 启动 Cloudera Manager Server[master]
7 [root@master ~]# systemctl start cloudera-scm-server
8 如果启动中有什么问题,可以查看日志。[master]
9 [root@master ~]# tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log

 

 


五、 Cloudera浏览器配置

 


1、浏览器配置Cloudera Manager

 

浏览器打开:IP:7180

 

1)登录、

 

账号:admin

 

密码:admin

 

2)选择部署版本

 

选择免费60天测试,正式版等可以实现需求在进行选择。

 

3)勾选上需要安装的主机

 

全部勾选

 

4)部署CDH

 

可以看到所下载并安装的CDH版本表示前面部署成功,否则需要在线下载。

 

5)前面配置无误则无须下载,否则表示前面配置有误。分发可能需要一段时间,视集群大小而定(此时集群一定要保证Master可以免密码登录到其它机器上)。

 

6)检查集群状态

 

检查集群的状况,可根据提示信息修改配置并重新检查。

 

a、cdh 托管主机之间的 Java 版本不一致

 

.......

 

有些地方忘记了,自行百度一下,前边步骤对了问题不大

 

7)选择需要安装的组件,可自定义安装。 这个可以选择少点,安装好CM之后可以慢慢添加服务。

 

8)给集群各个节点分配角色,目前所知道需要注意的地方是HBase Thrift Server不要为空,否则Hue无法访问HBase。主要看hive的角色

 

9)设置mysql连接。

 

注意: 这里很容易报错,都是表权限、名称、密码的错误。

 

10)下一步

 

后面的一路“继续”下去即可。安装所需时间较长,请耐心等待。

 

 后续服务自行安装

 


错误集锦:

 

检查主机正确性:

 

从CDH 6开始,PostgreSQL支持的Hue要求Psycopg2版本至少为2.5.4,有关更多信息,请参见文章。以下主机缺少Psycopg2库的兼容版本

 

安装Psycopg2

 

pip3 install psycopg2==2.5.4

 

没有PIP3 自行安装 python

 

Hive错误,connector连接错误

 

cp -r mysql-connector-java-5.1.41.jar /usr/share/java/mysql-connector-java.jar

 

Cloudera 建议将 /proc/sys/vm/swappiness 设置为 0。当前设置为 60。

 

sysctl vm.swappiness=0 echo 0 > /proc/sys/vm/swappiness echo never > /sys/kernel/mm/transparent_hugepage/defrag echo never > /sys/kernel/mm/transparent_hugepage/enabled

 

 

 

Exception in thread "main" java.lang.AbstractMethodError: com.mysql.jdbc.JDBC4Connection.getSchema()Ljava/lang/String;

 

解决:

 


1 wget https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.46.tar.gz
2
3 tar zxvf mysql-connector-java-5.1.46.tar.gz
4
5 mkdir -p /usr/share/java/ cd mysql-connector-java-5.1.46
6
7 cp mysql-connector-java-5.1.46-bin.jar /usr/share/java/mysql-connector-java.jar

 

 

 有问题留言!!!!

 

 

 

 

 

 

 

 

技术图片

 


推荐阅读
  • 马蜂窝数据总监分享:从数仓到数据中台,大数据演进技术选型最优解
    大家好,今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数 ... [详细]
  • 怎么快速学好大数据开发?
    新如何学习大数据技术?大数据怎么入门?怎么做大数据分析?数据科学需要学习那些技术?大数据的应用前景等等问题,已成为热门大数据领域热门问题,以下是对新手如何学习大数据技术问题的解答! ... [详细]
  • MySQL数据 实时同步到KafkaBinlog canal、Maxwell、Kafka Connect 实现MySQL增量同步
    一、需求分析早期业务借助Sqoop将Mysql中的数据同步到Hive、hdfs来进行数据分析,使用过程中也带来了一些问题:虽然Sqoop支持增量同步但还属于粗粒度的离线同步,无法满 ... [详细]
  • hadoop常用操作命令https:www.cnblogs.comcerofangp10460494.htmlday3_day6https:www.cnblogs.comcerof ... [详细]
  • 本文介绍了在Linux下安装和配置Kafka的方法,包括安装JDK、下载和解压Kafka、配置Kafka的参数,以及配置Kafka的日志目录、服务器IP和日志存放路径等。同时还提供了单机配置部署的方法和zookeeper地址和端口的配置。通过实操成功的案例,帮助读者快速完成Kafka的安装和配置。 ... [详细]
  • CEPH LIO iSCSI Gateway及其使用参考文档
    本文介绍了CEPH LIO iSCSI Gateway以及使用该网关的参考文档,包括Ceph Block Device、CEPH ISCSI GATEWAY、USING AN ISCSI GATEWAY等。同时提供了多个参考链接,详细介绍了CEPH LIO iSCSI Gateway的配置和使用方法。 ... [详细]
  • centos安装Mysql的方法及步骤详解
    本文介绍了centos安装Mysql的两种方式:rpm方式和绿色方式安装,详细介绍了安装所需的软件包以及安装过程中的注意事项,包括检查是否安装成功的方法。通过本文,读者可以了解到在centos系统上如何正确安装Mysql。 ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • Kylin 单节点安装
    软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]
  • 不会搭建大数据平台,我被老板优化了...
    不会,搭建,大数,据,平台,我 ... [详细]
  • 数据仓库中基本概念
    一、数据仓库数据仓库(DataWarehouse)是一个面向主题的、集成的、稳定的且随时间变化的数据集合,用于支持管理人员的决策面向主题主题就是类型的意思。传统数 ... [详细]
  • 【数据结构与算法】——快速排序
    Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,O ... [详细]
  • 架构升级给DolphScheduler带来2~3倍性能提升
     引言大数据任务调度作为大数据建设中的核心基础设施,在经过社区用户们长期的使用中,不少用户对调度也提出了很多新的要求,为此,ApacheDolphinScheduler(Incub ... [详细]
  • 大数据开发笔记(一):HDFS介绍
    ✨大数据开发笔记推荐:大数据开发面试知识点总结_GoAI的博客-CSDN博客_大数据开发面试​本文详细介绍大数据hadoop生态圈各部分知识,包括不限 ... [详细]
  • 阅读目录一、Hadoop简介二、Hadoop的特性三、hadoop组成与体系结构四、Hadoop安装方式五、Hadoop集群中的节点类型一、Hadoop简介Hadoop是Apac ... [详细]
author-avatar
殷小苗_535
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有