搭建java+Hadoop集群+Scala+Spark集群

作者：xc15212 | 来源：互联网 | 2023-09-23 18:52

1、环境准备本次环境准备三台机器192.168.153.10、192.168.153.11、192.168.153.12，首先将机器的网络环境配置好。2、配置ho

1、环境准备

本次环境准备三台机器192.168.153.10、192.168.153.11、192.168.153.12，首先将机器的网络环境配置好。

2、配置hosts文件

vi /etc/hosts: 192.168.153.10 master 192.168.153.11 slave01 192.168.153.12 slave02

3、关闭SELinux和防火墙

1.关闭SELinux: vi /etc/selinux/config ，修改如下： SELINUX=disabled2. 关闭防火墙： service iptables stop chkconfig iptables off chkconfig iptables --list

4、设置SSH免密登录

1.生成密钥： ssh-keygen -t rsa（默认位于 ~/.ssh/） 2. 拷贝公钥到所有机器：（每台机器都执行一下三个命令） ssh-copy-id root@master ssh-copy-id root@slave01 ssh-copy-id root@slave02 3.测试免密登录： ssh master ssh slave01 ssh slave02

5、设置NTP时间同步

1.安装 ntp yum –y install ntp 2.设置NTP服务开机启动 chkconfig ntpd on将master设置为主服务器（在master节点操作）： 1. vi /etc/ntp.conf，内容如下： driftfile /var/lib/ntp/ntp.drift #草稿文件 # 允许内网其他机器同步时间 restrict 192.168.153.10 mask 255.255.255.0 nomodify notrap# Use public servers from the pool.ntp.org project. # 中国这边最活跃的时间服务器 : [http://www.pool.ntp.org/zone/cn](http://www.pool.ntp.org/zone/cn) server 210.72.145.44 perfer # 中国国家受时中心 server 202.112.10.36 # 1.cn.pool.ntp.org server 59.124.196.83 # 0.asia.pool.ntp.org# allow update time by the upper server # 允许上层时间服务器主动修改本机时间 restrict 210.72.145.44 nomodify notrap noquery restrict 202.112.10.36 nomodify notrap noquery restrict 59.124.196.83 nomodify notrap noquery# 外部时间服务器不可用时，以本地时间作为时间服务 server 127.127.1.0 # local clock fudge 127.127.1.0 stratum 10 2. 重启服务： service ntpd restart 3. 查看同步状态： netstat -tlunp | grep ntp设置slave到master 的同步（在slave节点操作）： 1. vi /etc/ntp.conf，内容如下： driftfile /var/lib/ntp/ntp.drift # 草稿文件statsdir /var/log/ntpstats/ statistics loopstats peerstats clockstats filegen loopstats file loopstats type day enable filegen peerstats file peerstats type day enable filegen clockstats file clockstats type day enable# 让NTP Server为内网的ntp服务器 server 192.168.153.10 fudge 192.168.153.10 stratum 5# 不允许来自公网上ipv4和ipv6客户端的访问 restrict -4 default kod notrap nomodify nopeer noquery restrict -6 default kod notrap nomodify nopeer noquery# Local users may interrogate the ntp server more closely. restrict 127.0.0.1 restrict ::1 2. 重启服务： service ntpd restart 3. 手动同步： ntpdate -u 192.168.153.10

6、软件版本号

安装路径

7、各个软件对应的环境变量配置

vi /etc/profile：export HADOOP_HOME=/root/hadoop export JAVA_HOME=/root/jdk1.8 export JRE_HOME=/root/jdk1.8/jre export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$SCALA_HOME/bin:$HADOOP_HOME/bin:$SPARK_HOME/bin export SCALA_HOME=/root/scala export SPARK_HOME=/root/spark export PATH=$SPARK_HOME/bin:$SCALA_HOME/bin:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH export HADOOP_ROOT_LOGGER=ERROR

8、hadoop相关配置文件

文件目录：/root/hadoop/etc/hadoop core-site.xml

fs.defaultFShdfs://master:9000namenode通信地址

hadoop.tmp.dir/root/data/tmp临时文件存储路径 hadoop-env.sh增加如下配置： export JAVA_HOME=/root/jdk1.8hdfs-site.xml

dfs.replication2

dfs.namenode.name.dirfile:/root/data/namenodetrue

dfs.datanode.data.dirfile:/root/data/datatrue

dfs.namenode.secondary.http-addressmaster:9001

dfs.webhdfs.enabledtrue

dfs.permissionsfalse mapred-site.xml

mapreduce.framework.nameyarn yarn-site.xml

yarn.resourcemanager.addressmaster:8040

yarn.resourcemanager.scheduler.addressmaster:8030

yarn.resourcemanager.webapp.addressmaster:8088ResourceManager对外web ui地址。用户可通过该地址在浏览器中查看集群各类信息

yarn.resourcemanager.resource-tracker.addressmaster:8025

yarn.resourcemanager.admin.addressmaster:8141

yarn.nodemanager.aux-servicesmapreduce_shuffleNodeManager上运行的附属服务。需配置成mapreduce_shuffle，才可运行MapReduce程序

yarn.nodemanager.aux-services.mapreduce.shuffle.classorg.apache.hadoop.mapred.ShuffleHandler

yarn.acl.enablefalse

yarn.admin.acl* slaves slave01 slave02从节点增加masters文件配置: master

9、spark的配置文件

目录：/root/spark/conf spark-env.sh #Java安装目录 export JAVA_HOME=/root/jdk1.8#Scala安装目录 export SCALA_HOME=/root/scala#hadoop安装目录 export HADOOP_HOME=/root/hadoop#hadoop集群的配置文件的目录 export HADOOP_CONF_DIR=/root/hadoop/etc/hadoop#spark集群的Master节点的ip地址 export SPARK_MASTER_IP=master#每个worker节点所占有的CPU核数目 export SPARK_WORKER_CORES=1#每台机器上开启的worker节点的数目 export SPARK_WORKER_INSTANCES=1#交互界面的端口号 export SPARK_MASTER_WEBUI_PORT=18080slaves文件 slave01 slave02

10、启动Hadoop集群和Spark集群

启动Hadoop集群首次运行Hadoop需要初始化HDFS文件系统：进入/root/hadoop/bin目录运行：hdfs namenode -format 进入目录：/root/hadoop/sbin 执行命令： sh start-dfs.sh sh start-yarn.sh启动spark集群进入目录：/root/spark/sbin 执行命令： sh start-all.sh在对应主机执行jps命令查看对应服务是否开启

11、Hadoop和Spark页面访问效果

Hadoop页面地址：http://192.168.153.10:50070、http://192.168.153.10:8088/

Spark页面地址：http://192.168.153.10:18080/

推荐阅读

php
在mac环境下使用nginx配置nodejs代理服务器的步骤

本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤，包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]

蜡笔小新 2023-12-13 10:34:21
php
Python高级之网络编程及TCP/IP协议簇的OSI七层模型介绍

本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容，主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]

蜡笔小新 2023-12-14 18:16:27
ip
Linux如何安装Mongodb的详细步骤和注意事项

本文介绍了Linux如何安装Mongodb的详细步骤和注意事项，同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库，适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作，能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]

蜡笔小新 2023-12-12 21:54:15
audio
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
ip
Nginx使用AWStats日志分析的步骤及注意事项

本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息，并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境，并进行DNS解析。 ... [详细]

蜡笔小新 2023-12-14 19:42:01
post
rhel5.5搭建网关+LAMP+postfix+dhcp的步骤和配置方法

本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤，并提供了相关的命令和配置示例。 ... [详细]

蜡笔小新 2023-12-14 17:13:20
ip
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
ip
计算机网络初识及通信流程分析

本文介绍了计算机网络的定义和通信流程，包括客户端编译文件、二进制转换、三层路由设备等。同时，还介绍了计算机网络中常用的关键词，如MAC地址和IP地址。 ... [详细]

蜡笔小新 2023-12-13 16:50:29
ip
如何在服务器主机上实现文件共享的方法和工具

本文介绍了在服务器主机上实现文件共享的方法和工具，包括Linux主机和Windows主机的文件传输方式，Web运维和FTP/SFTP客户端运维两种方式，以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外，还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK，以及主机迁移服务会收集的源端服务器信息。 ... [详细]

蜡笔小新 2023-12-13 13:23:48
version
ZooKeeper 学习

前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗？如果别人面试官让你给他讲讲ZooKeeper是个什么东西， ... [详细]

蜡笔小新 2023-10-17 17:07:40
java
spark登陆后闪一下就不见了，问题解决了。

这个问题困扰了我两天，卸载Dr.COM客户端（我们学校上网要装这个客户端登陆服务器，以后只能在网页里输入用户名和密码了），问题解决了。问题的现象：在实验室机台式机上安装openfire和sp ... [详细]

蜡笔小新 2023-10-17 16:47:14
java
Maven构建Hadoop,

Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引序　　上一篇，我们编写了第一个MapReduce，并且成功的运行了Job，Hadoop1.x是通过ant ... [详细]

蜡笔小新 2023-10-17 16:11:18
ip
LVS-DR直接路由实现负载均衡示例

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2023-10-17 10:27:04
ip
如何找到并终止在8080端口上运行的进程？

本文介绍了如何找到并终止在8080端口上运行的进程的方法，通过使用终端命令lsof -i :8080可以获取在该端口上运行的所有进程的输出，并使用kill命令终止指定进程的运行。 ... [详细]

蜡笔小新 2023-12-14 13:45:13
php
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06

xc15212

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章