当前位置: 开发笔记 > 运维 > 正文

在DockerSwarm上部署Spark和HDFS不会启用数据局部性

作者：加乘ACCA财务英语教室_438 | 来源：互联网 | 2022-10-10 07:40

如何解决《在DockerSwarm上部署Spark和HDFS不会启用数据局部性》经验，需要怎么解决？

我正在尝试使用Docker Swarm作为堆栈部署在小型集群上设置Spark + HDFS部署。我可以正常使用它，但是遇到了一个问题，该问题阻止了Spark利用数据局部性。

为了启用数据局部性，我在每个服务器上都制作了一个单一的“工作节点”容器，该容器同时包含Spark工作程序和HDFS数据节点。这里的想法是，由于它们在同一容器中运行，因此它们在堆栈的覆盖网络上都应具有相同的IP地址。但是，他们没有。看来容器在覆盖网络上获得了一个VIP，而堆栈使用的撰写文件中定义的服务获得了另一个VIP。

事实证明，HDFS datanode进程绑定到容器VIP，Spark worker进程绑定到服务的VIP（据我所能确定）。结果，Spark不知道Spark工作者和HDFS数据节点实际上是在同一台计算机上，仅调度具有ANY局部性的任务。

我确定我缺少什么，但是我（当然）不知道什么。

我用于定义每个工作程序节点服务的Docker堆栈组合文件条目如下所示：

version: '3.4'
services:

    ...

    worker-node2:
        image: master:5000/spark-hdfs-node:latest
        hostname: "worker-node2"
        networks:
            - cluster_network
        environment:
            - SPARK_PUBLIC_DNS=10.1.1.1
            - SPARK_LOG_DIR=/data/spark/logs
        depends_on:
            - hdfs-namenode
        volumes:
            - type: bind
              source: /mnt/data/hdfs
              target: /data/hdfs
            - type: bind
              source: /mnt/data/spark
              target: /data/spark
        deploy:
            mode: replicated
            replicas: 1
            placement:
                constraints:
                    - node.hostname == slave1
            resources:
               limits:
                   memory: 56g

    ...

networks:
    cluster_network:
        attachable: true
        ipam:
            driver: default
            config:
                - subnet: 10.20.30.0/24

Hadoop HDFS-site.xml配置如下所示：




    
        dfs.datanode.data.dir
        /data/hdfs/datanode
    
    
        dfs.namenode.name.dir
        /data/hdfs/namenode
    
    
        dfs.replication
        2
        The default replication factor of files on HDFS
    
    
        dfs.webhdfs.enabled
        true
    
     
        dfs.block.size
        64m
        The default block size in bytes of data saved to HDFS
    
    
        dfs.namenode.datanode.registration.ip-hostname-check
        false
    
    
        dfs.client.use.datanode.hostname
        true
    
    
        dfs.datanode.use.datanode.hostname
        true
    

    
        dfs.namenode.rpc-bind-host
        0.0.0.0
        
            controls what IP address the NameNode binds to. 
            0.0.0.0 means all available.
        
    
    
        dfs.namenode.servicerpc-bind-host
        0.0.0.0
        
            controls what IP address the NameNode binds to. 
            0.0.0.0 means all available.
        
    
    
        dfs.namenode.http-bind-host
        0.0.0.0
        
            controls what IP address the NameNode binds to. 
            0.0.0.0 means all available.
        
    
    
        dfs.namenode.https-bind-host
        0.0.0.0
        
            controls what IP address the NameNode binds to. 
            0.0.0.0 means all available.

我的完整设置可以在GitHub上查看。

有谁知道我在做什么错，这是防止同一个Docker容器中的Spark worker和HDFS datanode进程绑定到相同的IP地址吗？

推荐阅读

apache
hadoop学习；block数据块；mapreduce实现样例；UnsupportedClassVersionError异常；关联项目源代码...

对于开源的东东，尤其是刚出来不久，我认为最好的学习方式就是能够看源代码和doc，測试它的样例为了方便查看源代码，关联导入源代 ... [详细]

蜡笔小新 2023-10-17 09:49:38
service
Hadoop2.6.0 + 云centos +伪分布式只谈部署

3.0.3玩不好，现将2.6.0tar.gz上传到usr,chmod-Rhadoop:hadophadoop-2.6.0，rm掉3.0.32.在etcp ... [详细]

蜡笔小新 2023-10-17 19:28:24
服务器
MR程序的几种提交运行模式

MR程序的几种提交运行模式本地模型运行1在windows的eclipse里面直接运行main方法，就会将job提交给本地执行器localjobrunner执行-- ... [详细]

蜡笔小新 2023-10-16 18:29:26
ubuntu
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42
server
Hyperledger Fabric外部链码构建与运行的开发笔记

本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识，包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性，外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍，读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行，并且不再受限于特定的语言和部署环境。 ... [详细]

蜡笔小新 2023-12-13 21:47:39
service
windows部署hadoop2.7.0

这里使用自己编译的hadoop-2.7.0版本部署在windows上，记得几年前，部署hadoop需要借助于cygwin，还需要开启ssh服务，最近发现，原来不需要借助cy ... [详细]

蜡笔小新 2023-10-17 21:04:04
apache
ZooKeeper 学习

前言相信大家对ZooKeeper应该不算陌生。但是你真的了解ZooKeeper是个什么东西吗？如果别人面试官让你给他讲讲ZooKeeper是个什么东西， ... [详细]

蜡笔小新 2023-10-17 17:07:40
apache
Maven构建Hadoop,

Maven构建Hadoop工程阅读目录序Maven安装构建示例下载系列索引序　　上一篇，我们编写了第一个MapReduce，并且成功的运行了Job，Hadoop1.x是通过ant ... [详细]

蜡笔小新 2023-10-17 16:11:18
服务器
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
apache
Hadoop源码解析1Hadoop工程包架构解析

1 Hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster：ht ... [详细]

蜡笔小新 2023-10-17 13:28:20
apache
mapreduce源码分析总结

这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型，它最初是由Google工程师设计并实现的ÿ ... [详细]

蜡笔小新 2023-10-17 12:36:35
server
Hadoop 源码学习笔记(4)Hdfs 数据读写流程分析

Hdfs的数据模型在对读写流程进行分析之前，我们需要先对Hdfs的数据模型有一个简单的认知。数据模型如上图所示，在NameNode中有一个唯一的FSDirectory类负责维护文件 ... [详细]

蜡笔小新 2023-10-17 11:27:29
apache
LVS-DR直接路由实现负载均衡示例

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2023-10-17 10:27:04
服务器
Docker下Prometheus和Grafana三部曲之一：极速体验

开源监控工具Prometheus目前广为使用，配合Grafana即可直观展现监控数据，但对于初学者来说搭建这样一个系统要花费些时间，或者有 ... [详细]

蜡笔小新 2023-10-16 19:43:53
apache
CentOS 7配置SSH远程访问及控制

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2023-10-16 18:40:50

加乘ACCA财务英语教室_438

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章