在Spark Standalone模式下,有主节点和工作节点.
这里有几个问题:
2工作者实例是否意味着一个工作节点有2个工作进程?
每个工作实例是否为特定应用程序(管理存储,任务)或一个工作节点拥有一个执行程序的执行程序?
是否有流程图解释了如何计算spark运行时间?
Sean Owen.. 51
我建议首先阅读Spark集群文档,但更重要的是这个Cloudera博客文章解释了这些模式.
您的第一个问题取决于"实例"的含义.节点是一台机器,并没有充分的理由为每台机器运行多个工作程序.因此,两个工作节点通常意味着两台机器,每台机器都是Spark工作
对于许多应用,工人拥有许多执行者.一个应用程序在许多工作者上有执行者.
你的第三个问题不明确.