Hadoop任务可以在单个节点上并行运行

 tanhuixi135_414 发布于 2023-01-20 13:23

我是hadoop的新手,我也有同样的问题.

这就是我在hadoop中所理解的.

1)当在hadoop中写入任何文件时,它以块的形式存储在所有数据节点上(默认为64MB)

2)当我们运行MR作业时,将从该块创建拆分,并在每个数据节点上处理拆分.

3)从每个拆分记录读取器将用于在映射器侧生成键/值对.

问题:

1)一个数据节点一次可以处理多个拆分吗?如果数据节点容量更大怎么办?

我认为这是MR1的限制,而MR2 YARN我们有更好的资源利用率.

2)是否会在数据节点以串行方式读取拆分,还是可以并行处理以生成键/值对?[通过随机访问数据节点拆分中的磁盘位置]

3)map/reduce架构中的'slot'术语是什么?我正在阅读其中一篇博客,并表示YARN将在Datanode中提供更好的插槽利用率.

撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有