热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

HADOOP的数据流

HDFS在InputFormat(将data转换为)等支持下,将数据块传入MAPPER中,MAPPER输出到

  HDFS在InputFormat(将data转换为)等支持下,将数据块传入MAPPER中,MAPPER输出到内存,如果发生spill则存入本地文件, 形成较大文件region(可能有combine发生)。之后的去向分为两种,一种是本机有reduce,则加入到reduce的内存中;另外一种是远程复制到别的机器上的reduce中。经过merge和sort, 由reduce处理,并将数据写会HDFS。

转:https://www.cnblogs.com/craig-yilia/p/5029358.html



推荐阅读
author-avatar
a5365258784
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有