MapReduce笔记

发表于 2016-10-24 更新于 2026-06-10 分类于 hadoop 本文字数： 117 阅读时长 ≈ 1 分钟

MapReduce运行过程

个人理解整个过程是先对数据分片（这个过程还未读取真正数据），将数据划分到多个map,一个job可以包含多个map,MapReduce框架将多个job发送到多个节点上执行，每个job中map读取自己分片数据，然后根据业务代码过滤，再根据map输出进行reduce操作，最后将生成结果输出到一个目录中。