MapReduce笔记 发表于 2016-10-24 更新于 2024-11-30 分类于 hadoop 本文字数: 117 阅读时长 ≈ 1 分钟 MapReduce运行过程个人理解整个过程是先对数据分片(这个过程还未读取真正数据),将数据划分到多个map,一个job可以包含多个map,MapReduce框架将多个job发送到多个节点上执行,每个job中map读取自己分片数据,然后根据业务代码过滤,再根据map输出进行reduce操作,最后将生成结果输出到一个目录中。