本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系
MapReduce 来源于 Google 2004 年发布的论文,它是一个编程模型,用以进行大数据量的计算。
对于大数据量的计算,通常采用的处理方式就是并行计算。
但对许多开发者来说,自己完完全全实现一个并行计算程序难度太大,而 MapReduce 就是一种简化并行计算的编程模型,它使得那些没有多少并行计算经验的开发人员也可以开发并行应用程序。
这也是 MapReduce 的价值所在,通过简化编程模型,降低了开发并行应用程序的入门门槛。
MapReduce 中的 Map 代表了并行计算,Reduce 代表了聚合分析。
Apache Hadoop MapReduce 是 Doug Cutting 基于 Google 的 MapReduce 论文而开发的分布式计算框架。
诸多 Hadoop 生态体系中的技术框架比如 Hive,Flume,Sqoop,Azkaban 等底层计算引擎都是使用的Apache Hadoop MapReduce。
本文发布于:2024-01-31 23:40:08,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170671560832235.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |