Я проверил hadoop и mapreduce с cloudera, и я нашел это довольно круто, я думал, что я был самым последним и актуальным решением BigData. Но несколько дней назад я нашел это: https://spark.incubator.apache.org/
A "Быстродействующая кластерная вычислительная система", способная работать на вершине кластера Hadoop и, по-видимому, способная раздавить mapreduce. Я видел, что он работал больше в RAM, чем в mapreduce. Я думаю, что mapreduce по-прежнему актуально, когда вам приходится выполнять кластерные вычисления, чтобы преодолеть проблемы ввода-вывода, которые могут возникнуть на одной машине. Но поскольку Spark может выполнять задания, которые делают mapreduce, и может быть более эффективным для нескольких операций, разве это не конец MapReduce? Или есть что-то большее, что может сделать MapReduce, или может MapReduce быть более эффективным, чем Spark в определенном контексте?