Я новичок в Spark и Scala. Я был смущен тем, как функция ReduceByKey работает в Spark. Предположим, что у нас есть следующий код:
val lines = sc.textFile("data.txt")
val pairs = lines.map(s => (s, 1))
val counts = pairs.reduceByKey((a, b) => a + b)
Функция карты понятна: s - это ключ и указывает на строку из data.txt
а 1 - значение.
Тем не менее, я не понял, как reduceByKey работает внутри страны? Указывает ли "а" на ключ? В качестве альтернативы, "a" указывает на "s"? Тогда что представляет собой + b? как они заполняются?