Как вы можете писать на несколько выходов в зависимости от ключа, используя Spark в одном задании.
Связано: пишите на несколько выходов с помощью ключа Scalding Hadoop, один MapReduce Job
Например
sc.makeRDD(Seq((1, "a"), (1, "b"), (2, "c")))
.writeAsMultiple(prefix, compressionCodecOption)
будет гарантировать, что cat prefix/1
a
b
и cat prefix/2
будут
c
Ответ
Для точного ответа с полным импортом, сутенером и кодеком сжатия, см. qaru.site/info/112819/...