Можно ли передать дополнительные аргументы функции отображения в pySpark? В частности, у меня есть следующий рецепт кода:
raw_data_rdd = sc.textFile("data.json", use_unicode=True)
json_data_rdd = raw_data_rdd.map(lambda line: json.loads(line))
mapped_rdd = json_data_rdd.flatMap(processDataLine)
Функция processDataLine
принимает дополнительные аргументы в дополнение к объекту JSON, как:
def processDataLine(dataline, arg1, arg2)
Как передать дополнительные аргументы arg1
и arg2
в функцию flaMap
?