Я пишу функцию фильтра для сложного набора данных JSON с множеством внутренних структур. Передача отдельных столбцов слишком громоздка.
Итак, я объявил следующий UDF:
val records:DataFrame = = sqlContext.jsonFile("...")
def myFilterFunction(r:Row):Boolean=???
sqlc.udf.register("myFilter", (r:Row)=>myFilterFunction(r))
Интуитивно я думаю, что он будет работать следующим образом:
records.filter("myFilter(*)=true")
Каков фактический синтаксис?