Подтвердить что ты не робот

Как фильтровать строки на основе того, является ли значение столбца в наборе строк в Spark DataFrame

Существует ли более элегантный способ фильтрации на основе значений в наборе строк?

def myFilter(actions: Set[String], myDF: DataFrame): DataFrame = {
  val containsAction = udf((action: String) => {
    actions.contains(action)
  })

  myDF.filter(containsAction('action))
}

В SQL вы можете сделать

select * from myTable where action in ('action1', 'action2', 'action3')
4b9b3361