Я пытаюсь включить пакет python (NLTK) с потоковым заданием Hadoop, но я не уверен, как это сделать без включения каждого файла вручную через аргумент CLI, "файл".
Изменить: одним из решений будет установка этого пакета на всех подчиненных устройствах, но в настоящее время у меня нет этой опции.