Для задач моей карты требуются некоторые данные конфигурации, которые я хотел бы распространять через распределенный кэш.
Hadoop MapReduce Tutorial показывает использование класса DistributedCache примерно следующим образом:
// In the driver
JobConf conf = new JobConf(getConf(), WordCount.class);
...
DistributedCache.addCacheFile(new Path(filename).toUri(), conf);
// In the mapper
Path[] myCacheFiles = DistributedCache.getLocalCacheFiles(job);
...
Однако DistributedCache
отмечен как устаревший в Hadoop 2.2.0.
Какой новый предпочтительный способ достичь этого? Есть ли современный пример или учебник, охватывающий этот API?