Я работаю с Hadoop, и мне нужно найти, какой из ~ 100 файлов в моей файловой системе Hadoop содержит определенную строку.
Я могу просмотреть файлы, которые я хочу найти следующим образом:
bash-3.00$ hadoop fs -ls /apps/mdhi-technology/b_dps/real-time
.., который возвращает несколько записей:
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_aa
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_ab
Как найти, какая из них содержит строку bcd4bc3e1380a56108f486a4fffbc8dc
? Как только я знаю, я могу редактировать их вручную.