У меня есть работа, выполняемая на моем сервере в командной строке в течение двух дней:
find data/ -name filepattern-*2009* -exec tar uf 2009.tar {} ;
Он принимает навсегда, а затем некоторые. Да, в целевом каталоге есть миллионы файлов. (Каждый файл является ничтожным 8 байтов в структуре хэшированного хэширования.) Но просто работает...
find data/ -name filepattern-*2009* -print > filesOfInterest.txt
... занимает всего два часа. По той ставке, что моя работа работает, она не будет закончена на пару недель. Это кажется необоснованным. Есть ли более эффективный способ сделать это? Возможно, с более сложным bash script?
Вторичные вопросы: "Почему мой текущий подход настолько медленный?"