Мы сортируем файл объемом 5 ГБ с 37 полями и сортируем его по 5 клавишам. Большой файл состоит из 1000 файлов по 5 МБ каждый.
Через 190 минут все еще не закончилось.
Мне интересно, есть ли другие способы ускорить сортировку. Мы выбираем unix-сортировку, потому что мы не хотим, чтобы она использовала всю память, поэтому любой подход на основе памяти не подходит.
В чем преимущество сортировки каждого файла независимо, а затем использовать параметр -m для его сортировки?