Если у вас есть 1000 0000 исходных файлов, вы подозреваете, что они все одинаковые, и вы хотите сравнить их с текущим методом fasted для сравнения этих файлов? Предположим, что они являются файлами Java и платформой, где сравнение сделано не важно. cksum заставляет меня плакать. Когда я имею в виду тождественное, я имею в виду ВСЕ идентичные.
Обновление: Я знаю о создании контрольных сумм. diff смешно... Я хочу скорость.
Обновление: Не зацикливайтесь на том, что они являются исходными файлами. Притвориться, например, вы взяли миллион прогонов программы с очень регулируемым выходом. Вы хотите доказать, что все 1 000 000 версий выпуска одинаковы.
Обновить: прочитать количество блоков, а не байтов? Немедленно выбросить их? Это быстрее, чем поиск количества байтов?
Обновление: Является ли это ЛЮБОЙ, чем самый быстрый способ сравнить два файла?