Подтвердить что ты не робот

Java/zip: Почему файлы .jar не детерминированы?

Я никогда не рассматривал это, но теперь понял, что я не могу легко создать два одинаковых файла .jar.

Я имею в виду, если я строю дважды, не меняя ничего, я получаю тот же размер, но разные контрольные суммы для .jar.

Итак, я быстро проверил некоторый тест (в основном распаковывая, сортируя -n -k 5'ing, а затем diff'ing), чтобы увидеть, что все файлы внутри .jar были одинаковыми, но .jar были разными.

Итак, я сделал тест с простым .zip файлом и нашел это:

... $ zip 1.zip a.txt
... $ zip 2.zip a.txt
... $ ls -l ?.zip
-rw-rw-r-- 1 webinator webinator 147 2010-07-21 13:09 1.zip
-rw-rw-r-- 1 webinator webinator 147 2010-07-21 13:09 2.zip

(точный размер файла .zip)

... $ sha1sum ?.zip
db99f6ad5733c25c0ef1695ac3ca3baf5d5245cf  1.zip
eaf9f0f92eb2ac3e6ac33b44ef45b170f7984a91  2.zip

(разные суммы SHA-1, посмотрим, почему)

$ hexdump 1.zip -C > 1.txt

$ hexdump 2.zip -C > 2.txt

$ diff 1.txt 2.txt 
3c3
< 00000020  74 78 74 55 54 09 00 03  ab d4 46 4c*4e*d5 46 4c  |txtUT.....FLN.FL|
---
> 00000020  74 78 74 55 54 09 00 03  ab d4 46 4c*5d*d5 46 4c  |txtUT.....FL].FL|

Распаковка обоих zip файлов, безусловно, возвращает наш уникальный файл.

Вопрос: почему? (Я отвечу сам)

4b9b3361

Ответ 1

(Отвечает самому себе) Это связано с тем, что формат .zip файла сохраняет время создания и модификации в своих заголовках.

Если вы действительно хотите создать два одинаковых .zip(или .jar), вы должны заставить второго полагать, что он был создан/изменен точно в то же время, что и первый.