Я пытаюсь создать контрольную сумму двоичного файла (flv/f4v и т.д.), чтобы проверить содержимое файла между сервером и клиентскими компьютерами. Приложение, работающее на клиентском компьютере, основано на python, а сервер использует PHP.
PHP-код выглядит следующим образом:
$fh = fopen($filepath, 'rb');
$contents = fread($fh, filesize($filepath));
$checksum = md5(base64_encode($contents));
fclose($fh);
Код Python выглядит следующим образом:
def _get_md5(filepath):
fh = open(filepath, 'rb')
md5 = hashlib.md5()
md5.update(f.read().encode('base64'))
checksum = md5.hexdigest()
f.close()
return checksum
в конкретном файле, который я тестирую, строки хэша PHP и Python md5 следующие:
cfad0d835eb88e5342e843402cc42764
0a96e9cc3bb0354d783dfcb729248ce0
Сервер работает CentOS, а клиент - среда MacOSX. Я был бы очень признателен за любую помощь в понимании того, почему эти два генерируют разные результаты хеширования, или если что-то я упускаю из виду (я относительно новичок в Python...). Спасибо!
[post mortem: проблема была в конечном счете различием между классами кодирования Python и PHP base64. MD5 работает одинаково между двумя платформами сценариев (по крайней мере, используя .hexdigest() в Python).]