Я искал ответ на этот вопрос, но мне кажется, что я могу найти программное обеспечение, которое сделает это за вас. Кто-нибудь знает, как это сделать в python?
Извлеките хэш SHA1 из файла torrent
Ответ 1
Я написал фрагмент кода на основе python, который проверяет хеши загруженных файлов на то, что в .torrent файле. Предполагая, что вы хотите проверить загрузку для коррупции, вы можете найти это полезным.
Для использования этого пакета bencode. Bencode - это формат сериализации, используемый в файлах .torrent. Он может сортировать списки, словари, строки и номера, похожие на JSON.
Код принимает хеши, содержащиеся в строке info['pieces']
:
torrent_file = open(sys.argv[1], "rb")
metainfo = bencode.bdecode(torrent_file.read())
info = metainfo['info']
pieces = StringIO.StringIO(info['pieces'])
Эта строка содержит последовательность 20 байтовых хэшей (по одной для каждой части). Затем эти хэши сравниваются с хешем фрагментов файлов (-ов) на диске.
Единственная сложная часть этого кода - обработка многофайловых торрентов, потому что одна часть торрента может охватывать более одного файла (внутренне BitTorrent рассматривает загрузку нескольких файлов как один непрерывный файл). Я использую функцию генератора pieces_generator()
, чтобы отвлечь ее.
Вы можете прочитать спецификацию BitTorrent, чтобы понять это более подробно.
Полный текст ниже:
import sys, os, hashlib, StringIO, bencode
def pieces_generator(info):
"""Yield pieces from download file(s)."""
piece_length = info['piece length']
if 'files' in info: # yield pieces from a multi-file torrent
piece = ""
for file_info in info['files']:
path = os.sep.join([info['name']] + file_info['path'])
print path
sfile = open(path.decode('UTF-8'), "rb")
while True:
piece += sfile.read(piece_length-len(piece))
if len(piece) != piece_length:
sfile.close()
break
yield piece
piece = ""
if piece != "":
yield piece
else: # yield pieces from a single file torrent
path = info['name']
print path
sfile = open(path.decode('UTF-8'), "rb")
while True:
piece = sfile.read(piece_length)
if not piece:
sfile.close()
return
yield piece
def corruption_failure():
"""Display error message and exit"""
print("download corrupted")
exit(1)
def main():
# Open torrent file
torrent_file = open(sys.argv[1], "rb")
metainfo = bencode.bdecode(torrent_file.read())
info = metainfo['info']
pieces = StringIO.StringIO(info['pieces'])
# Iterate through pieces
for piece in pieces_generator(info):
# Compare piece hash with expected hash
piece_hash = hashlib.sha1(piece).digest()
if (piece_hash != pieces.read(20)):
corruption_failure()
# ensure we've read all pieces
if pieces.read():
corruption_failure()
if __name__ == "__main__":
main()
Ответ 2
Вот как я извлек значение HASH из торрент файла:
#!/usr/bin/python
import sys, os, hashlib, StringIO
import bencode
def main():
# Open torrent file
torrent_file = open(sys.argv[1], "rb")
metainfo = bencode.bdecode(torrent_file.read())
info = metainfo['info']
print hashlib.sha1(bencode.bencode(info)).hexdigest()
if __name__ == "__main__":
main()
Это то же самое, что и выполняемая команда:
transmissioncli -i test.torrent 2>/dev/null | grep "^hash:" | awk '{print $2}'
Надеюсь, это помогает:)
Ответ 3
В соответствии с this, вы должны найти md5sums файлов, выполнив поиск части данных, которая выглядит следующим образом:
d[...]6:md5sum32:[hash is here][...]e
(SHA не входит в спецификацию)