Подтвердить что ты не робот

Извлеките хэш SHA1 из файла torrent

Я искал ответ на этот вопрос, но мне кажется, что я могу найти программное обеспечение, которое сделает это за вас. Кто-нибудь знает, как это сделать в python?

4b9b3361

Ответ 1

Я написал фрагмент кода на основе python, который проверяет хеши загруженных файлов на то, что в .torrent файле. Предполагая, что вы хотите проверить загрузку для коррупции, вы можете найти это полезным.

Для использования этого пакета bencode. Bencode - это формат сериализации, используемый в файлах .torrent. Он может сортировать списки, словари, строки и номера, похожие на JSON.

Код принимает хеши, содержащиеся в строке info['pieces']:

torrent_file = open(sys.argv[1], "rb")
metainfo = bencode.bdecode(torrent_file.read())
info = metainfo['info']
pieces = StringIO.StringIO(info['pieces'])

Эта строка содержит последовательность 20 байтовых хэшей (по одной для каждой части). Затем эти хэши сравниваются с хешем фрагментов файлов (-ов) на диске.

Единственная сложная часть этого кода - обработка многофайловых торрентов, потому что одна часть торрента может охватывать более одного файла (внутренне BitTorrent рассматривает загрузку нескольких файлов как один непрерывный файл). Я использую функцию генератора pieces_generator(), чтобы отвлечь ее.

Вы можете прочитать спецификацию BitTorrent, чтобы понять это более подробно.

Полный текст ниже:

import sys, os, hashlib, StringIO, bencode

def pieces_generator(info):
    """Yield pieces from download file(s)."""
    piece_length = info['piece length']
    if 'files' in info: # yield pieces from a multi-file torrent
        piece = ""
        for file_info in info['files']:
            path = os.sep.join([info['name']] + file_info['path'])
            print path
            sfile = open(path.decode('UTF-8'), "rb")
            while True:
                piece += sfile.read(piece_length-len(piece))
                if len(piece) != piece_length:
                    sfile.close()
                    break
                yield piece
                piece = ""
        if piece != "":
            yield piece
    else: # yield pieces from a single file torrent
        path = info['name']
        print path
        sfile = open(path.decode('UTF-8'), "rb")
        while True:
            piece = sfile.read(piece_length)
            if not piece:
                sfile.close()
                return
            yield piece

def corruption_failure():
    """Display error message and exit"""
    print("download corrupted")
    exit(1)

def main():
    # Open torrent file
    torrent_file = open(sys.argv[1], "rb")
    metainfo = bencode.bdecode(torrent_file.read())
    info = metainfo['info']
    pieces = StringIO.StringIO(info['pieces'])
    # Iterate through pieces
    for piece in pieces_generator(info):
        # Compare piece hash with expected hash
        piece_hash = hashlib.sha1(piece).digest()
        if (piece_hash != pieces.read(20)):
            corruption_failure()
    # ensure we've read all pieces 
    if pieces.read():
        corruption_failure()

if __name__ == "__main__":
    main()

Ответ 2

Вот как я извлек значение HASH из торрент файла:

#!/usr/bin/python

import sys, os, hashlib, StringIO
import bencode



def main():
    # Open torrent file
    torrent_file = open(sys.argv[1], "rb")
    metainfo = bencode.bdecode(torrent_file.read())
    info = metainfo['info']
    print hashlib.sha1(bencode.bencode(info)).hexdigest()    

if __name__ == "__main__":
    main()

Это то же самое, что и выполняемая команда:

transmissioncli -i test.torrent 2>/dev/null | grep "^hash:" | awk '{print $2}'

Надеюсь, это помогает:)

Ответ 3

В соответствии с this, вы должны найти md5sums файлов, выполнив поиск части данных, которая выглядит следующим образом:

d[...]6:md5sum32:[hash is here][...]e

(SHA не входит в спецификацию)