Как читать один символ за раз из файла в Python?

Может ли кто-нибудь сказать мне, как я могу это сделать?

Ответ 1

with open(filename) as f:
  while True:
    c = f.read(1)
    if not c:
      print "End of file"
      break
    print "Read a character:", c

Ответ 2

сначала откройте файл:

with open("filename") as fileobj:
    for line in fileobj:  
       for ch in line: 
           print ch

Ответ 3

Мне нравится принятый ответ: он прост и выполнит эту работу. Я также хотел бы предложить альтернативную реализацию:

def chunks(filename, buffer_size=4096):
    """Reads `filename` in chunks of `buffer_size` bytes and yields each chunk
    until no more characters can be read; the last chunk will most likely have
    less than `buffer_size` bytes.

    :param str filename: Path to the file
    :param int buffer_size: Buffer size, in bytes (default is 4096)
    :return: Yields chunks of `buffer_size` size until exhausting the file
    :rtype: str

    """
    with open(filename, "rb") as fp:
        chunk = fp.read(buffer_size)
        while chunk:
            yield chunk
            chunk = fp.read(buffer_size)

def chars(filename, buffersize=4096):
    """Yields the contents of file `filename` character-by-character. Warning:
    will only work for encodings where one character is encoded as one byte.

    :param str filename: Path to the file
    :param int buffer_size: Buffer size for the underlying chunks,
    in bytes (default is 4096)
    :return: Yields the contents of `filename` character-by-character.
    :rtype: char

    """
    for chunk in chunks(filename, buffersize):
        for char in chunk:
            yield char

def main(buffersize, filenames):
    """Reads several files character by character and redirects their contents
    to `/dev/null`.

    """
    for filename in filenames:
        with open("/dev/null", "wb") as fp:
            for char in chars(filename, buffersize):
                fp.write(char)

if __name__ == "__main__":
    # Try reading several files varying the buffer size
    import sys
    buffersize = int(sys.argv[1])
    filenames  = sys.argv[2:]
    sys.exit(main(buffersize, filenames))

Код, который я предлагаю, по существу та же идея, что и ваш принятый ответ: прочитайте заданное количество байтов из файла. Разница в том, что вначале он считывает хороший фрагмент данных (4006 является хорошим стандартом для X86, но вы можете попробовать 1024 или 8192; любой кратный размер вашей страницы), а затем он дает символы в этом фрагменте одним.

Код, который я представляю, может быть быстрее для больших файлов. Возьмите, к примеру, . Это мои временные результаты (Mac Book Pro с использованием OS X 10.7.4; so.py - это имя, которое я дал на вставленный код):

$ time python so.py 1 2600.txt.utf-8
python so.py 1 2600.txt.utf-8  3.79s user 0.01s system 99% cpu 3.808 total
$ time python so.py 4096 2600.txt.utf-8
python so.py 4096 2600.txt.utf-8  1.31s user 0.01s system 99% cpu 1.318 total

Теперь: не принимайте размер буфера в 4096 как универсальную истину; посмотрите на результаты, которые я получаю для разных размеров (размер буфера (байты) и время на стене (сек)):

Как вы можете видеть, вы можете начать получать прибыль ранее (и мои тайминги, скорее всего, очень неточно); размер буфера является компромиссом между производительностью и памятью. Значение по умолчанию 4096 - это разумный выбор, но, как всегда, сначала измерьте.

Ответ 4

Сам Python может помочь вам в этом, в интерактивном режиме:

>>> help(file.read)
Help on method_descriptor:

read(...)
    read([size]) -> read at most size bytes, returned as a string.

    If the size argument is negative or omitted, read until EOF is reached.
    Notice that when in non-blocking mode, less data than what was requested
    may be returned, even if no size parameter was given.

Ответ 5

Просто:

myfile = open(filename)
onecaracter = myfile.read(1)

Ответ 6

Я изучил новую идиому для этого сегодня, наблюдая за Раймондом Хеттингером Преобразование кода в красивый, идиоматический Python:

import functools

with open(filename) as f:
    f_read_ch = functools.partial(f.read, 1)
    for ch in iter(f_read_ch, ''):
        print 'Read a character:', repr(ch)

Ответ 7

Вы должны попробовать f.read(1), который определенно правильный и правильная вещь.

Ответ 8

Просто прочитайте один символ

f.read(1)

Ответ 9

f = open('hi.txt', 'w')
f.write('0123456789abcdef')
f.close()
f = open('hej.txt', 'r')
f.seek(12)
print f.read(1) # This will read just "c"

Ответ 10

Это также будет работать:

with open("filename") as fileObj:
    for line in fileObj:  
        for ch in line:
            print(ch)

Он проходит через каждую строку в файле и каждый символ в каждой строке.

Ответ 11

Чтобы сделать дополнение, если вы читаете файл, содержащий строку vvvvery огромный, что может сломать вашу память, вы можете подумать о том, чтобы прочитать их в буфер, а затем дать каждому char

def read_char(inputfile, buffersize=10240):
    with open(inputfile, 'r') as f:
        while True:
            buf = f.read(buffersize)
            if not buf:
                break
            for char in buf:
                yield char
        yield '' #handle the scene that the file is empty

if __name__ == "__main__":
    for word in read_char('./very_large_file.txt'):
        process(char)

Ответ 12

#reading out the file at once in a list and then printing one-by-one
f=open('file.txt')
for i in list(f.read()):
    print(i)

Ответ 13

Железный человек, черная вдова, танос умирают в эндшпиле