Подтвердить что ты не робот

Как читать один символ за раз из файла в Python?

Может ли кто-нибудь сказать мне, как я могу это сделать?

4b9b3361

Ответ 1

with open(filename) as f:
  while True:
    c = f.read(1)
    if not c:
      print "End of file"
      break
    print "Read a character:", c

Ответ 2

сначала откройте файл:

with open("filename") as fileobj:
    for line in fileobj:  
       for ch in line: 
           print ch

Ответ 3

Мне нравится принятый ответ: он прост и выполнит эту работу. Я также хотел бы предложить альтернативную реализацию:

def chunks(filename, buffer_size=4096):
    """Reads `filename` in chunks of `buffer_size` bytes and yields each chunk
    until no more characters can be read; the last chunk will most likely have
    less than `buffer_size` bytes.

    :param str filename: Path to the file
    :param int buffer_size: Buffer size, in bytes (default is 4096)
    :return: Yields chunks of `buffer_size` size until exhausting the file
    :rtype: str

    """
    with open(filename, "rb") as fp:
        chunk = fp.read(buffer_size)
        while chunk:
            yield chunk
            chunk = fp.read(buffer_size)

def chars(filename, buffersize=4096):
    """Yields the contents of file `filename` character-by-character. Warning:
    will only work for encodings where one character is encoded as one byte.

    :param str filename: Path to the file
    :param int buffer_size: Buffer size for the underlying chunks,
    in bytes (default is 4096)
    :return: Yields the contents of `filename` character-by-character.
    :rtype: char

    """
    for chunk in chunks(filename, buffersize):
        for char in chunk:
            yield char

def main(buffersize, filenames):
    """Reads several files character by character and redirects their contents
    to `/dev/null`.

    """
    for filename in filenames:
        with open("/dev/null", "wb") as fp:
            for char in chars(filename, buffersize):
                fp.write(char)

if __name__ == "__main__":
    # Try reading several files varying the buffer size
    import sys
    buffersize = int(sys.argv[1])
    filenames  = sys.argv[2:]
    sys.exit(main(buffersize, filenames))

Код, который я предлагаю, по существу та же идея, что и ваш принятый ответ: прочитайте заданное количество байтов из файла. Разница в том, что вначале он считывает хороший фрагмент данных (4006 является хорошим стандартом для X86, но вы можете попробовать 1024 или 8192; любой кратный размер вашей страницы), а затем он дает символы в этом фрагменте одним.

Код, который я представляю, может быть быстрее для больших файлов. Возьмите, к примеру, . Это мои временные результаты (Mac Book Pro с использованием OS X 10.7.4; so.py - это имя, которое я дал на вставленный код):

$ time python so.py 1 2600.txt.utf-8
python so.py 1 2600.txt.utf-8  3.79s user 0.01s system 99% cpu 3.808 total
$ time python so.py 4096 2600.txt.utf-8
python so.py 4096 2600.txt.utf-8  1.31s user 0.01s system 99% cpu 1.318 total

Теперь: не принимайте размер буфера в 4096 как универсальную истину; посмотрите на результаты, которые я получаю для разных размеров (размер буфера (байты) и время на стене (сек)):

   2 2.726 
   4 1.948 
   8 1.693 
  16 1.534 
  32 1.525 
  64 1.398 
 128 1.432 
 256 1.377 
 512 1.347 
1024 1.442 
2048 1.316 
4096 1.318 

Как вы можете видеть, вы можете начать получать прибыль ранее (и мои тайминги, скорее всего, очень неточно); размер буфера является компромиссом между производительностью и памятью. Значение по умолчанию 4096 - это разумный выбор, но, как всегда, сначала измерьте.

Ответ 4

Сам Python может помочь вам в этом, в интерактивном режиме:

>>> help(file.read)
Help on method_descriptor:

read(...)
    read([size]) -> read at most size bytes, returned as a string.

    If the size argument is negative or omitted, read until EOF is reached.
    Notice that when in non-blocking mode, less data than what was requested
    may be returned, even if no size parameter was given.

Ответ 5

Просто:

myfile = open(filename)
onecaracter = myfile.read(1)

Ответ 7

Вы должны попробовать f.read(1), который определенно правильный и правильная вещь.

Ответ 8

Просто прочитайте один символ

f.read(1)

Ответ 9

f = open('hi.txt', 'w')
f.write('0123456789abcdef')
f.close()
f = open('hej.txt', 'r')
f.seek(12)
print f.read(1) # This will read just "c"

Ответ 10

Это также будет работать:

with open("filename") as fileObj:
    for line in fileObj:  
        for ch in line:
            print(ch)

Он проходит через каждую строку в файле и каждый символ в каждой строке.

Ответ 11

Чтобы сделать дополнение, если вы читаете файл, содержащий строку vvvvery огромный, что может сломать вашу память, вы можете подумать о том, чтобы прочитать их в буфер, а затем дать каждому char

def read_char(inputfile, buffersize=10240):
    with open(inputfile, 'r') as f:
        while True:
            buf = f.read(buffersize)
            if not buf:
                break
            for char in buf:
                yield char
        yield '' #handle the scene that the file is empty

if __name__ == "__main__":
    for word in read_char('./very_large_file.txt'):
        process(char)

Ответ 12

#reading out the file at once in a list and then printing one-by-one
f=open('file.txt')
for i in list(f.read()):
    print(i)

Ответ 13

Железный человек, черная вдова, танос умирают в эндшпиле