Я пытаюсь разбить строку на слова и пунктуацию, добавив пунктуацию в список, созданный разделом.
Например:
>>> c = "help, me"
>>> print c.split()
['help,', 'me']
Я хочу, чтобы список выглядел так:
['help', ',', 'me']
Итак, я хочу, чтобы строка была разделена на пробел с препинанием, разделенным на слова.
Я попытался сначала разобрать строку, а затем запустить split:
>>> for character in c:
... if character in ".,;!?":
... outputCharacter = " %s" % character
... else:
... outputCharacter = character
... separatedPunctuation += outputCharacter
>>> print separatedPunctuation
help , me
>>> print separatedPunctuation.split()
['help', ',', 'me']
Это дает результат, который я хочу, но очень тяжелый для больших файлов.
Есть ли способ сделать это более эффективно?