Я выполняю некоторую нормализацию текста, используя python и регулярные выражения. Я хотел бы заменить все "u'or" U "вы". Вот что я сделал до сих пор:
import re
text = 'how are u? umberella u! u. U. [email protected] U# u '
print re.sub (' [u|U][s,.,?,!,W,#,@ (^a-zA-Z)]', ' you ', text)
Выход, который я получаю:
how are you you berella you you you you you you
Как вы видите, проблема заключается в том, что "umberella" изменено на "berella". Также я хочу сохранить символ, который появляется после "u". Например, я хочу "u!" чтобы быть измененным на "вы!". Может ли кто-нибудь сказать мне, что я делаю неправильно, и как лучше всего написать регулярное выражение?