Я хотел бы сопоставить все строчные буквы в латинском блоке. Тривиальный "[a-z]" соответствует только символам между U + 0061 и U + 007A, а не ко всем другим строчным формам.
Я хотел бы совместить все строчные буквы, самое главное, все акцентированные строчные буквы в латинском блоке, используемом на языках EFIGS.
[a-zà-ý] - это начало, но все еще есть тонны других строчных символов (см. http://www.unicode.org/charts/PDF/U0000.pdf). Есть ли рекомендуемый способ сделать это?
FYI Я использую Python, но я подозреваю, что эта проблема кросс-языковая.
Встроенный в Python метод "islower()" делает правильную проверку:
lower = ''
for c in xrange(0,2**16):
if unichr(c).islower():
lower += unichr(c)
print lower