Я ищу регулярное выражение в Java, которое соответствует всем пробельным символам в String. "\ s" соответствует только некоторым, он не соответствует
и аналогичным пробелам, не связанным с ascii. Я ищу регулярное выражение, которое соответствует всем (общим) символам пробела, которые могут встречаться в Java String.
[изменить]
Чтобы уточнить: я не имею в виду последовательность строк "
". Я имею в виду символ Unicode Unicode U + 00A0, который часто представлен "
", например. в HTML и всех других символах юникода с аналогичным белым пространством meainig, например. "NARROW NO-BREAK SPACE" (U + 202F), Word joiner, закодированный в Unicode 3.2 и выше как U + 2060, "ZERO WIDTH NO-BREAK SPACE" (U + FEFF) и любой другой символ, который может быть изменен как белый, пространство.
[Ответ]
Для моего куколка, т.е. улавливая все пробельные символы, юникод + традиционный, следующее выражение выполняет задание:
[\p{Z}\s]
Ответ приведен ниже, но, поскольку он немного скрыт, я повторяю его здесь.