У меня есть несколько строк со всеми видами разных эмоций/образов/знаков в них.
Не все строки написаны на английском языке - некоторые из них находятся на других нелатинских языках, например:
▓ railway??
→ Cats and dogs
I'm on 🔥
Apples ⚛
✅ Vi sign
♛ I'm the king ♛
Corée ♦ du Nord ☁ (French)
gjør at både ◄╗ (Norwegian)
Star me ★
Star ⭐ once more
早上好 ♛ (Chinese)
Καλημέρα ✂ (Greek)
another ✓ sign ✓
добрай раніцы ✪ (Belarus)
◄ शुभ प्रभात ◄ (Hindi)
✪ ✰ ❈ ❧ Let get together ★. We shall meet at 12/10/2018 10:00 AM at Tony's.❉
... и многое другое.
Я хотел бы избавиться от всех этих знаков/изображений и сохранить только буквы (и знаки препинания) на разных языках.
Я попытался очистить знаки, используя библиотеку EmojiParser:
String withoutEmojis = EmojiParser.removeAllEmojis(input);
Проблема в том, что EmojiParser не может удалить большинство знаков. Знак ♦ - единственный, который я нашел до сих пор, когда он удалился. Другие знаки, такие как ✪ ❉ ★ ✰ ❈ ❧ ✂ ❋ ⓡ ✿ ♛ 🔥, не удаляются.
Есть ли способ удалить все эти знаки из входных строк и сохранить только буквы и знаки препинания на разных языках?