У меня есть проект JavaEE, в котором я использую файлы свойств сообщений. Кодировка этого файла установлена в UTF-8. В файле я использую немецкие умляуты, например ä
, ö
, ü
. Проблема в том, что иногда эти символы заменяются на unicode, например \uFFFD\uFFFD
, но не для каждого символа. Теперь у меня есть случай, когда ä
и ü
заменяются на \uFFFD\uFFFD
, но не для каждого появления ä
и ü
.
Git diff показывает мне что-то вроде этого:
mail.adresses=E-Mail hinzufügen:
-mail.adresses.multiple=E-Mails durch Kommata getrennt hinzufügen.
+mail.adresses.multiple=E-Mails durch Kommata getrennt hinzuf\uFFFD\uFFFDgen.
mail.title=Einladungs-E-Mail
box.preview=Vorschau
box.share.text=Sie können jetzt die ausgewählten Bilder mit Ihren Freunden teilen.
@@ -6880,7 +6880,7 @@ browser.cancel=Abbrechen
browser.selectImage=übernehmen
browser.starImage=merken
browser.removeImage=Löschen
-browser.searchForSimilarImages=ähnliche
+browser.searchForSimilarImages=\uFFFD\uFFFDhnliche
browser.clear_drop_box=löschen
Также есть строки, которые я не коснулся. Я не понимаю, почему у меня такое поведение. Что может быть причиной вышеуказанной проблемы?
Моя система:
-
Antergos/Arch Linux
-
Системная кодировка UTF-8
Python 3.5.0 (default, Sep 20 2015, 11:28:25) [GCC 5.2.0] on linux Type "help", "copyright", "credits" or "license" for more information. >>> import sys >>> sys.getdefaultencoding() 'utf-8'
-
-
Eclipse Mars 1
- Tomcat 8
- Java JDK 8
Если я использую другой редактор, например Atom, чтобы редактировать эти файлы свойств сообщений, я не сталкивался с этой проблемой.
Я также понял в случае, если я скопирую исходное значение browser.searchForSimilarImages=ähnliche
из Git diff и заменим неправильное значение browser.searchForSimilarImages=\uFFFD\uFFFDhnliche
в Eclipse этим, тогда у меня есть правильные умляуты в файле свойств сообщения.