Подтвердить что ты не робот

Языки, поддерживаемые символами "latin" и "latin-extended" в шрифтах в Google Web Fonts?

Google Web Fonts Select Character Sets

Некоторые шрифты в Google Web Fonts поддерживают несколько "наборов символов". Дело в том, что если используемый мной веб-шрифт служит только для "латинских" глифов, пользователи, которые переводят страницу на язык, глифы которого не поддерживаются, будут четко замечены испорченный текст.

Я бы хотел, чтобы мои веб-шрифты поддерживали самые популярные языки в мире, помимо английского, например, испанского, немецкого, французского и т.д.

С этой целью я хотел бы узнать, какие языки в точности, "латинские" и "латинские", индивидуально обслуживаются.

Я ожидаю, что ответ будет выглядеть следующим образом:

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

Я не мог найти эту информацию в документации Google Web Fonts или в Google.

4b9b3361

Ответ 1

Latin

aka Unicode Latin1-Supplement (от U + 0080 до U + 00FF) предназначен для поддержки западноевропейских языков (как вы упомянули французский, немецкий, испанский, а также ирландский, исландский, языки скандинавских стран и по совпадению также другие языки, упомянутые в списке ниже: британский английский пропускает обычно используемый знак £, американский английский поддерживается стандартом ASCII). ASCII (первые 127 символов, 95 из них - графемы от U + 0020 до U + 007E) был помещен как самый первый блок в Unicode с именем Basic Latin. Этот блок считается частью "латиницы" и обычно поддерживается даже в нелатинских шрифтах для правильного отображения имени шрифта в системах на латинице.

Латинский расширенный

Латинский расширенный означает практически блок Latin-Extended-A (от U + 0100 до U + 017F), который должен поддерживать все распространенные латинские тексты. Latin1-Extended-B в основном содержит поддержку фонетики и африканских латинских языков, а также 3 символа для румынского и азербайджанского языков, упомянутых ниже (может быть заменен символами из расширения A). Существуют еще более экзотические расширения C, D и E (всего 252 символа), но они никогда не используются в обычных электронных текстах. Latin Extended Дополнительный набор поддерживает латиноамериканские языки Африки. Их используют десятки миллионов человек, но они практически неизвестны электронному миру, и большинство шрифтов в этой категории не поддерживают их.

В большинстве языков, использующих этот блок, также используются символы из "Latin" (Latin1-Supplement), поэтому шрифты "Latin-Extended" должны содержать расширенный набор символов "Latin", но это не гарантируется: чем больше символов содержит шрифт, тем больше его размер. размер (размер шрифта, покрывающего весь BMP, может превышать 10 МБ, что не подходит для веб-шрифтов). Следовательно, не все символы из блока Latin-Extended-A должны присутствовать в категории Latin-Extended, особенно в сильно стилизованных шрифтах: это зависит от назначения шрифта или мотивов его автора. Чтобы узнать, поддерживает ли шрифт определенный язык, попробуйте отобразить символы из списка ниже.

Поддержка языков

Из списка латинских алфавитов  ниже проверено на Omniglot и других источниках, я не считаю:

  • орграфы, которые обычно заменяются отдельными символами (Æ поддерживается дополнением Latin1)
  • нелатинские алфавиты, поскольку речь идет о латинице и латино-расширенной
  • языки меньшинств и мертвых (бислама, чаморро, киприот, далкарлянский, эстремадуранский, фала, эльфдалянский, фарерский, гильбертский, глосский, икизу, инупиак, истрийский, ливонский, ладинский, кашубийский, маори, маршалльский, миринский, миранский Окситанский, романский, ротокасский, саамский языки, самоанский, верхний и нижний сорбский, таитянский, тетум, тонганский, улитский, япский, цунийский, индейские латинские алфавиты)
  • исторические символы не используются в последних версиях алфавитов (например, двойные могильные акценты)
  • пиньинь

Пожалуйста, прокомментируйте, если что-то важное отсутствует или если какой-либо язык меньшинства используется в электронном общении.

ASCII (Базовая латиница)

Классическая латынь, американский английский, астурийский, корсу, голландский, гренландский, гэльский, гаитянский (креолский), шона, сицилийский, суахили

Latin

  • Албанский Ç, Ë (Ç не на арберешском диалекте)
  • Каталонский ,, È, Í, Ï, Ó, Ò, Ú, Ü, Ç
  • Датский, норвежский Æ, Å, Ø
  • Финский Å, Ä, Ö, Š, Ž (Š, Ž из Extended-A используется редко, может использовать S, Z, тогда достаточно Latin1-дополнение)
  • Французский Æ, Œ, Â, À, É, È, Ê, Ë, Ë, Ç, Î, Ï, Ô, Ù, Û, Ü, Ÿ, "," (редко используется Œ, Ÿ из Extended-A, остальное, включая ÿ в приложении Latin1 -
  • Фриульский Â, Ê, Î, Ô, Û
  • Немецкий Ä, Ö, Ü, ß
  • Исландский Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð
  • Ирландский Á, É, Í, Ó, Ú
  • Хаси С, Ï
  • Пьемонтская Ë, Ò
  • Сардинский Ç
  • Испанский и галисийский С, ¿, ¡
  • Шведский Å, Ä, Ö
  • Тагальский (Филиппины) С

Латинский расширенный

  • Азери Ç, Ğ, я (строчные буквы без точек), İ, Ö, Ü, Ü, Extended (Extended из Extended-B заменяется на Ä, затем тот же алфавит, что и турецкий)
  • Крымскотатарский Ç, Ǧ, я (без строчных букв), İ, С, Ö, Ş, Ü (Ǧ из Extended-B)
  • Сербский, боснийский и хорватский Ć, Č, Đ, Š, Ž
  • Чешский Á, Č, Ď, Ě, É,, Ň, Ó, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
  • Английский £, ¢
  • Эстонский Ä, Ö, Õ, Ü, Š, Ž
  • Эсперанто Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
  • Гагаузский (Молдавия) Ä, Ç, Ê, я (без строчных букв), İ, Ö, Ş, Ţ, Ü
  • Гуарани (Южная Америка), Ẽ, ̃, Ĩ,, Õ, Ũ, Ũ (Ã, Ñ, Õ с латыни, Ĩ, Ũ из Extended-A, Ẽ, Ỹ из Extended-Additional, G̃ не в Юникоде, только с сочетанием диакритического знака)
  • Гавайский Ā, Ē, Ī
  • Венгерский Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
  • Казахский (2017-2025 планируется перевести из кириллицы) Á, Ǵ, Ń, Ú, Ý (Ǵ из Extended-B)
  • Курдский Ç, Ê, Î, Ş, Û
  • Латышский Ā, Č, Ē, Ģ, Ķ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
  • Литовский Ą, Č, Ę, Ė, Š, Ų, Ū, Ž
  • Мальтийский Ċ, Ġ, Ħ
  • Польский Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
  • Португальский Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú
  • Румынский Ă, Â, Î, Ș, Ț (Ș, Ț из расширенного латинского B, можно использовать Ş, Ţ из расширенного A)
  • Словацкий Ä, Á, Č, Ď, É, Í, Ĺ, Ľ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý, Ž
  • Словенский Č, Š, Ž
  • Турецкий Ç, Ğ, я (без точек), İ, Ö, Ş, Ü
  • Вьетнамский Ă, Â, Đ, Ê, Ô, Ơ, Ư (Ă, Ơ, Ư в Extended-B плюс объединение тонов 0x300 и 0x301, см. объединение диакритических знаков ниже, имеет специальную категорию для шрифтов Google)
  • Валлийский Â, Ê, Î, Ô, Û, Ŵ, Ŷ

Латинская расширенная, африканская

(Редкий онлайн, но используется многими людьми на большой земле)

  • Бамбара (Мали) Ɛ, Ɲ, Ɔ (Все из Extended-B)
  • Берберские (туареги) (Сахара) Ă, Ḍ, Ɣ, Ǝ, Š, Ž, Ḥ, Ḷ, Ṣ, Ṭ, Ẓ (Ă, Š, Ž из Ext-A, Ɣ, Ǝ из Ext-B, символы с точкой внизу из Ext-Additional)
  • Чичева (Чева) (Восточная Африка) Ŵ
  • Динка (Судан) Ä, Ë, Ɛ, Ɛ̈, Ɣ, Ï, Ŋ, Ö, Ɔ, Ɔ̈ (Ä, Ë, Ï, Ö с латыни, Ŋ из Ext-A, Ɛ, Ɣ, Ɔ из Ext-B, Ɛ̈, Ɔ̈ не в Unicode, только с объединением диакритического знака)
  • Фула (Западная Африка) Ɓ, Ɗ, Ƴ, Ŋ (Ŋ из Ext-A, отдых из Ext-B)
  • Хауса (Чад) Ɓ, Ɗ, Ƴ, Ƙ, R̃ (R̃ не в Юникоде, только с сочетанием диакритического знака, остальные из Ext-B)
  • Игбо (Нигерия) Ṅ, Ị (дополнительный-дополнительный)
  • Малагасийский (Мадагаскар) N̈ (не в Юникоде, только с сочетанием диакритического знака, можно заменить на С с латинского)
  • Паннигерийский Ɓ, Ɗ, Ǝ, Ẹ, Ị, Ƙ, Ṣ, Ụ (Ɓ, Ɗ, Ǝ, Ƙ из Ext-B, Ẹ, Ị, Ṣ, Ụ из Ext-Additional)
  • Волоф (Сенегал) À, É, Ë, Ñ, Ŋ, Ó
  • Йоруба (Западная Африка) Ẹ, Ọ, Ṣ (Ext-Additional + сочетание тонов Á, À, Ā)

Объединение диакритических знаков

В качестве альтернативы шрифт может поддерживать блок "Объединение диакритических меток": от U + 0300 до U + 036F. Например, Ř может быть напечатано либо как U+0158 (он же предварительно скомпонованный символ), либо как R + U+030C. Программа, поддерживающая Unicode, должна отображать и обрабатывать то же самое, что и отдельный символ, но если программа или шрифт не поддерживает репертуар, диакритический знак объединения может оказаться немного неуместным (например, слишком низким low здесь, в моей системе), см. это очень подробные Unicode Q & A по этой теме.

Другие персонажи для рассмотрения

Немецкий Fraktur, все еще широко используемый (то есть на большинстве дорожных указателей в Зальцбурге), содержит несколько вариантов "s", которые не в Unicode, шрифты не могут отображать их как глифы и отображать их как другие символы (не очень хорошая идея). Существуют и другие экзотические символы, которые могут быть полезны в электронных текстах (когда я был ребенком, меня учили "Ch" в качестве графемы на чешском алфавите после "h". Это не в Unicode (аналог словенского Lj, Nj в Unicode)), и поскольку электронные тексты преобладали в Чешской Республике в середине 90-х годов, это больше не подчеркивается, однако в чешском языке последовательность "ch" все еще отсортирована после "h", более интересная информация здесь).

Полезные шрифты с поддержкой мультиязычности

Возможно, вы захотите настроить некоторые шрифты (если их лицензия позволяет это) с помощью службы Font Squirrel или использовать их в качестве резервной копии. Для начала есть широкая поддержка бесплатных шрифтов:

  • Мне очень нравится красивый Quivira шрифт открытого типа с 11 + k символами, 1,5 МБ
  • на многих компьютерах установлен Arial Unicode (часть MS Office, 50k+ chars, 22 МБ)
  • существует проект Noto от Google, который содержит ВСЕ, но самые последние символы юникода в шрифтах с засечками, без засечек и в пользовательском интерфейсе, хорошо отсортированные по поддержке блоков (1,1 ГБ)
  • в качестве последнего резервного шрифта вы можете рассмотреть уродливый вид Unifont (50 + k символов, но только 11 МБ и дружественные встроенные устройства)