Подтвердить что ты не робот

Какие языки программирования были разработаны с поддержкой Unicode с самого начала?

Какие широко используемые языки программирования были разработаны с поддержкой Unicode?

Многие языки программирования добавили поддержку Unicode как запоздалую мысль в более поздних версиях, но какие широко используемые языки были выпущены с поддержкой Unicode с первого дня?

4b9b3361

Ответ 1

Java, вероятно, был первым популярным языком, поддерживающим поддержку Unicode.

Ответ 2

В основном все языки .NET - это языки Unicode, такие как С# и VB.NET.

Ответ 3

В Python 3 было много изменений, в том числе переход на Unicode для всего текста.

Итак, Python не был разработан для Unicode, но Python 3 был.

Ответ 4

Я не знаю, как далеко это происходит на других языках, но забавная вещь о С# заключается в том, что не только среда выполнения (класс string и т.д.), но и unicode полностью поддерживается в источнике:

using משליט = System.Object;
using תוצאה = System.Int32;
public class שלום : משליט  {
    public תוצאה בית() {
        int אלף = 0;
        for (int λ = 0; λ < 20; λ++) אלף+=λ;
        return אלף;
    }
}

Ответ 6

Сложно разрабатывать поддержку Unicode для будущего на языке программирования с самого начала.

Java - это один из языков, который был разработан в спецификации языка. Однако поддержка Unicode в версии 1.0 Java отличается от v5 и v6 Java SDK. Это в первую очередь связано с версией Unicode, на которую спецификация языка удовлетворяла, когда язык был изначально разработан. Java пытается отслеживать изменения в стандарте Unicode с каждой основной версией.

Ранние реализации JLS могут требовать поддержки Unicode, в первую очередь потому, что сам Unicode поддерживал 65536 символов (v1.0 поддерживаемого Java Unicode 1.1 и Java версии 1.1 поддерживал Unicode 3.0), который был совместим с 16-разрядным местом хранения по персонажам. Это изменилось с Unicode 3.1 - его эволюционирующим стандартом, обычно с добавлением большего количества символов в каждую версию. Символы, добавленные позже в 3.1, назывались дополнительные символы. Поддержка дополнительных символов была добавлена ​​в Java 5 через JSR-204; Java 5 и 6 поддерживают Unicode 4.0.

Поэтому не удивляйтесь, если разные языки программирования реализуют поддержку Unicode по-разному.

С другой стороны, PHP (!!) и Ruby не поддерживали поддержку Unicode во время создания.

PS: Поддержка v5.1 Unicode будет выполнена в Java 7.

Ответ 7

Java и языки .NET, как отмечали другие комментаторы, хотя строки Java - это UTF-16, а не UCS или UTF-8. (В то время это казалось разумной идеей! Теперь ясно, что лучше использовать UTF-8 или UCS.) И Python 3 - это действительно отличный, несовместимый язык из Python 1.x и 2.x, поэтому он тоже подходит.

Языки Plan9 в 1992 году, вероятно, были первыми в этом: их диалект C, rc, Alef, mk, ACID и т.д. были включены в Unicode. Они приняли очень простой подход, что все, что не было ASCII, было символом идентификатора. См. Их статья 1993 года по этому вопросу. (Это проект, в котором UTF-8 был изобретенный, что означало, что они могли бы сделать это в довольно совместимом режиме, в частности, без использования бинарного текста в сравнении со всеми их программами.)

Другие языки, поддерживающие не-ASCII-идентификаторы, включают текущий PHP.

Ответ 8

Perl 6 имеет полную поддержку юникода с нуля.
компилятор Rakudo Perl 6 - первая реализация)

Общий обзор

Операторы Unicode

Строки, регулярные выражения и грамматики работают на основе графем, даже для тех кодовых комбинаций, для которых нет сложенного представления (для этих случаев создается "искусственное кодовое обозначение", созданное для представления в режиме "летать" ).

Существует специальная кодировка для обработки данных неизвестной кодировки "utf8-c8": это предполагает utf-8, когда это возможно, но создает искусственные кодовые точки для неприменимых последовательностей, что позволяет им совершать кругооборот при необходимости.

Ответ 10

Иногда функция, которая была включена в язык, когда она была впервые разработана, не всегда лучшая.

Языки меняются со временем, и многие из них становятся раздутыми с дополнительными функциями, хотя и не всегда соответствуют последним функциям, которые он впервые включил.

Поэтому я просто выбрасываю идею о том, что вы не обязательно должны уступать языкам, которые недавно добавили Unicode. У них будет преимущество добавления Unicode в уже зрелый инструмент разработки и получение возможности сделать это в первый раз.

Имея это в виду, я хочу убедиться, что Delphi включен здесь, как один из ваших ответов. Embarcadero добавил Unicode в свою версию Delphi 2009 и отлично справился с этой задачей. Этого было достаточно, чтобы, наконец, побудить меня перейти с Delphi 4, который я использовал в течение 10 лет.

Ответ 11

Java использует символы из набора символов Unicode.

Ответ 12

java и .net языки