Это двойной вопрос для вас, удивительно добрый Stacked Overflow Wizards.
-
Как установить emacs/slime/swank для использования UTF-8 при разговоре с Clojure или использовать UTF-8 в командной строке REPL? На данный момент я не могу отправить никаких неязыковых символов в swank- clojure, а использование командной строки REPL искажает вещи.
-
Очень легко сделать регулярные выражения по латинскому тексту:
(re-seq # "[\ w] +" "Действительно верно, что японские предложения не нужны пробелы?" )
Но что, если у меня есть японцы? Я думал, что это сработает, но я не могу проверить это:
(re-seq #"[(?u)\w]+" "日本語 の 文章 に は スペース が 必要 ない って、 本当?")
Нам становится тяжелее, если нам нужно использовать словарь, чтобы найти сломанные перерывы, или найти сами катакана:
(re-seq #"[アイウエオ-ン]" "日本語の文章にはスペースが必要ないって、本当?")
Спасибо!