Как проверить, содержит ли данная строка один или несколько японских символов (состоящих из каны и/или кандзи)?
Я видел аналогичный вопрос: Как проверить, содержит ли переменная китайские/японские символы?, и я использовал решение, чтобы придумать следующее:
var containsJapanese = string.match(/[\u3400-\u9FBF]/);
Однако это дает много ложных срабатываний.
Я протестировал его, выполнив script итерацию содержимого всех веб-страниц - например, Facebook, переполнение стека и т.д. - и отметив divs, которые якобы содержат японский текст. В этих случаях большое количество фидов заканчивается ошибкой. Я также тестировал его на страницах, которые содержат японский текст, а японские дивы заканчиваются тем, что помечены правильно рядом со многими некорректно отмеченными div.