Как сгенерировать n-грамм строки, например:
String Input="This is my car."
Я хочу сгенерировать n-грамм с этим вводом:
Input Ngram size = 3
Вывод должен быть:
This
is
my
car
This is
is my
my car
This is my
is my car
Дайте некоторую идею в Java, как реализовать это, или если для него доступна какая-либо библиотека.
Я пытаюсь использовать этот NGramTokenizer, но он дает n-грамму последовательности символов, и я хочу n-граммов последовательности слов.