Моя проблема концептуально похожа на решение анаграмм, за исключением того, что я не могу просто использовать поиск в словаре. Я пытаюсь найти правдоподобные слова, а не реальные слова.
Я создал N-граммовую модель (на данный момент N = 2) на основе букв в кучке текста. Теперь, учитывая случайную последовательность букв, я хотел бы переставить их в наиболее вероятную последовательность в соответствии с вероятностями перехода. Я думал, что мне понадобится алгоритм Витерби, когда я начал это, но по мере того, как я смотрю глубже, алгоритм Витерби оптимизирует последовательность скрытых случайных переменных на основе на наблюдаемом выходе. Я пытаюсь оптимизировать последовательность вывода.
Есть ли известный алгоритм для этого, о котором я могу прочитать? Или я на правильном пути с Витерби, и я просто не вижу, как его применять?
Update
Я добавил щедрость, чтобы попросить больше узнать об этой проблеме. (Анализ, объясняющий, почему эффективный подход невозможен, другие эвристики/приближения, кроме симулированного отжига и т.д.)