Я ищу алгоритм или, по крайней мере, теорию работы о том, как вы найдете похожий текст в двух или более разных строках...
Как и вопрос, заданный здесь: Алгоритм поиска статей с похожим текстом, причем разница в том, что мои текстовые строки будут только когда-либо несколькими словами.
Как будто у меня есть строка: "В ясное голубое небо" и я делаю сравнение со следующими двумя строками: "Цвет голубой" и "В синем ясном небе"
Я ищу алгоритм, который можно использовать для сопоставления текста в двух, и решить, насколько они близки. В моем случае важны орфография и пунктуация. Я не хочу, чтобы они влияли на способность обнаруживать реальный текст. В приведенном выше примере, если ссылка цвета хранится как "голубая", я хочу, чтобы она все еще была в состоянии соответствовать. Тем не менее, указанная 3-я строка должна соответствовать BETTER по сравнению со вторым и т.д.
Я уверен, что такие места, как Google, вероятно, используют нечто похожее с функцией "Вы имели в виду:"...
* РЕДАКТИРОВАТЬ *
В разговоре с другом он работал с парнем, который написал статью по этой теме. Я думал, что могу поделиться им со всеми, читающими это, так как в нем есть действительно хорошие методы и процессы...