В чем разница между цепными моделями марков и скрытой марковской моделью? Я читал в Википедии, но не мог понять различия.
В чем разница между цепями марков и скрытой марковской моделью?
Ответ 1
Чтобы объяснить на примере, я буду использовать пример из обработки естественного языка. Представьте, что вы хотите знать вероятность этого предложения:
Я наслаждаюсь кофе
В марковской модели вы можете оценить ее вероятность, рассчитав:
P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)
Теперь представьте, что мы хотим знать теги частей речи этого предложения, то есть, если слово является глаголом прошедшего времени, существительным и т.д.
В этом предложении мы не наблюдали тегов частей речи, но мы предполагаем, что они есть. Таким образом, мы вычисляем, какова вероятность последовательности тегов частей речи. В нашем случае фактическая последовательность:
ПРП-ВБП-НН
(где PRP = "Персональное местоимение", VBP = "Глагол, не принадлежащее третьему лицу настоящее", NN = "Существительное, единственное или массовое". См. https://cs.nyu.edu/grishman/jet/guide/PennPOS.html для полной записи тегов POS Penn)
Но ждать! Это последовательность, к которой мы можем применить марковскую модель. Но мы называем это скрытым, поскольку последовательность частей речи никогда не наблюдается напрямую. Конечно, на практике мы будем вычислять много таких последовательностей и хотели бы найти скрытую последовательность, которая лучше всего объясняет наше наблюдение (например, мы с большей вероятностью увидим такие слова, как "the", "this", сгенерированные из определителя ( DET) тег)
Лучшее объяснение, с которым я когда-либо сталкивался, - это статья Лоуренса Р. Рабинера, написанная в 1989 году: http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf.
Ответ 2
Марковская модель - это машина состояний с изменениями состояния, являющимися вероятностями. В скрытой марковской модели вы не знаете вероятностей, но знаете результаты.
Например, когда вы переворачиваете монету, вы можете получить вероятности, но если вы не можете увидеть флипсы, и кто-то переместит один из пяти пальцев с каждым переводом монетки, вы можете совершить движение пальцев и использовать скрытый Марков, чтобы получить лучшее предположение о перевоплощении монет.
Ответ 3
Насколько я понимаю, вопрос заключается в следующем: в чем разница между марковским процессом и скрытым марковским процессом?
Марковский процесс (МП) - это случайный процесс с:
- Конечное число состояний
- Вероятностные переходы между этими состояниями
- Следующее состояние определяется только текущим состоянием (свойство Маркова)
Скрытый марковский процесс (HMM) также является стохастическим процессом с:
- Конечное число состояний
- Вероятностные переходы между этими состояниями
- Следующее состояние определяется только текущим состоянием (свойство Маркова) И
- Не были уверены, в каком состоянии они находились: текущее состояние вызывает наблюдение.
Пример - (HMM) Фондовый рынок:
На фондовом рынке люди торгуют со стоимостью фирмы. Предположим, что реальная стоимость акции составляет 100 долларов (это ненаблюдаемо, и на самом деле вы никогда не знаете об этом). То, что вы действительно видите, - это то, с какой ценой он торгуется: допустим, в этом случае $ 90 (это можно наблюдать).
Для людей, интересующихся Марковым: Интересная часть - это когда вы начинаете принимать меры на этих моделях (в предыдущем примере, чтобы заработать деньги). Это относится к марковским процессам принятия решений (MDP) и частично наблюдаемым марковским процессам принятия решений (POMDP). Чтобы оценить общую классификацию этих моделей, я суммировал на следующем рисунке основные характеристики каждой модели Маркова.
Ответ 4
Поскольку Мэтт использовал теги части речи, как пример HMM, я мог бы добавить еще один пример: Распознавание речи. Почти все системы непрерывного распознавания речи на основе словаря (LVCSR) основаны на HMM.
Пример "Мэтт": Мне нравится кофе
В марковской модели вы можете оценить ее вероятность, вычислив:
P(WORD = I) x P(WORD = enjoy | PREVIOUS_WORD = I) x P(word = coffee| PREVIOUS_WORD = enjoy)
В скрытой марковской модели
Скажем, 30 разных людей читают предложение "Мне нравится обниматься" , и мы должны его распознать. Каждый человек произносит это предложение по-разному. Поэтому мы НЕ знаем, означал ли человек "обнимать" или "забивать". Мы будем иметь вероятностное распределение фактического слова.
Короче говоря, скрытая марковская модель представляет собой статистическую марковскую модель, в которой модель, моделируемая, считается марковским процессом с ненаблюдаемыми (скрытыми) состояниями.
Ответ 5
Скрытые марковские модели представляют собой двойной встроенный стохастический процесс с двумя уровнями.
Верхний уровень - это марковский процесс, и состояния ненаблюдаемы.
Действительно, наблюдение является вероятностной функцией марковских состояний верхнего уровня.
Различные марковские состояния будут иметь различные вероятностные функции наблюдения.