Что такое "наивность" в наивном классификаторе Байеса?

Что наивно относительно Наивного Байеса?

Ответ 1

На самом деле очень хороший пример в Википедии:

В простых терминах наивный классификатор Байеса предполагает, что наличие (или отсутствие) конкретного признака класса не связано с наличием (или отсутствием) любого другого признака с учетом переменной класса. Например, плод можно считать яблоком, если он красный, круглый и около 4 дюймов. Даже если эти функции зависят друг от друга или от наличия других признаков, наивный классификатор Байеса рассматривает все эти свойства независимо способствуют вероятности того, что этот плод является яблоком.

В принципе, это "наивно", потому что он делает предположения, которые могут или не могут оказаться правильными.

Ответ 2

Если ваши данные состоят из вектор-функции X = {x1, x2,... x10} и ваших ярлыков класса Y = {y1, y2,.. y5}. Таким образом, классификатор Байеса идентифицирует правильную метку класса как та, которая максимизирует следующую формулу:

P (y/X) = P (X/y) * P (y) = P (x1, x2,... x10/y) * P (y)

Итак, это еще не Наивное. Однако трудно вычислить P (x1, x2,... x10/Y), поэтому мы предполагаем, что функции должны быть независимыми, это то, что мы называем предположением Наива, поэтому вместо этого получим следующую формулу:/p >

P (y/X) = P (x1/y) * P (x2/y) *... P (x10/y) * P (y)

Ответ 3

Он называется наивным, потому что он делает предположение, что все атрибуты независимы друг от друга. Это предположение объясняется тем, что оно названо наивным, как во множестве реальных ситуаций, это не подходит. Несмотря на это, классификатор отлично работает во многих ситуациях реального мира и имеет сопоставимую производительность для нейтральных сетей и SVM в некоторых случаях (хотя и не для всех).

Ответ 4

Для классификации, когда мы находим совместное распределение, проблема заключается в том, что она просто отражает данные обучения, а также очень сложно вычислить. Поэтому нам нужно что-то, что более полезно.

наивная модель сильно обобщает, что каждый атрибут распространяется независимо от любых других атрибутов.

Это действительно помогает не заботиться о зависимости между атрибутами в значительной степени.