Подтвердить что ты не робот

Перестановка и комбинация интервью

Это хороший, потому что он настолько интуитивно понятен:

Представьте себе урну, заполненную шариками, две трети которой имеют один цвет и одна треть из них имеют другую. Один человек нарисовал 5 мячей из урны и обнаружил, что 4 красного цвета, а 1 белого. Другой человек нарисовал 20 шариков и обнаружил, что 12 красных и 8 белых. Кто из двух человек должен чувствовать себя увереннее, что урна содержит две трети красных шаров и одну треть белых шаров, а не наоборот? Какие шансы должен дать каждый человек?

Я знаю правильный ответ, но, может быть, я не совсем понимаю, как это сделать. Может кто-нибудь объяснить?

4b9b3361

Ответ 1

Пусть A - событие, в котором 2/3 шаров являются красными, а затем ¬ A является событием, когда 2/3 шаров являются белыми. Пусть B будет случай, когда первый наблюдатель увидит 4 красных шара из 5 и пусть C будет событие, когда второй наблюдатель увидит 12 красных шаров из 20.

Применяя некоторую простую комбинаторика, получим, что

  • P (B | A) = (5 выберите 4) (2/3) 4 (1/3) 1= 80/243
  • P (B | ¬ A) = (5 выберите 4) (1/3) 4 (2/3) 1= 10/243

Следовательно, из закона Байеса наблюдатель 1 имеет уровень достоверности 80/(80 + 10) = 8/9, что A истинно.

Для второго наблюдателя:

  • P (C | A) = (20 выберите 12) (2/3) 12 (1/3) 8= 125970 * 2 12/3 20
  • P (C | ¬ A) = (20 выберите 12) (1/3) 12 (2/3) 8= 125970 * 2 8/3 20

Итак, снова из закона Байеса, наблюдатель 2 имеет уровень достоверности 2 12/(2 12 + 2 8) = 16/17, что A истинно.

Следовательно, наблюдатель два имеет более высокий уровень достоверности, который 2/3 шаров красный. Ключ должен понять, как работает Закон Байеса. Фактически, все, что имеет значение, - это разница в количестве наблюдаемых красных и белых шаров. Все остальное (в частности, общее количество рисованных шаров) отменяется в уравнениях.

Ответ 2

Элиэзер Юдковски имеет (действительно, очень длинный, но хороший) объяснение теоремы Байеса. Около 70% вниз, там начинается абзац "Перед вами книжный шкаф", который объясняет суть этой проблемы.

Пуншлайн - это все, что имеет значение - разница между количеством красных и белых шаров. Таким образом, напротив, что говорили другие, вам не нужно делать никаких вычислений. (Это делает одно из разумных предположений (а), что шары нарисованы с заменой, или (б) урна имеет много шаров. Тогда количество шаров не имеет значения.) Здесь аргумент:

Напомним теорему Байеса: P (A | B) = P (B | A) * P (A)/P (B). (Примечание по терминологии: P (A) является предшествующим, а P (A | B) является задним. B - это какое-то наблюдение, которое вы сделали, а терминология отражает вашу уверенность до и после вашего наблюдения.) Эта форма теоремы отлично, и @bobince и @Adam Rosenfield правильно применили его. Однако использование этой формы напрямую делает вас восприимчивыми к арифметическим ошибкам, и это на самом деле не передает сердце теоремы Байеса. Адам упомянул в своем посте (и я упоминал выше), что все, что имеет значение, - это разница между количеством красных и белых шаров, потому что "все остальное отменяется в уравнениях". Как мы можем видеть это без каких-либо вычислений?

Мы можем использовать понятия отношения шансов и отношения правдоподобия. Что такое коэффициент шансов? Ну, вместо того, чтобы думать о P (A) и P (¬A), мы будем думать об их отношении P (A): P (¬A). Либо можно извлечь выгоду из другого, но арифметика лучше работает с коэффициентами шансов, потому что нам не нужно нормализовать. Более того, легче "получить" теорему Байеса в ее альтернативной форме.

Что я имею в виду, нам не нужно нормализовать, а какая альтернативная форма? Ну, позвольте вычислить. Теорема Байеса утверждает, что задние коэффициенты

(P (B | A) * P (A)/P (B)): (P (B | ¬A) * P (¬A) )/P (B)).

P (B) является нормирующим фактором, чтобы сумма вероятности была равна единице; однако мы работаем с коэффициентами, где коэффициенты 2: 1 и 4: 2 - одно и то же, поэтому P (B) отменяется. У нас осталось простое выражение, которое имеет фактор:

P (A | B): P (¬A | B) = (P (B | A) * P (A)): (P (B | ¬A) * P (¬A)) = (P (B | A): P (B | ¬A)) * (P (A): P (¬A))

Мы уже слышали о втором термине; это отношение предыдущих коэффициентов. Что такое P (B | A): P (B | ¬A)? Это называется коэффициентом правдоподобия. Итак, наше окончательное выражение

задние коэффициенты = коэффициент правдоподобия * предыдущие коэффициенты.

Как мы применим его в этой ситуации? Предположим, что у нас есть некоторые предыдущие коэффициенты x: y для содержимого урны, причем x представляет 2/3rds red и y, представляющие 2/3rds белые. Предположим, что мы нарисовали один красный шар. Коэффициент правдоподобия - P (рисованный красный шар | urn - 2/3rds red): P (рисованный красный шар | урн 2/3rds белый) = (2/3): (1/3) = 2: 1. Таким образом, задние коэффициенты - 2x: y; если бы мы нарисовали белый шар, то задние коэффициенты были бы x: 2y подобными рассуждениями. Теперь мы делаем это для каждого шара последовательно; если ничьи независимы, то мы просто умножаем все коэффициенты шансов. Итак, получим, что если мы начнем с отношения шансов x: y и нарисуем r красных шаров и белых шариков, получим окончательное отношение шансов

(x: y) * (2: 1) ^ r * (1: 2) ^ w = (x * 2 ^ r): (y * 2 ^ w) = (x: y) * (2 ^ (rw): 1).

поэтому мы видим, что все, что имеет значение, - это разница между r и w. Это также позволяет нам легко решить проблему. Для первого вопроса ( "кто должен быть более уверенным?" ) Предыдущие коэффициенты не имеют значения, если они не 1: 0 или 0: 1, и оба человека имеют одинаковые приоритеты. В самом деле, если их идентичные предыдущие были х: у, первый человек был бы (2 ^ 3 * х): у, а второй человек был бы (2 ^ 4 * х): у, поэтому второй человек больше уверен.

Предположим, что предыдущие коэффициенты были одинаковыми, то есть 1:1. Тогда первый человек был бы равен 8: 1, а второй - 16: 1. Мы можем легко перевести их на вероятности 8/9 и 16/17, подтверждающие другие расчеты.

Точка здесь заключается в том, что если вы получите вышеописанное уравнение, то эта проблема очень проста. Но, что важно, вы можете быть уверены, что не испортили какую-либо арифметику, потому что вам нужно сделать это немного.

Итак, это плохой вопрос программирования, но это хороший тест смелого уравнения. Просто для практики, примените его еще к двум проблемам:

Я случайно выбираю одну из двух монет, честную монету или фальшивую двуглавую монету, каждая с вероятностью 50%. Я три раза переворачиваю его, и он появляется три раза. Какова вероятность того, что это настоящая монета?

Предыдущие коэффициенты действительны: fake = 1:1, как указано в задаче. Вероятность того, что я увидела бы три головы с настоящей монетой, - 1/8, но она 1 с поддельной монетой, поэтому коэффициент правдоподобия равен 1: 8. Таким образом, задние коэффициенты = до * правдоподобия = 1: 8. Таким образом, вероятность того, что настоящая монета равна 1/9.

Эта проблема также поднимает важное предостережение: существует возможное соотношение правдоподобия для всех возможных наблюдений. Это связано с тем, что отношение правдоподобия для B представляет собой P (B | A): P (B | ¬A), что необязательно связано с отношением правдоподобия для ¬B, которое представляет собой P (¬B | A): P (¬ B | ¬A). К сожалению, во всех приведенных выше примерах они были обратными друг другу, но здесь они не являются.

Действительно, предположим, что я один раз переворачиваю монету и получаю хвосты. Какова вероятность, что это настоящая монета? Очевидно одно. Как проверяется теорема Байеса? Ну, отношение правдоподобия для этого наблюдения - вероятность увидеть этот результат с реальной монетой против поддельной монеты, которая равна 1/2: 0 = 1: 0. То есть, видя один хвост, убивает вероятность того, что монета будет подделка, которая проверяет нашу интуицию.

Здесь проблема, о которой я упомянул на странице Eliezer:

Перед вами - книжный шкаф, содержащий 1000 покерных фишек. Я начал с двух таких книжных шкафов, один из которых содержит 700 красных и 300 голубых фишек, а другой - 300 красных и 700 синих. Я перевернул милую монету, чтобы определить, какой книжный шкаф использовать, поэтому ваша предыдущая вероятность того, что книжный портфель перед вами - это красная книга, составляет 50%. Теперь вы произвольно выбираете, с заменой после каждого чипа. В 12 образцах вы получаете 8 красных и 4 блюза. Какова вероятность того, что это преимущественно красный мешок? (Вам не нужно быть точным - приблизительная оценка достаточно хороша.)

Предыдущие коэффициенты красные: синий = 1:1. Отношение правдоподобия 7: 3 и 3: 7, поэтому задние коэффициенты (7: 3) ^ 8 * (3: 7) ^ 4 = 7 ^ 4: 3 ^ 4. На этом этапе мы просто оцениваем 7: 3 как, скажем, 2: 1, и получаем 2 ^ 4: 1 = 16: 1. Наш окончательный ответ еще больше, поэтому он определенно превышает 95% или около того; правильный ответ составляет около 96,7%. Сравните это с ответами большинства людей, которые находятся в диапазоне 70--80%.

Надеюсь, вы согласны с тем, что проблемы становятся очень легко и интуитивно понятными, если смотреть на этот свет.

Ответ 3

Я предполагаю, что "априорная" вероятность одной гипотезы в сравнении с другой равна 1/2, и, кроме того, оба индивида повторно вставляют каждый шар после извлечения его (экстракции независимы друг от друга).

Правильный ответ заключается в том, что второй наблюдатель должен быть более уверенным, чем первый. Мой предыдущий ответ был неправильным из-за тривиальной ошибки в вычислениях, большое спасибо и +1 Адаму Розенфилду за его исправление.

Пусть 2/3R 1/3W обозначает событие "урна содержит 2/3 красных шаров и 1/3 белых шара" и пусть 4R, 1W обозначают событие "4 красных шарика и 1 белый шар извлекаются". Затем, используя правило Байеса,

P [ 2/3R 1/3W | 4R, 1W] = P [ 4R, 1W | 2/3R 1/3W] P [ 2/3R 1/3W]/P [ 4R, 1W]  = (2/3) 4 (1/3) 1 (1/2)/P [ 4R, 1W]

Теперь, поскольку 2/3R 1/3W и 1/3R 2/3W дополняют по условию,

P [ 4R, 1W] = P [ 4R, 1W | 2/3R 1/3W] P [ 2/3R 1/3W] + P [ 4R, 1W | 1/3R 2/3W] P [ 1/3R 2/3W] = (2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2/3 ) 1 (1/2)

Таким образом,

P [ 2/3R 1/3W | 4R, 1W] = (2/3) 4 (1/3) 1 (1/2)/{(2/3) 4 (1/3) 1 (1/2) + (1/3) 4 (2/3) 1 (1/2)} = 2 ^ 4/(2 ^ 4 + 2) = 8/9

Тот же расчет для P [ 2/3R 1/3W | 12R, 8W] (т.е. имея (2/3) 12 (1/3) 8 вместо (2/3) 4 (1/3) 1) дает теперь 16/17, поэтому доверие второго наблюдателя больше, чем доверие второго.

Ответ 4

P [2/3R 1/3W | 4R, 1W] = (2/3) ^ 4 * (1/3) ^ 1 * (1/2)/{(2/3) ^ 4 * (1/3) ^ 1 * (1/2) + (1/3) ^ 4 * (2/3) ^ 1 * (1/2)} = 2 ^ 4/(2 ^ 4 + 1) = 16/17

э,

= ⅔^4*⅓ / (⅔^4*⅓ + ⅓^4*⅔)
= 16/243 / (16/243 + 2/243)
= 16/18

P (⅔R⅓W | 12R8W) действительно имеет value = 16/17, поэтому 12R8W может быть более уверенным.

Ответ 5

Хех. Может быть, я совершенно неправ, но разве это не интуитивно понятно, что ответ должен быть вторым парнем?

Видно соотношение: 4: 1 4/5: 1/5

Двое видит соотношение 3: 1 3/4: 1/4

Так простой вопрос: кто ближе к 2/3: 1/3? Отсюда и ответ. Два.

Возможно, я допустил две ошибки и получаю простой ответ на что-то сложное, но прошу прощения за терпение, чтобы объяснить длинное объяснение того, что, на мой взгляд, было интуитивным.