Я не статистик (больше исследовательский веб-разработчик), но я много слышал о scipy и R в эти дни. Поэтому из любопытства я хотел задать этот вопрос (хотя это может показаться глупым для экспертов здесь), потому что я не уверен в достижениях в этой области и хочу знать, как люди, не имеющие надежной статистики, подходят к этим проблемам.
Учитывая набор действительных чисел, наблюдаемых из эксперимента, скажем, они принадлежат одному из многих распределений (например, Вейбулл, Эрланг, Коши, Экспоненциальный и т.д.), есть ли какие-либо автоматические способы нахождения правильного распределения и параметры распределения данных? Есть ли хорошие учебники, которые меня проходят через этот процесс?
Сценарий реального мира: Например, предположим, что я инициировал небольшой опрос и записал информацию о том, сколько людей человек разговаривает каждый день, скажем 300 человек, и у меня есть следующая информация:
1 10
2 5
3 20
...
...
где X Y говорит мне, что человек X говорил с Y людьми в течение периода опроса. Теперь, используя информацию от 300 человек, я хочу подгонять это в модель. Вопрос сводится к тому, есть ли какие-либо автоматические способы определения правильных параметров распределения и распределения для этих данных, а если нет, есть ли пошаговая процедура для достижения того же?