Как рассчитать эти статистические данные?

Я пишу приложение, чтобы помочь некоторым исследованиям, и часть этого включает в себя некоторые статистические вычисления. В настоящее время исследователи используют программу под названием SPSS. Часть результата, который им нравится, выглядит следующим образом:

Они действительно обеспокоены значениями F и Sig.. Моя проблема в том, что у меня нет фона в статистике, и я не могу понять, какие вызовы вызывают или как их вычислять.

Я думал, что значение F может быть результатом F-test, но после выполнения шагов, указанных в Википедии, я получил результат, отличный от того, что дает SPSS.

Ответ 1

Этот веб-сайт может помочь вам немного больше. Также этот.

Я работаю с довольно ржавой памятью курса статистики, но здесь ничего не получается:

Когда вы выполняете анализ дисперсии (ANOVA), вы фактически вычисляете статистику F как отношение от среднеквадратичных отклонений "между группами" и среднеквадратичных отклонений "внутри групп". Вторая ссылка выше кажется довольно хорошей для этого расчета.

Это позволяет статистике F точно точно влиять на вашу модель, поскольку дисперсия "между группами" является объяснительной, а дисперсия "внутри групп" является случайной ошибкой. Высокий F подразумевает очень значительную модель.

Как и во многих статистических операциях, вы возвращаете Sig. используя статистику F. Здесь, где ваша информация в Википедии поставляется немного под рукой. То, что вы хотите сделать, - использование степеней свободы, предоставляемых вам SPSS, - найти правильное значение P, при котором таблица F будет давать вы рассчитываете F-статистику. Значение P, где это происходит [F (таблица) = F (вычисленное)], является значением.

Концептуально меньшее значение значимости показывает очень сильную способность отклонять нулевую гипотезу (которая для этих целей означает, что ваша модель имеет объяснительную силу).

Извините, если кто-либо из них ошибается. Я вернусь, чтобы внести изменения!

Удачи вам. Статистика - это весело, возможно, не эта часть. =)

Ответ 2

Я полагаю из вашего вопроса, что ваши коллеги-исследователи хотят автоматизировать процесс, посредством которого выполняются определенные статистические анализы (т.е. они хотят группировать наборы данных процесса). У вас есть два варианта:

1) SPSS теперь доступен для сценариев через python (начиная с версии 15) - перейдите на spss.com и выполните поиск python. Вы можете писать скрипты python для автоматизации анализа данных и извлечения ключевых значений из сводных таблиц, а затем обрабатывать ответы любым способом. Это позволяет точно сравнивать результаты с вашим python script и затраченные вручную усилия в SPSS ваших сотрудников. Таким образом, вам не нужно будет действительно знать какую-либо статистику для выполнения этой работы (что является ключевым преимуществом)

2) Вы можете сделать это в R, свободной статистической среде, которая, вероятно, может быть написана сценарием. Это имеет тот недостаток, что вам придется изучать статистику, чтобы убедиться, что вы делаете это правильно.

Ответ 3

Статистика сложная:-). После года чтения и перечитания книг и документов и могу только с уверенностью сказать, что я понимаю его основные принципы.

Возможно, вы захотите исследовать готовые библиотеки для любого языка программирования, который вы используете, потому что они много полезны в математике в целом и в частности статистики (ошибки округления являются очевидным примером).

В качестве примера вы можете посмотреть проект R, который является одновременно интерактивной средой и библиотекой, которую вы можете использовать из ваш код на С++, распространяемый под GPL (т.е. если вы используете его только внутри страны и публикуете только результаты, вам не нужно открывать свой код).

Ответ 4

Короче: не делайте этого вручную, связывайте/используйте существующее программное обеспечение. И ответ sain_grocen неверен.: (

Это все тесты для значимости оценок параметров, которые обычно используются в многорежимном ответе "Множественные регрессии". Это не было бы простым способом сделать это вне среды статистического программирования. Я бы предложил либо получить вывод из ранее существовавшей статистической программы, либо использовать тот, с которым вы можете ссылаться и использовать этот код.

Я боюсь, что первый ответ (sain_grocen's) приведет вас к неправильному пути. Его объяснение, скорее всего, является особым случаем того, с чем вы на самом деле имеете дело. Анова объяснила в своих ссылках, что для одного ответного ответа в сбалансированном дизайне. Это не статистика F, которую вы видите. Имена в вашем выпуске (Pillai Trace, Hotelling Trace,...) - это некоторые из доступных многомерных версий. Они имеют F-распределения при определенных предположениях. Я не могу объяснить учебники, в которых стоит материал, я бы посоветовал вам начать с рассмотрения "Прикладной многомерный статистический анализ" Джонсона и Вичерна

Ответ 5

Можете ли вы объяснить, почему сам SPSS не является прекрасным решением проблемы? Это то, что он генерирует сводные таблицы как выходные данные, которые трудно манипулировать? Это стоимость программы?

F-статистика может возникать из любого числа конкретных тестов. F является просто распределением (свободно: описание "частот" групп значений), как нормальный (гауссовский) или униформа. В целом они возникают из-за соотношения дисперсий. Мнение: многие статистики (включая меня), считают, что тесты на основе F нестабильны (жаргон: ненадежный).

Конкретная статистика выхода (трасса Пиллаи и т.д.) предполагает, что исходный анализ представляет собой пример MANOVA, который, как описывают другие плакаты, является сложной и труднодоступной процедурой.

Я также предполагаю, что, основываясь на MANOVA и использовании SPSS, это проект психологии или социологии... если не пожалуйста, просветите. Возможно, другие более простые модели могут быть легче понятны и более повторяемы. Проконсультируйтесь с вашей местной статистической консультационной группой, если таковой имеется.

Удачи!

Ответ 6

Здесь объясняется вывод MANOVA с очень хорошего сайта по статистике и SPSS:

Результат с объяснением: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Как и почему делать MANOVA или многомерный GLM: (тот же путь, что и выше, но заканчивается в '/manova.htm')

Написание программного обеспечения с нуля для расчета этих результатов будет как продолжительным, так и сложным; существует множество числовых задач и инверсии матриц.

Как сказал Генри, используйте скрипты Python или R. Я бы предложил работать с кем-то, кто знает SPSS, если скрипты. Кроме того, сам SPSS способен экспортировать выходные таблицы в файлы с помощью OMS. A script в SPSS может сделать это.

Узнайте, кто в вашей исследовательской группе знает SPSS и работает с ними.