Подтвердить что ты не робот

Дробная логит-модель в R

Я хотел бы оценить ковариационные эффекты на отклике, значения которого принимают значения в [0,1]. То есть значения переменной ответа находятся между 0-1 (включительно). Я хотел бы использовать дробную модель логита, описанную Papke и Wooldridge (1996), см. Ниже:

http://faculty.smu.edu/millimet/classes/eco6375/papers/papke%20wooldridge%201996.pdf

Есть ли функция R (или библиотека), чтобы облегчить оценку дробной модели логита? Могу ли я изменить glm() каким-то образом?

Отредактированный вопрос начинается здесь

Я ценю комментарий @Jibler - это получается в оцененной бета-версии из дробной модели логита. Однако, как отметил @Ben, SE не будет правильно оценена с учетом этой спецификации.

Я полагаю, что это более популярная модель в экономике, поэтому она хорошо обсуждается участниками журнала STATA: http://fmwww.bc.edu/EC-C/S2013/823/EC823.S2013.nn06.slides.pdf http://www.stata.com/meeting/germany10/germany10_buis.pdf

Мне удалось получить данные из примера плана Papke и Wooldridge 401k (см. ниже). По-видимому, мне кажется, что устойчивость в дробной логит-модели получена с помощью сэндвич-оценки дисперсионного уравнения (9) Папке и Вуолдриджа. Тем не менее, уравнение (10) продолжает демонстрировать, как устойчивость может быть также получена путем предварительного умножения оцененной матрицы vcov на стандартную привязку glm(...,family=binomial(link=logit)) на оценку остатков Пирсона.

Слайды Buis, похоже, реализуют форму sandwich() дробной логит-оценки с использованием аргумента vce (надежного). Они точно выравниваются с применением функции sandwich() в R, до стандартного биномиального GLM. Я предполагаю, но не уверен, поскольку я не являюсь STATA wiz, что это то же самое, что аргумент Баума просто robust? Если кто-то владеет STATA и может проверить, что это будет полезно. Модель, представленная family=quasibinomial GLM, дает очень немного разные оценки SE. Но это тоже кажется разумной оценкой как параметров средней/дисперсии дробной модели логита.

Ниже приведен некоторый R-код, который реплицирует соответствие данных, приведенное выше в статье Buis (он также показывает, как квазибиномальная модель дает несколько разные оценки SE):

##
## Replicate what some STATA Journal editors call "fractional logit"
## get data from: "http://fmwww.bc.edu/repec/bocode/k/k401.dta" 
##
library(sandwich)
library(foreign)

X <- read.dta("F:/ProportionsDepVar/k401.dta")
class(X)
names(X)
dim(X)
X$totemp1 <- X$totemp/10000

glmfit <- glm(prate ~ mrate + totemp1 + age + sole, family=binomial(link=logit), data=X)
summary(glmfit)

##
## And the SE are off here and biased large
## Use sandwich estimator instead
##
sand_vcov <- sandwich(glmfit)
sand_se <- sqrt(diag(sand_vcov))
robust_z <- glmfit$coef/sand_se
robust_z

##
## Quasi binomial fit is close to replicating SE's
##
flogit1 <- glm(prate ~ mrate + totemp1 + age + sole, family=quasibinomial(link=logit), data=X)
summary(flogit1)

Итак... спасибо @Ben за полезные предложения. Я полагаю, что библиотека family=quasibinomial или sandwich хорошо справляется с оценкой надежного SE для дробной логитной модели в R (как определено уравнениями (9) или (10) Папке и Вулдридж). Цените комментарии/критику, если этот вывод неверен.

4b9b3361