Это первый раз, когда я отправляю сообщение на этот форум, и я хочу сказать с самого начала, что я не квалифицированный программист. Поэтому, пожалуйста, дайте мне знать, если вопрос или код неясны!
Я пытаюсь получить 95% -ный доверительный интервал (CI) для взаимодействия (то есть моя тестовая статистика), выполнив загрузку. Я использую пакет "boot". Моя проблема заключается в том, что для каждого пересчета я хотел бы, чтобы рандомизация выполнялась внутри предметов, так что наблюдения от разных предметов не смешивались. Вот код для генерации dataframe, подобный моему. Как вы можете видеть, у меня есть два фактора внутри предмета ( "Num" и "Gram", и меня интересует взаимодействие между ними):
Subject = rep(c("S1","S2","S3","S4"),4)
Num = rep(c("singular","plural"),8)
Gram = rep(c("gram","gram","ungram","ungram"),4)
RT = c(657,775,678,895,887,235,645,916,930,768,890,1016,590,978,450,920)
data = data.frame(Subject,Num,Gram,RT)
Это код, который я использовал для получения значения эмпирического взаимодействия:
summary(lm(RT ~ Num*Gram, data=data))
Как вы можете видеть, взаимодействие между двумя моими факторами составляет -348. Я хочу получить доверительный интервал загрузки для этой статистики, который я могу создать с помощью пакета "boot":
# You need the following packages
install.packages("car")
install.packages("MASS")
install.packages("boot")
library("car")
library("MASS")
library("boot")
#Function to create the statistic to be boostrapped
boot.huber <- function(data, indices) {
data <- data[indices, ] #select obs. in bootstrap sample
mod <- lm(RT ~ Num*Gram, data=data)
coefficients(mod) #return coefficient vector
}
#Generate bootstrap estimate
data.boot <- boot(data, boot.huber, 1999)
#Get confidence interval
boot.ci(data.boot, index=4, type=c("norm", "perc", "bca"),conf=0.95) #4 gets the CI for the interaction
Моя проблема заключается в том, что я считаю, что рекомплексы должны генерироваться без смешивания наблюдений отдельных предметов, т.е. для создания новых образцов, наблюдения от субъекта 1 (S1) следует перетасовывать в рамках предмета 1, не смешивая их с наблюдения из предметов 2 и т.д. Я не знаю, как "загрузка" выполняет повторную выборку (я прочитал документацию, но не понимаю, как это работает)
Кто-нибудь знает, как я могу убедиться, что процедура передискретизации, используемая "загрузкой", относится к информации об уровне предмета?
Большое спасибо за вашу помощь/совет!