У меня есть два набора данных, которые должны быть одного размера, но не являются. Мне нужно обрезать значения из A, которые не находятся в B, и наоборот, чтобы исключить шум из графика, который входит в отчет. (Не беспокойтесь, эти данные не удаляются навсегда!)
Я прочитал следующее:
- Выбор столбцов в кадре данных R на основе этих * не * в векторе
- http://www.ats.ucla.edu/stat/r/faq/subset_R.htm
- Как объединить несколько условий для подмножества кадрового фрейма с использованием "OR" ,
Но я все еще не могу заставить это работать правильно. Здесь мой код:
bg2011missingFromBeg <- setdiff(x=eg2011$ID, y=bg2011$ID)
#attempt 1
eg2011cleaned <- subset(eg2011, ID != bg2011missingFromBeg)
#attempt 2
eg2011cleaned <- eg2011[!eg2011$ID %in% bg2011missingFromBeg]
Первая попытка просто исключает первое значение в результирующем векторе setdiff. Вторая попытка дает и громоздкую ошибку:
Error in `[.data.frame`(eg2012, !eg2012$ID %in% bg2012missingFromBeg)
: undefined columns selected