Подтвердить что ты не робот

R: объединить несколько наборов данных

У меня есть 3 набора данных, которые я хочу связать вместе. Я переименовал свои столбцы в одно и то же:

names(DF1) <- c("A", "B", "C")
names(DF2) <- c("A", "B", "C")
names(DF3) <- c("A", "B", "C")

У каждого из них разное количество наблюдений (34, 54, 23 соответственно)

Однако, когда я пытаюсь использовать функцию rbind, он возвращает ошибку:

total <- rbind(DF1, DF2, DF3)

Error in match.names(clabs, names(xi)) : 
  names do not match previous names

Из других ответивших вопросов ошибка должна возникнуть из-за столбцов с иными именами, но я проверил и перепроверил, что они были переименованы.

Я хотел бы получить полный набор данных с общим количеством 111 наблюдений с названиями столбцов. Я новичок в R, поэтому многие ответы из других вопросов ускользают от меня. Кто-нибудь сможет ответить на этот вопрос неспециалистом?

4b9b3361

Ответ 1

Вы можете использовать do.call, например:

do.call("rbind", list(DF1, DF2, DF3))

Обратите внимание, что второй аргумент do.call - это список.

Ответ 2

Это может помочь вам:

Вы можете использовать пакет rbind.fill из plyr (может использоваться, даже если имя столбца не совпадает)

Вот пример из набора данных в пакете optmatch в R

library(optmatch)
 library(plyr)
data(nuclearplants)
x<-nuclearplants
data1<-as.data.frame(x$cost)
data1<-data1[1:20,]
data1<-as.data.frame(data1)
data2<-as.data.frame(x$date)
rbind.fill(data1,data2)

data1    x$date
1  460.05     NA
2  452.99     NA
3  443.22     NA
4  652.32     NA
5  642.23     NA
6  345.39     NA
7  272.37     NA
8  317.21     NA
9  457.12     NA
10 690.19     NA
11 350.63     NA
12 402.59     NA
13 412.18     NA
14 495.58     NA
15 394.36     NA
16 423.32     NA
17 712.27     NA
18 289.66     NA
19 881.24     NA
20 490.88     NA
21     NA  68.58
22     NA  67.33
23     NA  67.33
24     NA  68.00
25     NA  68.00
26     NA  67.92
27     NA  68.17
28     NA  68.42
29     NA  68.42
30     NA  68.33
31     NA  68.58
32     NA  68.75
33     NA  68.42
34     NA  68.92
35     NA  68.92
36     NA  68.42
37     NA  69.50
38     NA  68.42
39     NA  69.17
40     NA  68.92
41     NA  68.75
42     NA  70.92
43     NA  69.67
44     NA  70.08
45     NA  70.42
46     NA  71.08
47     NA  67.25
48     NA  67.17
49     NA  67.83
50     NA  67.83
51     NA  67.25
52     NA  67.83

Ответ 3

Для повышения производительности попробуйте rbindlist из пакета data.table, например.

rbindlist(list(DF1,DF2,DF3))