Подтвердить что ты не робот

Вставка строки в таблицу данных.

Если у меня есть фрейм данных

set.seed(12345) 
df=data.frame(a=rnorm(5),b=rnorm(5))

Я могу добавить строку, например,

df[6,] =c(5,6)

Если я теперь сделаю эквивалент в data.table

library(data.table)
dt=data.table(df)
dt[6,]=c(5,6)

Ошибка с ошибкой. Каков правильный способ вставки строки в таблицу данных?

4b9b3361

Ответ 1

Чтобы расширить ответ на @Franks, если в вашем конкретном случае вы добавляете строку, это:

set.seed(12345) 
dt1 <- data.table(a=rnorm(5), b=rnorm(5))

Следующие эквиваленты; Я считаю, что первое легче читать, но второе быстрее:

microbenchmark(
  rbind(dt1, list(5, 6)),
  rbindlist(list(dt1, list(5, 6)))        
  )

Как мы можем видеть:

                             expr     min      lq  median       uq     max
           rbind(dt1, list(5, 6)) 160.516 166.058 175.089 185.1470 457.735
 rbindlist(list(dt1, list(5, 6))) 130.137 134.037 140.605 149.6365 184.326

Если вы хотите вставить строку в другое место, будет работать следующее, но это не очень удобно:

rbindlist(list(dt1[1:3, ], list(5, 6), dt1[4:5, ]))

или даже

rbindlist(list(dt1[1:3, ], as.list(c(5, 6)), dt1[4:5, ]))

даяние:

            a          b
1:  0.5855288 -1.8179560
2:  0.7094660  0.6300986
3: -0.1093033 -0.2761841
4:  5.0000000  6.0000000
5: -0.4534972 -0.2841597
6:  0.6058875 -0.9193220

Если вы изменяете строку на месте (что является предпочтительным подходом), вам нужно заранее определить размер таблицы данных.

dt1 <- data.table(a=rnorm(6), b=rnorm(6))
set(dt1, i=6L, j="a", value=5) # refer to column by name
set(dt1, i=6L, j=2L, value=6) # refer to column by number

Спасибо @Boxuan, я изменил этот ответ, чтобы учесть ваше предложение, которое немного быстрее и легче читать.