У меня есть кадр данных в R, определяемый следующим образом:
кадр данных:
col 1 col 2 col 3 col4
200 AIG 8.5 12
800 AIG 8.1 20.1
500 A1B 20 50.5
800 A1B 12 30
120 A2M 1.6 8.5
dat <- structure(list(col1 = c(200, 800, 500, 800, 120), col2 = structure(c(3L,
3L, 1L, 1L, 2L), .Label = c("A1B", "A2M", "AIG"), class = "factor"),
col3 = c(8.5, 8.1, 20, 12, 1.6), col4 = c(12, 20.1, 50.5,
30, 8.5)), .Names = c("col1", "col2", "col3", "col4"), row.names = c(NA,
-5L), class = "data.frame")
Затем я хотел бы свернуть строки по id (в этом случае единственными идентификаторами являются A1G, A1B, A2M).
Col 1, я хотел бы свернуть его, добавив строки с одним и тем же идентификатором.
Col 2, я хотел бы свернуть его на каждый уникальный id
Col 3, я хотел бы свернуть его следующим образом: возьмите col1 * col3, добавьте их, а затем разделите их на сумму col1.
I.e., значение новой строки A1G должно быть (8.5 * 20 + 8.1 * 80)/(80 + 20). Aka средневзвешенное значение столбца 3, взвешенное значениями col1.
Col 4, я хотел бы взять максимальное значение.
Результирующий кадр данных должен выглядеть так:
column 1 column 2 column 3 column 4
800+200=1000 AIG (8.5*200+8.1*800)/1000=8.18 max(12,20.1)=20.1
800+500=1300 AIB (20*800+12*500)/1300=16.9 max(50.5, 30)=50.5
120 A2M 1.6 8.5
Любые предложения?