Подтвердить что ты не робот

Замените список значений другим в R

У меня есть dataframe с любым из этих значений.

from=c("A","C","G","T","R","Y","M","K","W", "S","N")

и я хочу соответственно заменить

to=c("AA","CC","GG","TT","AG","CT","AC","GT","AT", "CG","NN")

Каков наилучший способ сделать это, перебрать все значения, которые нужно заменить? или петлю над положением матрицы. или любое другое решение?

dd<-matrix(sample(from, 100, replace=TRUE), 10) 

dd
      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,] "K"  "S"  "G"  "T"  "R"  "N"  "A"  "C"  "W"  "M"  
 [2,] "Y"  "K"  "S"  "G"  "T"  "R"  "N"  "A"  "C"  "W"  
 [3,] "M"  "Y"  "K"  "S"  "G"  "T"  "R"  "N"  "A"  "C"  
 [4,] "W"  "M"  "Y"  "K"  "S"  "G"  "T"  "R"  "N"  "A"  
 [5,] "C"  "W"  "M"  "Y"  "K"  "S"  "G"  "T"  "R"  "N"  
 [6,] "A"  "C"  "W"  "M"  "Y"  "K"  "S"  "G"  "T"  "R"  
 [7,] "N"  "A"  "C"  "W"  "M"  "Y"  "K"  "S"  "G"  "T"  
 [8,] "R"  "N"  "A"  "C"  "W"  "M"  "Y"  "K"  "S"  "G"  
 [9,] "T"  "R"  "N"  "A"  "C"  "W"  "M"  "Y"  "K"  "S"  
[10,] "G"  "T"  "R"  "N"  "A"  "C"  "W"  "M"  "Y"  "K"

Я использовал loop over all from to to.

myfunc<-function(xx){

  from=c("A","C","G","T","R","Y","M","K","W", "S","N");
  to=c("AA","CC","GG","TT","AG","CT","AC","GT","AT", "CG","NN");
  for (i in 1:11){
      xx[xx==from[i]]<-to[i];
  }
  return(xx);
}

он отлично справился с малой матрицей, но для большой матрицы занимает много времени. Любое эффективное решение?

Спасибо

4b9b3361

Ответ 1

Создать карту

map = setNames(to, from)

и перейти от A к B

dd[] = map[dd]

Карта служит для поиска, связывая имена "from" с значениями "to". Назначение сохраняет размерность матрицы и dimnames.

Ответ 2

matrix(to[match(dd,from)], nrow=nrow(dd))

match возвращает вектор без измерений, поэтому вам нужно воссоздать матрицу.

Ответ 3

Я использовал аналогичный цикл в качестве OP и приурочил решения. Теодор один быстрее с небольшим отрывом, но Мартин очень читаем.

dd<-matrix(sample(from, 100, replace = TRUE),10,10)
ddr <- dd
ddm <- dd
ddt <- dd

benchmark(roman = {
  for (i in 1:length(from)) {
    ddr[ddr == from[i]] <- to[i]
  }},
  martin = {
    map = setNames(to, from)
    ddm[] = map[dd]
  },
theodore = {ddt <- matrix(to[match(dd,from)], nrow=nrow(dd))},
          replications = 100000
)
      test replications elapsed relative user.self sys.self user.child sys.child
2   martin       100000    1.93    1.191      1.91        0         NA        NA
1    roman       100000    8.23    5.080      8.11        0         NA        NA
3 theodore       100000    1.62    1.000      1.61        0         NA        NA