У меня есть текстовый файл 371 МБ, содержащий данные микро РНК. По сути, я хотел бы выделить только те строки, которые содержат информацию о микроРНК человека.
Я прочитал в файле, используя read.table. Обычно, я бы выполнил то, что я хотел бы с sqldf, - если у него был синтаксис "как" (выберите * from < > где miRNA, как "hsa" ). К сожалению - sqldf не поддерживает этот синтаксис.
Как я могу это сделать в R? Я просмотрел stackoverflow и не вижу примера , как я могу выполнить частичное совпадение строк. Я даже установил пакет stringr, но у него не совсем то, что мне нужно.
Что бы я хотел сделать, это что-то вроде этого: там, где выбраны все строки, где hsa- *.
selectedRows <- conservedData[, conservedData$miRNA %like% "hsa-"]
что, конечно, является неправильным синтаксисом.
Может кто-нибудь, пожалуйста, помогите мне с этим? Большое спасибо за чтение.
Асда