Я хотел бы использовать R gsub для удаления всех знаков препинания из текста, кроме апострофов. Я новичок в регулярном выражении, но учусь.
Пример:
x <- "I like %[email protected]*&, chew;: gum, but don't like|}{[] [email protected]#^)( gum!?"
gsub("[[:punct:]]", "", as.character(x))
Токовый выход (нет апострофа, нет)
[1] "I like to chew gum but dont like bubble gum"
Желаемый результат (я хочу, чтобы апостроф не оставался)
[1] "I like to chew gum but don't like bubble gum"