Я работаю над проектом, включающим очистку списка данных по специальностям колледжа. Я считаю, что много ошибок написано, поэтому я искал функцию gsub()
, чтобы заменить орфографические ошибки правильной орфографией. Например, скажем, "biolgy" ошибочно написана в списке майоров майора. Как я могу заставить R обнаружить орфографию и заменить ее правильной орфографией? Я пробовал gsub('biol', 'Biology', Major)
, но это только заменяет первые четыре буквы в "biolgy". Если я делаю gsub('biolgy', 'Biology', Major)
, он работает только для одного случая, но не обнаруживает других форм орфографии "биологии".
Спасибо!