У меня есть неструктурированные данные, которые выглядят так:
data <- c("24-March-2017 product 1 color 1",
"March-2017-24 product 2 color 2",
"2017-24-March product 3 color 3")
Я хотел бы подсчитать количество пробелов между датой и первым символом (столбцом продукта) для каждой строки. Как показано в образце данных, формат даты может отличаться. Эта информация будет использоваться для размещения данных в структурированном формате.
Каков наилучший способ выполнить это в R? Я полагаю, что gsub
можно использовать в этом случае, просто не уверен, как применять для подсчета только числа пробелов в начале каждой строки.