Мне нужно проанализировать файлы CSV и TSV. Я не могу полагаться на пользователей, чтобы узнать разницу, поэтому я хотел бы не просить пользователя выбрать тип. Есть ли простой способ определить, какой разделитель используется?
Один из способов - прочитать в каждой строке и подсчитать как вкладки, так и запятые и узнать, что наиболее последовательно используется в каждой строке. Разумеется, данные могут включать запятые или вкладки, поэтому это может быть проще сказать, чем сделать.
Изменить: Другим интересным аспектом этого проекта является то, что мне также нужно будет обнаружить схему файла, когда я его прочитаю, потому что он может быть одним из многих. Это означает, что я не буду знать, сколько полей у меня есть, пока я не смогу его разобрать.