Подтвердить что ты не робот

Существуют ли известные службы для проверки файла CSV?

Есть ли хорошие сайты/службы для проверки соответствия CSV файла?

То же, что W3C валидатор, но для CSV?

4b9b3361

Ответ 1

Недавно я столкнулся с Google Refine - это не служба для проверки файлов CSV, это инструмент, который вы загружаете локально, но он предоставляет множество инструментов для работы с данными и обнаружения аномалий.

http://code.google.com/p/google-refine/

Как упоминалось в ответе, "CSV" стал неопределенным термином, главным образом потому, что люди не следуют One True Way при использовании данных, разделенных разделителями

http://www.catb.org/~esr/writings/taoup/html/ch05s02.html

EDIT/UPDATE (2016-08-09):
CSV в настоящее время становится четко определенным термином рабочей группой W3C CSV

Ответ 2

Открытый институт данных разрабатывает службу проверки CSV, которая позволит пользователям проверять структуру своих данных, а также проверять ее на простую схему.

Сервис по-прежнему очень важен для альфы, но можно найти здесь:

http://csvlint.io/

Код приложения и базовая библиотека являются открытыми:

https://github.com/theodi/csvlint

https://github.com/theodi/csvlint.rb

README в библиотеке предоставляет сводку ошибок и предупреждений, которые могут быть сгенерированы. Можно сообщить о следующих типах ошибок:

  • :wrong_content_type - тип содержимого не является текстом /csv
  • :ragged_rows - строка имеет различное количество столбцов (чем первая строка в файле)
  • :blank_rows - полностью пустая строка, например. пустую строку или строку, где все значения столбца пусты.
  • :invalid_encoding - ошибка кодирования при разборе строки, например. из-за недопустимых символов
  • :not_found - ошибка HTTP 404 при извлечении данных
  • :quoting - проблема с цитированием, например. отсутствующая или нецензурная цитата, незакрытое цитированное поле
  • :whitespace - цитируемый столбец имеет ведущие или завершающие пробелы

Можно сообщить о следующих типах предупреждения:

  • :no_encoding - заголовок Content-Type, возвращаемый в HTTP-запросе, не имеет параметра charset
  • :encoding - набор символов не UTF-8
  • :no_content_type - файл подается без заголовка Content-Type
  • :excel - нет заголовка Content-Type и расширения файла .xls
  • :check_options - Файл CSV содержит только один столбец
  • :inconsistent_values - несогласованные значения в одном столбце. Сообщается, если и 90% значений, похоже, имеют одинаковый тип данных (числовой или буквенно-цифровой, включая пунктуацию).

Ответ 3

Национальный архив разработал Язык схемы CSV и CSV Validator, программное обеспечение, написанное на Java. Это с открытым исходным кодом.