Мне интересно, есть ли способ загрузить CSV-данные в бинарный формат Hive - то есть сделать то же самое, что и загрузка данных в реляционной базе данных: разбор и преобразование типа ввода и сохранение его в двоичном формате ( в другом двоичном файле в случае Hive). В ссылке Hive указано, что команда load data inpath
не выполняет "никакого преобразования", поэтому я подозреваю, что типы не преобразуются, например, из строки в целое. Я читал о форматах OCR и RCFile, но мне не удалось выяснить, являются ли, например, строковые значения из CSV, преобразованными в числовые значения машин и хранятся в HDFS. Это так? Какие еще существуют возможности для создания двоичных представлений CSV файлов в Hive?
В соответствующей заметке: Я подозреваю, что Hive преобразовывает строковые значения в представления машин во время обработки запроса и не является, например, сравнивает строковые значения - это предположение правильно?