Я пытаюсь загрузить CSV файл в таблицу Hive, например:
CREATE TABLE mytable
(
num1 INT,
text1 STRING,
num2 INT,
text2 STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ",";
LOAD DATA LOCAL INPATH '/data.csv'
OVERWRITE INTO TABLE mytable;
Csv разделяется запятой (,) и выглядит следующим образом:
1, "some text, with comma in it", 123, "more text"
Это приведет к возврату поврежденных данных, поскольку в первой строке есть символ ",".
Есть ли способ установить разделитель текста или заставить Hive игнорировать "," в строках?
Я не могу изменить разделитель csv, поскольку он извлекается из внешнего источника.