Я планирую использовать один из файлов формата hadoop для моего проекта, связанного с hadoop. Я понимаю паркет эффективен для запросов на основе столбцов и avro для полного сканирования или когда нам нужны все данные столбцов!
Прежде чем продолжить и выберите один из форматов файлов, я хочу понять, каковы недостатки/недостатки одного из них. Может ли кто-нибудь объяснить это мне простыми словами?