У меня возникли проблемы с поиском библиотеки, которая позволяет писать файлы Parquet с использованием Python. Бонусные очки, если я могу использовать Snappy или аналогичный механизм сжатия в сочетании с ним.
До сих пор единственным методом, который я нашел, является использование Spark с поддержкой pyspark.sql.DataFrame
Parquet.
У меня есть некоторые скрипты, которые должны писать файлы Parquet, которые не являются заданиями Spark. Есть ли подход к написанию файлов Parquet в Python, который не включает pyspark.sql
?