У меня есть dataframe с примерно 155 000 строк и 12 столбцов. Если я экспортирую его в csv с помощью dataframe.to_csv, вывод будет 11 МБ файлом (который создается мгновенно).
Если, однако, я экспортирую на Microsoft SQL Server с помощью метода to_sql, это занимает от 5 до 6 минут! Нет столбцов - это текст: только int, float, bool и даты. Я видел случаи, когда драйверы ODBC устанавливают nvarchar (max), и это замедляет передачу данных, но это не может быть здесь.
Любые предложения о том, как ускорить процесс экспорта? Взятие 6 минут для экспорта 11 МБ данных делает соединение ODBC практически непригодным.
Спасибо!
Мой код:
import pandas as pd
from sqlalchemy import create_engine, MetaData, Table, select
ServerName = "myserver"
Database = "mydatabase"
TableName = "mytable"
engine = create_engine('mssql+pyodbc://' + ServerName + '/' + Database)
conn = engine.connect()
metadata = MetaData(conn)
my_data_frame.to_sql(TableName,engine)