Python конвертирует csv в xlsx

В этом сообщении есть пример Python для преобразования из csv в xls.

Однако мой файл имеет более 65536 строк, поэтому xls не работает. Если я назову файл xlsx, это не изменит ситуацию. Есть ли пакет Python для преобразования в xlsx?

Ответ 1

Вот пример использования xlsxwriter:

import os
import glob
import csv
from xlsxwriter.workbook import Workbook


for csvfile in glob.glob(os.path.join('.', '*.csv')):
    workbook = Workbook(csvfile[:-4] + '.xlsx')
    worksheet = workbook.add_worksheet()
    with open(csvfile, 'rt', encoding='utf8') as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                worksheet.write(r, c, col)
    workbook.close()

Кстати, есть также пакет openpyxl, который может читать/записывать файлы Excel 2007 xlsx/xlsm.

Надеюсь, это поможет.

Ответ 2

С моей библиотекой pyexcel,

 $ pip install pyexcel pyexcel-xlsx

Вы можете сделать это в одной командной строке:

from pyexcel.cookbook import merge_all_to_a_book
# import pyexcel.ext.xlsx # no longer required if you use pyexcel >= 0.2.2 
import glob


merge_all_to_a_book(glob.glob("your_csv_directory/*.csv"), "output.xlsx")

Каждый CSV будет иметь свой собственный лист, а имя будет его именем файла.

Ответ 3

from openpyxl import Workbook
import csv


wb = Workbook()
ws = wb.active
with open('test.csv', 'r') as f:
    for row in csv.reader(f):
        ws.append(row)
wb.save('name.xlsx')

Ответ 4

Добавление ответа, который использует исключительно библиотеку pandas для чтения в файле .csv и сохранения в виде файла .xlsx. В этом примере используются pandas.read_csv (ссылка на документы) и pandas.dataframe.to_excel (ссылка на документы).

Полностью воспроизводимый пример использует numpy только для генерации случайных чисел, и это можно удалить, если вы хотите использовать свой собственный файл .csv.

import pandas as pd
import numpy as np

# Creating a dataframe and saving as test.csv in current directory
df = pd.DataFrame(np.random.randn(100000, 3), columns=list('ABC'))
df.to_csv('test.csv', index = False)

# Reading in test.csv and saving as test.xlsx

df_new = pd.read_csv('test.csv')
writer = pd.ExcelWriter('test.xlsx')
df_new.to_excel(writer, index = False)
writer.save()

Ответ 5

Как я делаю это с openpyxl lib:

import csv
from openpyxl import Workbook

def convert_csv_to_xlsx(self):
    wb = Workbook()
    sheet = wb.active

    CSV_SEPARATOR = "#"

    with open("my_file.csv") as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                for idx, val in enumerate(col.split(CSV_SEPARATOR)):
                    cell = sheet.cell(row=r+1, column=idx+1)
                    cell.value = val

    wb.save("my_file.xlsx")

Ответ 6

Существует простой способ

import os
import csv
import sys

from openpyxl import Workbook

reload(sys)
sys.setdefaultencoding('utf8')

if __name__ == '__main__':
    workbook = Workbook()
    worksheet = workbook.active
    with open('input.csv', 'r') as f:
        reader = csv.reader(f)
        for r, row in enumerate(reader):
            for c, col in enumerate(row):
                for idx, val in enumerate(col.split(',')):
                    cell = worksheet.cell(row=r+1, column=c+1)
                    cell.value = val
    workbook.save('output.xlsx')