У меня есть довольно большой файл CSV (15 Гб), и мне нужно прочитать около 1 миллиона случайных строк. Насколько я могу видеть - и реализовать - утилита CSV в Python только позволяет последовательно итератировать в файле.
Очень много памяти, чтобы прочитать весь файл в памяти, чтобы использовать какой-то случайный выбор, и очень много времени, чтобы пройти через весь файл и отбросить некоторые значения и выбрать другие, поэтому есть в любом случае выбор случайного строка из файла CSV и читать только эту строку?
Я пробовал без успеха:
import csv
with open('linear_e_LAN2A_F_0_435keV.csv') as file:
reader = csv.reader(file)
print reader[someRandomInteger]
Пример файла CSV:
331.093,329.735
251.188,249.994
374.468,373.782
295.643,295.159
83.9058,0
380.709,116.221
352.238,351.891
183.809,182.615
257.277,201.302
61.4598,40.7106