Меня интересуют python mining
массивы данных, слишком большие, чтобы сидеть в ОЗУ, но сидеть в одном HD.
Я понимаю, что я могу экспортировать данные в виде hdf5
файлов, используя pytables
. Кроме того, numexpr
допускает некоторые базовые вычисления вне ядра.
Что будет дальше? Мини-дозирование, когда это возможно, и полагаться на результаты линейной алгебры, чтобы разложить вычисление, когда мини-пакет не может быть использован?
Или есть некоторые инструменты более высокого уровня, которые я пропустил?
Спасибо за понимание,