Я создаю некоторые предсказательные модели на Python и использую scikits для изучения реализации SVM. Это было действительно здорово, просто в использовании и относительно быстро.
К сожалению, я начинаю сдерживать свое время выполнения. Я запускаю SVB SVG на полный набор данных около 4 - 5000 с 650 функциями. Каждый прогон занимает около минуты. Но с 5-кратным перекрестным валидацией + поиск сетки (с использованием грубого мелкого поиска), это становится немного неосуществимым для моей задачи. Как правило, есть ли у людей какие-либо рекомендации в отношении самой быстрой реализации SVM, которую можно использовать в Python? Это или любые способы ускорить мое моделирование?
Я слышал о реализации GPU LIBSVM, который кажется, что он может работать. Я не знаю каких-либо других реализаций SVM для GPU, используемых в Python, но он определенно был бы открыт для других. Кроме того, использование графического процессора значительно увеличивает время выполнения?
Я также слышал, что есть способы аппроксимировать SVM rbf, используя линейную карту объектов SVM + в scikits. Не уверен, что люди думают об этом подходе. Опять же, любой, кто использует этот подход, является ли это значительным увеличением времени выполнения?
Все идеи для увеличения скорости программы приветствуются.