Я создаю простую систему рекомендаций для БД MovieLens, вдохновленную https://databricks-training.s3.amazonaws.com/movie-recommendation-with-mllib.html.
У меня также есть проблемы с явным обучением, как здесь: Результаты совместной фильтрации Apache Spark ALS. Они не имеют смысла Использование неявного обучения (как по явным, так и неявным данным) дает мне разумные результаты, но явное обучение не делает.
Пока это нормально для меня, мне любопытно, как обновить модель. Хотя мое текущее решение работает как
- со всеми оценками пользователей
- создать модель
- Получить рекомендации для пользователя
Я хочу иметь такой поток:
- с базой оценок
- создать модель один раз (дополнительно сохранить и загрузить ее)
- получить некоторые оценки от одного пользователя в 10 случайных фильмах (не в модели!)
- получить рекомендации с использованием модели и новых оценок пользователей
Поэтому я должен обновить свою модель, не полностью перепродав ее. Есть ли шанс сделать это?
В то время как первый способ хорош для пакетной обработки (например, генерации рекомендаций в ночных партиях), второй способ был бы хорош для почти живых выработки рекомендаций.