Для проекта ai-class мне нужно реализовать алгоритм обучения подкрепления, который превосходит простую игру тетриса. Игра написана на Java, и у нас есть исходный код. Я знаю основы теории обучения подкреплениям, но мне было интересно, есть ли у кого-либо в сообществе SO опыт работы с подобными вещами.
- Какими будут ваши рекомендуемые чтения для внедрения усиленного обучения в тетрисовой игре?
- Есть ли хорошие проекты с открытым исходным кодом, которые выполняют похожие вещи, которые стоит проверить?
Изменить: чем конкретнее, тем лучше, но общие ресурсы по теме приветствуются.
Последующие действия:
Думал, было бы неплохо, если бы я опубликовал последующий отчет.
Здесь решение (код и запись) у меня получилось для будущих студентов:).