В большинстве моделей есть параметр шагов, указывающий количество шагов для выполнения данных. Но, тем не менее, я вижу в большинстве практических применений, мы также выполняем функцию соответствия N эпох.
В чем разница между запуском 1000 шагов с 1 эпохой и запуском 100 шагов с 10 эпохой? Какой из них лучше на практике? Любая логика меняется между последовательными эпохами? Перетасовка данных?