Подтвердить что ты не робот

Что такое размер партии в Caffe или convnets

Я думал, что размер партии зависит только от производительности. Чем больше партия, тем больше времени вычисляется больше изображений для обучения моей сети. Но я понял, что если я изменю размер партии, моя чистая точность улучшится. Поэтому я не понял, какой размер партии. Может кто-нибудь объяснить мне, что такое размер партии?

4b9b3361

Ответ 1

Caffe обучается с помощью Stochastic-Gradient-Descend (SGD): то есть на каждой итерации он вычисляет (стохастический) градиент параметров по данным обучения и делает движение (= изменение параметров) в направлении градиента.
Теперь, если вы напишете уравнения градиента w.r.t. учебные данные, вы заметите, что для того, чтобы точно вычислить градиент, вам нужно оценить все ваши данные обучения на каждой итерации: это непомерно много времени, особенно когда данные обучения становятся все больше и больше.
Чтобы преодолеть это, SGD аппроксимирует точный градиент стохастическим путем путем отбора только небольшой части данных обучения на каждой итерации. Эта небольшая часть - партия.
Таким образом, чем больше размер партии, тем точнее оценка градиента на каждой итерации.

TL; DR: размер партии влияет на точность оцененного градиента на каждой итерации, изменяя размер партии, поэтому влияют на "путь", который требует оптимизация, и могут изменять результаты учебного процесса.