Я создаю нейронную сеть, используя метод backpropagation для обучения.
Я понимаю, что нам нужно найти производную от используемой функции активации. Я использую стандартную сигмоидную функцию
f(x) = 1 / (1 + e^(-x))
и я видел, что его производная
dy/dx = f(x)' = f(x) * (1 - f(x))
Это может быть глупый вопрос, но означает ли это, что мы должны передавать x через сигмоидную функцию дважды во время уравнения, поэтому он будет расширяться до
dy/dx = f(x)' = 1 / (1 + e^(-x)) * (1 - (1 / (1 + e^(-x))))
или просто нужно взять уже рассчитанный вывод f(x)
, который является выходом нейрона, и заменить это значение для f(x)
?