Я прохожу через класс ML на Coursera по логистической регрессии, а также в Manning Book Machine Learning в действии. Я пытаюсь учиться, реализуя все в Python.
Я не могу понять разницу между функцией стоимости и градиентом. В сети есть примеры, где люди вычисляют функцию стоимости, а затем есть места, где они этого не делают, и просто идут с функцией спуска градиента w :=w - (alpha) * (delta)w * f(w)
.
В чем разница между двумя, если они есть?