Я лично изучал теории нейронной сети и задавал некоторые вопросы.
Во многих книгах и ссылках для активации функции скрытого слоя использовались гиперкасательные функции.
Книги пришли по-настоящему простой причине, что линейные комбинации tanh-функций могут описывать почти всю форму функций с заданной ошибкой.
Но возник вопрос.
- Это реальная причина, по которой используется функция tanh?
- Если тогда, это единственная причина, по которой используется функция tanh?
- если тогда, является ли функция tanh единственной функцией, которая может это сделать?
- если нет, что такое настоящая причина?..
Я имею в виду, продолжайте думать... пожалуйста, помогите мне из этой умственной (?...) ловушки!