Я хочу создать модель, которая предсказывает будущую реакцию входного сигнала, архитектура моей сети - [3, 5, 1]:
- 3 входа,
- 5 нейронов в скрытом слое и
- 1 нейрон в выходном слое.
Мои вопросы:
- Должны ли мы иметь отдельный BIAS для каждого скрытого и выходного уровня?
- Должен ли мы назначать вес BIAS на каждом уровне (поскольку BIAS становится дополнительной ценностью для нашей сети и вызывают чрезмерную нагрузку на сеть)?
- Почему BIAS всегда настроен на единицу? Если eta имеет разные значения, почему мы не устанавливаем BIAS с разными значениями?
- Почему мы всегда используем лог-сигмоидную функцию для нелинейных функций, можем ли мы использовать tanh?