Мне нужно тренировать сеть, чтобы умножить или добавить 2 входа, но она не кажется хорошо аппроксимируемой для всех точек после 20000 итераций. В частности, я тренирую его по всему набору данных, и он хорошо подходит для последних пунктов, но кажется как это не становится лучше для первых конечных точек. Я нормализую данные так, чтобы они находились между -0.8 и 0.8. сама сеть состоит из 2 входов 3 скрытых нейронов и 1 выходного нейрона. Я также установил скорость обучения в сети до 0,25, и использовать в качестве обучающей функции tanh (x).
Он очень хорошо подходит для очков, которые обучаются последним в наборе данных, но для первых точек кажется, что это не может хорошо аппроксимироваться. Интересно, что это такое, что не помогает ему хорошо подстраиваться, будь то топология, которую я использую, или что-то еще?
Также, сколько нейронов подходит для скрытого слоя для этой сети?