Anstatt nur die Anzahl der Epochen zu erhöhen, verwenden Sie relu
für die Aktivierung Ihrer versteckten Ebene anstelle von tanh
. Wenn Sie nur diese Änderung an den von Ihnen bereitgestellten Code vornehmen, kann ich nach nur 2000 Epochen (Theano Backend) folgendes Ergebnis erhalten:
Es könnte leicht zu dem Schluss kommen, dass dies auf das Problem des verschwindenden Farbverlaufs zurückzuführen ist. Die Einfachheit dieses Netzwerks deutet jedoch darauf hin, dass dies nicht der Fall ist. In der Tat, wenn ich das Optimierungsprogramm von 'adam'
auf SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)
(die Standardwerte) ändere, kann ich das folgende Ergebnis nach 5000 Epochen mit tanh
Aktivierung in der versteckten Ebene sehen.
Bearbeiten: 17.05.17 - Enthaltener vollständiger Code, um die Reproduktion zu ermöglichen