Ich versuche eine Satzähnlichkeitsarchitektur basierend auf dieser Arbeit mit dem STS-Datensatz zu implementieren. Labels sind normalisierte Ähnlichkeitswerte von 0 bis 1, daher wird angenommen, dass es sich um ein Regressionsmodell handelt.
Mein Problem ist, dass der Verlust ab der ersten Epoche direkt zu NaN
geht. Was mache ich falsch?
Ich habe schon versucht, auf die neuesten Keras und Theano Versionen zu aktualisieren.
Der Code für mein Modell lautet:
%Vor% Ich habe auch versucht, eine einfache Lambda
anstelle der Merge
Ebene zu verwenden, aber es hat das gleiche Ergebnis.
Die Nanotechnologie ist ein häufiges Problem in der Deep Learning Regression. Da Sie ein siamesisches Netzwerk verwenden, können Sie Folgendes versuchen:
Es ist nicht einfach, tiefes Lernen perfekt zu machen.
Ich bin nicht auf das nan
Problem gestoßen, aber mein Verlust würde sich nicht ändern. Ich habe diese Information gefunden
überprüfen Sie dies
Tags und Links python keras sentence-similarity