Ich versuche Caffe zu verwenden, um den Triplett-Verlust zu implementieren, der in Schroff, Kalenichenko und Philbin "FaceNet: Eine einheitliche Einbettung für Gesichtserkennung und Clustering" beschrieben wird. , 2015 .
Ich bin neu dazu, wie man den Gradienten in der Rückausbreitung berechnet?
Ich nehme an, Sie definieren die Verlustschicht als
%Vor%Nun müssen Sie einen Gradienten für jeden der "unteren" s berechnen.
Der Verlust ist gegeben durch:
Der Gradient für den "Anker" -Eingang ( fa
):
Der Gradient für den "positiven" Eingang ( fp
):
Der Gradient für den "negativen" Eingang ( fn
):
Die ursprüngliche Berechnung (Ich verlasse mich hier aus sentimentalen Gründen ...)
Siehe Kommentar Korrektur der letzten Amtszeit.
Tags und Links neural-network computer-vision deep-learning caffe gradient-descent