Metrisch für SURF

8

Ich suche nach einer brauchbaren Metrik für SURF. Wie gut ein Bild einem anderen auf einer Skala entspricht, sagen wir 0 bis 1, wobei 0 keine Ähnlichkeiten und 1 das gleiche Bild bedeutet.

SURF stellt die folgenden Daten bereit:

  • Interessenpunkte (und ihre Deskriptoren) im Abfragebild (Set Q)
  • Interessenpunkte (und ihre Deskriptoren) im Zielbild (Menge T)
  • unter Verwendung der nächsten Nachbaralgorithmuspaare können aus den zwei Gruppen von oben erstellt werden

Ich habe bisher etwas versucht, aber nichts schien so gut zu funktionieren:

  1. Metrik mit der Größe der verschiedenen Mengen: d = N / min (Größe (Q), Größe (T)) wobei N die Anzahl der übereinstimmenden Zinspunkte ist. Dies ergibt für ziemlich ähnliche Bilder eine ziemlich niedrige Bewertung, z. 0.32, selbst wenn 70 Interessespunkte von ungefähr 600 in Q und 200 in T zusammengebracht wurden. Ich denke, dass 70 ein wirklich gutes Ergebnis ist. Ich habe darüber nachgedacht, eine logarithmische Skalierung zu verwenden, so dass nur wirklich niedrige Zahlen zu niedrigen Ergebnissen führen, aber nicht die richtige Gleichung finden können. Mit d = log(9*d0+1) erhalte ich ein Ergebnis von 0.59 was ziemlich gut ist, aber trotzdem zerstört es die Power von SURF.

  2. metrisch unter Verwendung der Abstände in Paaren: Ich habe so etwas wie die K-beste Übereinstimmung gefunden und ihre Entfernungen addiert. Je kleiner die Entfernung ist, desto ähnlicher sind die beiden Bilder. Das Problem dabei ist, dass ich nicht weiß, was die maximalen und minimalen Werte für ein interessierendes Punktdeskriptorelement sind, von dem die entfernte berechnet wird, so kann ich nur relativ das Ergebnis finden (von vielen Eingaben, die die beste ist). Wie gesagt, ich möchte die Metrik genau zwischen 0 und 1 setzen. Ich brauche das, um SURF mit anderen Bildmetriken zu vergleichen.

Das größte Problem mit diesen beiden ist, dass die anderen ausgeschlossen werden. Die Anzahl der Übereinstimmungen wird nicht berücksichtigt, die andere die Entfernung zwischen den Übereinstimmungen. Ich bin verloren.

BEARBEITEN : Für die erste, eine logarithmische Gleichung (x * 10 ^ k) / k, wobei k 3 oder 4 ist, ergibt die meiste Zeit ein schönes Ergebnis, das min ist nicht gut , kann es das d größer als 1 in einigen seltenen Fällen machen, ohne es kleines Ergebnis sind zurück.

    
SinistraD 15.06.2011, 23:30
quelle

1 Antwort

6

Sie können problemlos eine Metrik erstellen, die die gewichtete Summe beider Metriken darstellt. Verwenden Sie maschinelles Lernen Techniken, um die entsprechenden Gewichte zu lernen.

Was Sie beschreiben, hängt eng mit dem Bereich der Content-Based Image Retrieval zusammen, der ein sehr reiches und vielfältiges Feld ist. Googeln, das wird dir viele Treffer bringen. Während SURF ein ausgezeichneter Allzweck-Detektor für niedrige bis mittlere Pegel ist, ist es bei weitem nicht ausreichend. SURF und SIFT (woraus SURF abgeleitet wurde), sind großartig für die Duplikat- oder Beinahe-Duplikat-Erkennung, aber sie sind nicht so großartig, um Wahrnehmungsähnlichkeit zu erfassen.

Die leistungsstärksten CBIR-Systeme verwenden normalerweise ein Ensemble von Funktionen, die über ein Trainingssatz optimal kombiniert werden. Einige interessante Detektoren, die man ausprobieren sollte, sind GIST (schneller und preiswerter Detektor, der am besten für die Erkennung künstlicher natürliche Umgebungen) und Objektbank (ein Histogramm-basierter Detektor selbst aus 100 von Objektdetektor-Ausgaben).

>     
peakxu 15.06.2011, 23:56
quelle