Erkennen Sie nützliche Funktionen in Ihrem Logo und suchen Sie nach diesen Funktionen im gescannten Dokument. SIFT ist ein nützlicher Feature-Deskriptor, der skalier- und rotationsinvariant ist. Andere Deskriptoren sind SURF und HOG .
Wenn Sie sich umsehen, wird es viele Implementierungen geben, einige sogar in C #.
Ich habe folgendes gescanntes Dokument mit dem Logo darauf, und ich habe ein anderes Schwarz-Weiß-Bild mit demselben Logo und demselben Stil (unten in Schwarz-Weiß-Farbe dargestellt).
Wie stelle ich sicher, dass das Logo auf diesem Bild vorhanden ist oder nicht?
Normalerweise habe ich viele gescannte Dokumente, OCR wird MTNL abholen, aber manchmal bestehen diese Logos nur aus Symbolen, die OCR nicht leicht erkennt.
Größe und Position der Logos ändern sich, sie sind nicht oft fixiert. Sie können an beliebiger Stelle im Dokument platziert werden.
Ich möchte gescannte Bilder basierend auf den vorhandenen Logos und Symbolen organisieren und katalogisieren. Die meisten Dokumente können englisch sein oder auch nicht, sie können Barcodes enthalten oder nicht, in diesem Fall hilft das Logo-Match.
Ich habe die Aforge.NET-Bibliothek gesehen, aber ich bin nicht sehr sicher, welche Methoden für die Suche kombiniert werden müssen. Die Pixelsuche ist sehr langsam und schlägt fehl, wenn das Quellziel eine andere Größe hat.
Ich habe gehört, dass YouTube eine Art Histogramm- oder Wärmesignatur-Abgleich durchführt, um zu sehen, ob das Video urheberrechtlich geschütztes Material enthält. Ich werde hilfreich sein, wenn mich jemand in diesem Fall führen kann.
Meine ideale Wahl wäre C # und Aforge.NET, ansonsten wird ein Kommandozeilen-Tool geschätzt.
Sie können versuchen, Aforge.net zu verwenden
Überprüfen Sie diese Links
1) Ссылка
2) Ссылка
3) Ссылка
Sie können dieses kleine Dienstprogramm verwenden: Ссылка Es hat für mich funktioniert. Vielleicht wird es auch für Sie funktionieren.