HOG ist in der menschlichen Erkennung beliebt. Kann es zum Erkennen von Objekten wie zB Tasse im Bild verwendet werden.
Es tut mir leid, dass ich die Programmierfrage nicht gestellt habe, aber ich meine, ich möchte herausfinden, ob ich mit dem Schwein Objektmerkmale extrahieren kann.
Nach meinen Recherchen habe ich seit einigen Tagen kein Gefühl mehr, aber ich bin mir nicht sicher.
Ja, HOG (Histogramm von Oriented Gradients) kann jede Art von Objekten zu erfassen, verwendet werden, wie an einen Computer Ein Bild besteht aus einer Reihe von Pixeln und Sie können Funktionen unabhängig von deren Inhalt extrahieren. Eine andere Frage ist jedoch ihre Wirksamkeit.
HOG, SIFT und andere solche Merkmalsextraktoren sind Methoden verwendet, um relevante Informationen aus einem Bild zu extrahieren zu beschreiben es auf eine sinnvollere Weise. Wenn Sie ein Objekt oder eine Person in einem Bild mit Tausenden (und vielleicht Millionen) Pixeln erkennen möchten, ist es ineffizient, einen Vektor mit Millionen von Zahlen einem maschinellen Lernalgorithmus wie
zuzuführenDer HOG-Algorithmus erzeugt speziell Histogramme von Kantenorientierungen von bestimmten Patches in Bildern. Ein Patch kann von einem Objekt, einer Person, einem bedeutungslosen Hintergrund oder irgendetwas anderem stammen und ist lediglich eine Möglichkeit, einen Bereich unter Verwendung von Kanteninformationen zu beschreiben. Wie zuvor erwähnt, kann diese Information dann verwendet werden, um einen maschinellen Lernalgorithmus wie die klassischen Unterstützungsvektormaschinen zu speisen, um einen Klassifizierer auszubilden, der in der Lage ist, einen Objekttyp von einem anderen zu unterscheiden.
Der Grund HOG hatte so viel Erfolg mit Fußgängererkennung ist, weil eine Person stark in Farbe, Kleidung und anderen Faktoren variieren kann, aber die allgemeinen Kanten eines Fußgängers relativ konstant bleiben, vor allem um den Beinbereich. Dies bedeutet nicht, dass es nicht zur Erkennung anderer Arten von Objekten verwendet werden kann, aber der Erfolg kann je nach Ihrer Anwendung variieren. Die HOG Papier im Detail zeigt, wie diese Deskriptoren für die Klassifizierung verwendet werden.
Es lohnt sich anzumerken, dass für mehrere Anwendungen die durch HOG erhaltenen Ergebnisse unter Verwendung eines Pyramidensystems erheblich verbessert werden können. Dies funktioniert wie folgt: Statt eines einzelnen HOG Vektor aus einem Bild zu extrahieren, können Sie nacheinander das Bild teilen kann (oder Patch) in mehrere Teilbilder, aus jeder dieser kleineren Divisionen ein einzelner HOG Vektor zu extrahieren. Der Prozess kann dann wiederholt werden. Am Ende können Sie einen endgültigen Deskriptor erhalten, indem Sie alle HOG-Vektoren in einem einzigen Vektor verketten, wie in der folgenden Abbildung gezeigt.
Dies hat den Vorteil, dass die HOG Merkmale globale Informationen zur Verfügung stellen, während in kleineren Maßstäben (dh in kleineren Unterteilungen) bieten sie feinkörniges Detail in größeren Maßstäben. Der Nachteil besteht darin, dass der letzte Deskriptorvektor größer wird und somit mehr Zeit benötigt, um mit einem gegebenen Klassifikator zu extrahieren und zu trainieren.
Kurz gesagt : Ja, Sie können sie verwenden.
Tags und Links opencv image-processing