Menschliche Pose Schätzung - effiziente Verknüpfung von Körperteilen

8

Beschreibung des Problems: Ich arbeite an einem Projekt, dessen Ziel es ist, Körperteile von Menschen in Bildern zu identifizieren (Oberkörper, Kopf, linker und rechter Arm usw.). Der Ansatz basiert darauf, Teile des menschlichen Körpers zu finden (Hypothese) und dann nach der besten Pose-Konfiguration zu suchen (= alle Teile, die wirklich einen menschlichen Körper bilden). Die Idee ist besser beschrieben unter diesem Link Ссылка .

Die Hypothese wird nach dem Ausführen eines Erkennungsalgorithmus (hier verwende ich einen Klassifikator aus dem maschinellen Lernfeld) für jeden Körperteil separat erhalten. So ist der Typ jeder Hypothese bekannt. Außerdem hat jede Hypothese eine Position (x- und y-Koordinaten im Bild) und eine Orientierung.

Um die Kosten der Verbindung zweier Teile zu bestimmen, kann man annehmen, dass jede Hypothese vom Typ Kopf mit jeder Hypothese vom Typ Torso (zum Beispiel) verknüpft werden kann. Aber eine Kopfhypothese, die sich in der oberen rechten Position des Bildes befindet, kann (vom menschlichen Standpunkt aus gesehen) nicht mit einer Torsohypothese verknüpft werden, die sich in der unteren linken Position des Bildes befindet. Ich versuche, diese Art von Links zu vermeiden, die auf der letzten Anweisung und auch auf der Ausführungszeit basieren.

Frage: Ich plane, den Suchraum zu verkleinern, indem ich einen Abstand zu der am weitesten entfernten Hypothese einbeziehe, die ein verbindender Kandidat sein kann. Welches ist der schnellste Weg, dieses Suchproblem zu lösen?

    
Raluca Pandaru 08.04.2013, 19:00
quelle

2 Antworten

2

Bei ähnlichen Problemen habe ich darauf zurückgegriffen, die Quellbilder in 16 (oder mehr, abhängig von der relativen Größe der Teile, die Sie zu verknüpfen versuchen) aufzuteilen, kleinere Bilder, wobei der Erkennungs- und Verknüpfungsschritt in jedem dieser Bilder einzeln ausgeführt wird. und einen zusätzlichen Schritt, in dem Sie nur einen Linkschritt für jedes Unterbild ausführen, und es sind (möglicherweise 8) Nachbarn.

In diesem Fall wirst du niemals versuchen, einen Teil in der oberen linken Ecke mit dem unteren rechten zu verknüpfen, und als zusätzlichen Bonus ist der erste Teil deines Problems jetzt extrem parallel.

Aktualisierung: Sie könnten zuerst eine Kantenerkennung auf dem Bild durchführen und das Bild niemals in 2 schneiden, wenn dies bedeuten würde, eine Kante in zwei Teile zu schneiden. Wenn Sie dies rekursiv ausführen, können Sie viele kleine Bilder mit Körperteilen auf ihnen erstellen, die Sie dann separat verarbeiten können.

    
Jens Timmerman 15.04.2013 13:40
quelle
1

Dieses Problem der diskreten Zuweisung kann mit dem ungarischen Algorithmus gelöst werden.

Bei der Berechnung der Kosten (= Abstand) -Matrix können Sie den Eintrag auf einen unendlichen oder sehr hohen Wert setzen, wenn der Abstand größer als ein vordefinierter Schwellenwert ist. Dies verhindert, dass der Algorithmus einen Kopf einem Torso zuordnet, der zu weit entfernt ist.

Diese letzte Technik wird in Tracking-Vorlesungen auch Gating genannt.

    
sansuiso 15.04.2013 14:13
quelle

Tags und Links