Umgang mit Okklusion und Fragmentierung

8

Ich versuche ein Personenzählsystem mit Computer Vision für Uni-Projekt zu implementieren. Derzeit ist meine Methode:

  1. Hintergrundsubtraktion mit MOG2
  2. Morphologischer Filter zum Entfernen von Rauschen
  3. Spur-Blob
  4. Count blob übergibt eine bestimmte Region (eine Linie)

Das Problem ist, wenn Leute als Gruppe kommen, zählt meine Methode nur ein Volk. Ich glaube, dass das von meinen Lesungen als Okklusion bezeichnet wird. Ein anderes Problem ist, wenn Menschen dem Hintergrund ähnlich sehen (dunkle Kleidung benutzen und eine schwarze Säule / Wand passieren), wird der Blob getrennt, während es tatsächlich eine Person ist.

Nach dem was ich lese, sollte ich einen Detektor + Tracker implementieren (z. B. Menschen mit HOG detektieren). Aber mein Detektionsergebnis ist schlecht (z. B. 50% falsch positive Ergebnisse mit einer Trefferrate von 50%; unter Verwendung des menschlichen OpenCV-Detektors und meines eigenen ausgebildeten Detektors), so dass ich nicht überzeugt bin, den Detektor als Grundlage für das Tracking zu verwenden. Danke für deine Antworten und Zeit für das Lesen dieses Beitrags!

    
bonchenko 26.04.2013, 08:54
quelle

2 Antworten

3

Es gibt keine einzige "gute" Antwort darauf, da die Handhabung von Okklusion (und Hintergrundsubtraktion) immer noch offen ist! Es gibt mehrere Hinweise, die Ihnen bei Ihrem Projekt helfen können.

Sie möchten feststellen, ob ein "Blob" eine Person oder eine Gruppe von Personen ist. Es gibt mehrere Dinge, die Sie tun könnten, um damit umzugehen.

  • Verwenden Sie mehrere Kameras (es ist unwahrscheinlich, dass eine Gruppe von Personen aus allen Winkeln als einzelner Blob erkannt wird)
  • Versuche, Teile des menschlichen Körpers zu erkennen. Wenn Sie zwei Köpfe in einem einzelnen Blob erkennen, gibt es mehrere Personen. Dasselbe gilt für 3 Beine, 5 Schultern usw.

Im Bereich der Verfolgung einer "verlorenen" Person (eine, die hinter einem anderen Objekt läuft), ist es, ihre Position zu extrapolieren. Du weißt, dass sich eine Person nur so viel zwischen den Bildern bewegen kann. Wenn Sie dies berücksichtigen, wissen Sie, dass es für einen Benutzer unmöglich ist, in der Mitte Ihres Bildes erkannt zu werden und dann plötzlich zu verschwinden. Nach mehreren Frames, in denen Sie diese Person nicht sehen, können Sie die Beobachtung verwerfen, da die Person möglicherweise genug Zeit hatte, sich zu entfernen.

    
Nallath 26.04.2013, 09:44
quelle
5

Die Verfolgung von Personen in Videoüberwachungssequenzen ist immer noch ein offenes Problem in der Forschungsgemeinschaft. Jedoch liefert particule filters (PF) (auch bekannt als sequentieller Monte-Carlo) gute Ergebnisse in Bezug auf Okklusion und komplexe Szene. Sie sollten dies lesen. Es gibt auch zusätzliche Links zu Beispiel-Quellcode nach biblio.

Ein Vorteil bei der Verwendung von PF ist der Gewinn an Rechenzeit für die Verfolgung durch Erkennung (nur).

Wenn Sie diesen Weg gehen, fragen Sie nach einem besseren Verständnis der Mathematik hinter dem PF.

    
Eric 26.04.2013 10:20
quelle