Apple Vision Bilderkennung

Question

Apple Vision Bilderkennung

8

Wie viele andere Entwickler habe ich mich in die neue ARKit-Technologie von Apple gestürzt. Es ist großartig. Für ein bestimmtes Projekt möchte ich jedoch (reale Bilder) in der Szene erkennen, entweder etwas darauf projizieren (so wie es Vuforia mit seinen Zielbildern macht) oder es verwenden, um ein Ereignis in der Szene auszulösen meine Bewerbung.

In meiner Forschung, wie ich das erreichen kann, stolperte ich über die Vision- und CoreML-Frameworks von Apple. Dies scheint vielversprechend, obwohl ich noch nicht in der Lage war, meinen Kopf darum zu wickeln.

Wie ich es verstehe, sollte ich in der Lage sein, genau das zu tun, was ich möchte, indem ich Rechtecke mit dem Vision-Framework suche und diese in ein CoreML-Modell einfüge, das es einfach mit den Zielbildern vergleicht, die ich im Modell vordefiniere. Es sollte dann in der Lage sein, das gefundene Zielbild auszuspucken.

Obwohl das in meinem Kopf gut klingt, habe ich noch keinen Weg gefunden, dies zu tun. Wie würde ich ein solches Modell erstellen, und ist das überhaupt möglich?

ios vision arkit coreml

Marc Van Deuren 11.09.2017, 08:56

quelle

2 Antworten

2

Ich habe dieses Projekt vor einigen Wochen auf Github gefunden: AR-Kit-Rechteckerkennung

Ich denke, das ist genau das, wonach Sie suchen ...

Nico S. 11.09.2017 15:10

quelle

Tags und Links ios vision arkit coreml

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Welche Benutzeroberfläche ist für die Messaging-Funktionalität eingerichtet?

score 0 · Accepted Answer

Ab ARKit 1.5 (das im Frühjahr 2018 mit IOS 11.3 geliefert wurde) scheint ein Feature direkt auf ARKit implementiert zu sein, das dieses Problem löst.

ARKit unterstützt die Bilderkennung vollständig. Nach der Erkennung eines Bildes können die 3D-Koordinaten als Anker abgerufen werden, und daher kann Inhalt auf ihnen platziert werden.