Ich habe mich entschieden, in ML einzutauchen und konnte mit viel Versuch und Irrtum ein Modell erstellen, das die Einführung von TS verwendet.
Um noch einen Schritt weiter zu gehen, möchte ich ihre Objekterkennungs-API verwenden. Aber ihre Anweisungen zur Eingabevorbereitung verweisen auf die Verwendung von Pascal VOC 2012 Datensatz, aber ich möchte das Training mit meinem eigenen Datensatz machen.
Bedeutet das, dass ich meine Datensätze entweder für Pascal VOC oder Oxford IIT Format? Wenn ja, wie gehe ich dabei vor?
Wenn nein (mein Instinkt sagt, dass das der Fall ist) , welche Alternativen bieten TS-Objekterkennung mit meinen eigenen Datensätzen?
Seite Hinweis: Ich weiß, dass mein trained-inception-Modell nicht zur Lokalisierung verwendet werden kann, da es ein Klassifikator ist
Bearbeiten:
Für diejenigen, die das noch erreichen wollen, Hier habe ich es so gemacht.
Die Schulungsjobs in der Tensorflow Object Detection-API erwarten, dass TF Record-Dateien mit bestimmten Feldern mit Groundtruth-Daten gefüllt werden.
Sie können Ihre Daten entweder im selben Format wie die Pascal VOC- oder Oxford-IIIT-Beispiele einrichten oder Sie können die TFRecord-Dateien direkt erstellen, ohne die XML-Formate zu beachten.
Im letzteren Fall sind die Skripte create_pet_tf_record.py oder create_pascal_tf_record.py wahrscheinlich immer noch nützlich als Referenz für welche Felder die API erwartet und welches Format sie verwenden sollen. Derzeit bieten wir kein Tool an, das diese TFRecord-Dateien im Allgemeinen erstellt, sodass Sie eigene Dateien erstellen müssen.
Außer TF Object Detection API können Sie sich OpenCV Haar Cascades . Ich begann meine Objekterkennung von diesem Punkt aus und wenn gut vorbereitete Daten liefern, funktioniert es ziemlich gut.
Es gibt auch viele Artikel und Tutorials zum Erstellen eigener Kaskaden, so dass es einfach zu starten ist. Ich habe diesen Blog benutzt, es hilft mir sehr.
Tags und Links tensorflow machine-learning object-detection