Wie funktionieren Dienste wie card.io hinter den Kulissen? Verwenden sie eine OCR-Bibliothek wie Tesseract oder ist sie komplexer?
Auch in diesem Video sieht es so aus, als ob die App darauf wartet, dass Sie Ihre Karte in einem bestimmter Bereich von der Kamera innerhalb der grünen Grenzen auf der Kamera, und wenn Sie es tun, nimmt das Foto automatisch. Wenn die Bilderkennung auf dem Server passiert, wie haben sie das gemacht?
Wie kann ich meinen eigenen mobilen 2D-Objekt-Scanner implementieren? Wo fange ich an?
Josh von card.io hier. Ich kann Ihnen nicht die Einzelheiten sagen, wie card.io funktioniert (hoffentlich werden andere hier spekulieren), aber ich kann einige Ihrer anderen Fragen beantworten.
card.io verwendet keine OCR-Engine; Wir haben uns Tesseract und andere angesehen und festgestellt, dass sie auf vielen Kreditkarten nicht gut funktionierten.
Die Bilderkennung von card.io geschieht vollständig auf dem Telefon. Frühe Versionen erforderten einige Server-Unterstützung, aber selbst diese haben einen guten Teil der Arbeit am Telefon erledigt.
Um zu beginnen, empfehle ich, sich hinzusetzen und Learning OpenCV zu lesen; Es ist eine gute allgemeine Einführung in die Computer Vision. Dann spielen Sie herum und stellen Sie detailliertere Fragen. Auf der maschinellen Lernseite, Theano und Eigen sind sehr hilfreiche Bibliotheken.
Tags und Links ocr tesseract camera image-processing card.io