ocr, Seitenzahl 3

Die optische Zeichenerkennung, normalerweise abgekürzt als OCR, ist die mechanische oder elektronische Übersetzung von gescannten Bildern von handschriftlichem, maschinengeschriebenem oder gedrucktem Text in maschinencodierten Text.

Antworten

Einbinden von Tess4J in ein Java-Projekt als Bibliothek in Eclipse

Ich habe ein bisher leeres und sauberes Eclipse-Java-Projekt. Was muss ich tun, um Tess4J als Bibliothek für meinen Webservice zu verwenden, den ich entwickeln möchte? Ist es sogar möglich, es als Bibliothek für ein Android-Projekt zu verwen...

30.05.2012, 12:09

Antworten

Probleme beim Erkennen von Ziffern in Tesseract - Android

Ich hatte gehofft, dass mir jemand sagen könnte, warum mein Tesseract Schwierigkeiten hat, Bilder mit Ziffern zu erkennen, und wenn ich etwas dagegen tun kann. Alles funktioniert nach dem Test, und da es nur Ziffern sind, die ich brauche, dachte...

17.04.2012, 08:56

Antworten

OpenCV Farbkonzentrationshistogramm

Ich arbeite an einem ANPR-System mit OpenCV und habe in einigen Artikeln eine Art der Zeichensegmentierung gesehen. Die Idee ist, eine Grafik zu machen, die die Konzentration auf Farbe über das Bild zeigt. Wie mache ich das? Das ist da...

19.02.2012, 17:15

Antworten

OCR für Devanagari (Hindi / Marathi / Sanskrit)

Hat jemand eine Vorstellung von irgendwelchen neueren Arbeiten zur optischen Zeichenerkennung für indische Schriften, die moderne maschinelle Lerntechniken verwenden? Ich kenne einige Forschungsarbeiten am ISI, Calcutta, aber nichts Neues ist in...

16.01.2010, 20:24

Antwort

Text vom Bild lesen iPhone SDK [geschlossen]

Ich habe ein Bild auf meinem Gerät, das ich von der Kamera aufnehme. Das Bild hat lesbaren Text. Ich möchte dieses Bild in Text umwandeln, d. H. Den Text des Bildes erhalten und es anzeigen. Ich ging durch Tesseract Demo, aber nicht der ges...

23.07.2012, 09:32

Antworten

OCR für bekannte Schriftart

suche nach einer OCR-Lib, die mit einer Schriftart parametrisiert werden kann, weil ich es immer weiß und ich glaube, dass die Erkennungsergebnisse auf diese Weise viel besser sein werden. Weiß jemand?

02.09.2010, 16:08

Antworten

Wie finde ich alle bildbasierten PDFs?

Ich habe viele PDF-Dokumente in meinem System und manchmal bemerke ich, dass Dokumente bildbasiert sind, ohne dass sie bearbeitet werden können. In diesem Fall mache ich OCR für eine bessere Suche in Foxit PhantomPDF, wo Sie OCR in mehreren Date...

04.12.2015, 16:31

Antworten

Verbesserung der Tesseract-Erkennungsqualität

Ich versuche, alphanumerische Zeichen (a-z0-9) zu extrahieren, die keine sinnvollen Wörter aus einem Bild ergeben, das mit einer Verbraucherkamera (einschließlich Mobiltelefonen) aufgenommen wurde. Die Zeichen haben die gleiche Größe und Schrift...

21.12.2014, 06:51

Antwort

Bildvorverarbeitung für die Erkennung von Eiern mit Tesseract

Ziel ist es, eine App zu erstellen, die Eiermarkierungen erkennen kann, zum Beispiel 0-DE-134461 . Ich habe sowohl versucht Tesseract und die Google Vision API zu den folgenden Bildern. Die Ergebnisse beider OCR-Engines sind katastrophal....

31.08.2017, 10:48

Antwort

Legen Sie explizit die Schriftart fest, die für die Erkennung durch Tesseract-OCR verwendet werden soll

Ich habe Dokumente, die im gesamten Dokument nur eine Schriftart verwenden. Verschiedene Dokumente können unterschiedliche Schriftarten haben, aber ich weiß, welches Dokument welche Schriftart verwendet. Gibt es eine Option, Tesseract-OCR exp...

31.10.2012, 08:46