OCR für bekannte Schriftart

8

suche nach einer OCR-Lib, die mit einer Schriftart parametrisiert werden kann, weil ich es immer weiß und ich glaube, dass die Erkennungsergebnisse auf diese Weise viel besser sein werden.

Weiß jemand?

    
Paul 02.09.2010, 16:08
quelle

3 Antworten

2

Sehen Sie sich OCRopus an. Es ist Open-Source und gesponsert von Google :) Ich bin mir nicht sicher, ob es erlaubt wird, eine bestimmte Schriftart auszuwählen, aber es scheint trotzdem gute Ergebnisse zu erzielen.

    
Michael Mior 02.09.2010 18:22
quelle
2

Die meisten OCR-Engines werden diese Situation gut bewältigen. In der Tat werden OCR-Engines nicht so verwirrt, wenn nur eine Schriftart auf einer Seite zu erkennen ist. Seltsam, aber wahr in meiner Erfahrung.

Wenn eine OCR-Engine Ihre Schriftart überhaupt lesen kann, würde ich sie einfach verwenden und mich nicht darum kümmern. Es gibt bessere Möglichkeiten, um die Erkennung zu verbessern.

Bei vielen OCR-Engines können Sie einige Erkennungsparameter festlegen, um die Erkennung zu verbessern, z. B. feste Breite oder Proportional-, Serifen- oder Nicht-Serifen-, Maschinen- oder Handdruck. Sie können auch eine Teilmenge von Zeichen auswählen, z. B. Großbuchstaben oder Zahlen, um die Ergebnisse erheblich zu verbessern. I.e. Wenn Sie nur numerische Zeichen haben, kann das Zeichen 0 (Null) niemals mit einem 'O' oder 'O' oder 'Ø' verwechselt werden. Sie werden feststellen, dass diese Hinweise effektiver sind als die Möglichkeit, den genauen Fonttyp für OCR zu wählen.

Mit anderen Engines können Sie Ihre OCR-Engine trainieren, um mit neuen Schriftarten umzugehen, und das wird Ihnen erheblich helfen, wenn Sie eine seltsame Schriftart haben.

Wenn Ihre Bildqualität gut ist und Ihre Schriftarten sauber und von ansprechender Größe sind, würde ich Tesseract OCR von Google und OCROpus als empfehlen vorgeschlagen von Michael Mior . Es ist kostenlos und funktioniert gut auf sauberen und klaren Text. Wenn der Text ein wenig schwierig ist, dann gibt es definitiv bessere OCR-Engines wie ABBYY, Prime Recognition, Omnipage und viele andere, obwohl sie Geld kosten werden.

    
Andrew Cash 04.09.2010 06:45
quelle
0

Es ist anscheinend nur Windows und nicht primär auf OCR ausgerichtet, aber Simbas OCR verfügt über Methoden, die Kenntnisse über die verwendete Schriftart erfordern.

Siehe Ссылка

    
EdwinW 26.12.2013 18:10
quelle

Tags und Links