Sehen Sie sich OCRopus an. Es ist Open-Source und gesponsert von Google :) Ich bin mir nicht sicher, ob es erlaubt wird, eine bestimmte Schriftart auszuwählen, aber es scheint trotzdem gute Ergebnisse zu erzielen.
Die meisten OCR-Engines werden diese Situation gut bewältigen. In der Tat werden OCR-Engines nicht so verwirrt, wenn nur eine Schriftart auf einer Seite zu erkennen ist. Seltsam, aber wahr in meiner Erfahrung.
Wenn eine OCR-Engine Ihre Schriftart überhaupt lesen kann, würde ich sie einfach verwenden und mich nicht darum kümmern. Es gibt bessere Möglichkeiten, um die Erkennung zu verbessern.
Bei vielen OCR-Engines können Sie einige Erkennungsparameter festlegen, um die Erkennung zu verbessern, z. B. feste Breite oder Proportional-, Serifen- oder Nicht-Serifen-, Maschinen- oder Handdruck. Sie können auch eine Teilmenge von Zeichen auswählen, z. B. Großbuchstaben oder Zahlen, um die Ergebnisse erheblich zu verbessern. I.e. Wenn Sie nur numerische Zeichen haben, kann das Zeichen 0 (Null) niemals mit einem 'O' oder 'O' oder 'Ø' verwechselt werden. Sie werden feststellen, dass diese Hinweise effektiver sind als die Möglichkeit, den genauen Fonttyp für OCR zu wählen.
Mit anderen Engines können Sie Ihre OCR-Engine trainieren, um mit neuen Schriftarten umzugehen, und das wird Ihnen erheblich helfen, wenn Sie eine seltsame Schriftart haben.
Wenn Ihre Bildqualität gut ist und Ihre Schriftarten sauber und von ansprechender Größe sind, würde ich Tesseract OCR von Google und OCROpus als empfehlen vorgeschlagen von Michael Mior . Es ist kostenlos und funktioniert gut auf sauberen und klaren Text. Wenn der Text ein wenig schwierig ist, dann gibt es definitiv bessere OCR-Engines wie ABBYY, Prime Recognition, Omnipage und viele andere, obwohl sie Geld kosten werden.