OCR-Engines, die für das Bildschirmlesen entwickelt wurden

8

Gibt es OCR-Engines, die Text im Bildschirm erfassen und nicht gescannten Text? Ich habe ein Projekt, bei dem ich Text in einer Anwendung abrufen und identifizieren muss, und keiner der OCR-Engines, die ich bisher ausprobiert habe, hat sich gut mit Screenshots vertragen.

Idealerweise sollte der Motor gut mit Farbe und Hintergrundgeräuschen funktionieren, obwohl ich einige Zugeständnisse machen kann, wenn nichts dergleichen verfügbar ist.

Es muss .NET-kompatibel sein; entweder in .NET geschrieben oder mit einer .NET-aufrufbaren API.

    
Erik Forbes 27.07.2010, 15:08
quelle

4 Antworten

5

Ich habe festgestellt, dass Tesseract OCR für ein Open-Source-Projekt ziemlich solide ist. Ich habe festgestellt, dass es sogar einfache Captchas wie Megaupload lesen und entschlüsseln kann. Ich denke, mit ein wenig Feinabstimmung könnte das ziemlich gut funktionieren.

Das einzige Problem ist, dass es nur unkomprimierte TIFF-Bilder akzeptiert, was ärgerlich sein kann.

EDIT: Philip Daubmeier hat bereits eine .NET-Integration gefunden, aber unten ist Code zum Konvertieren einer Bitmap in unkomprimiertes TIFF.

%Vor%

Dies speichert in einer Datei, aber die Bitmap.Save Methode kann auch in einen Stream schreiben.

    
Nate 27.08.2010 02:58
quelle
4

Normalerweise ist die OCR-Technologie darauf abgestimmt, mit gescanntem Text zu arbeiten, der mindestens 200 dpi beträgt. Für eine zuverlässige OCR-Qualität werden jedoch 300 dpi empfohlen. Daher müssen Sie einige Anstrengungen unternehmen, um die Einstellungen und alles andere zu optimieren, damit es auf Bildschirmtext funktioniert, der normalerweise mit 96 dpi in Betracht gezogen wird.

ABBYY hat eine Bildschirmfoto-OCR-Software: Ссылка , die beweist, dass seine Technologie unter diesen Bedingungen gut funktioniert. Ich benutze es, es funktioniert einfach. Daher möchten Sie vielleicht ABBYY für OCR SDK kontaktieren: Ссылка (kann von .NET verwendet werden)

Es ist nicht billig, aber es funktioniert. Haftungsausschluss: Ich arbeite für ABBYY

    
Tomato 05.08.2010 11:20
quelle
1

Sie suchen im Wesentlichen nach den CAPTCHA-Umgehungswerkzeugen , die verschiedene Forscher versucht haben, einige mit Erfolg. p>

Ein anderer Ansatz wäre, Glättungsalgorithmen zu verwenden, um 96 DPI-Erfassungen zu interpolieren und sie in 300 DPI zu konvertieren (z. B. Photoshop) und dann Standard-OCR-Werkzeuge zu verwenden.

    
joe snyder 29.08.2010 04:46
quelle
0

Verwenden Sie die erste Antwort (OCR-Software) und für die Bildschirmaufnahme könnten Sie wahrscheinlich ein PRNTSCRN-Zeichen (Printscreen) senden und dann den Inhalt der Zwischenablage (bmp) in ein tiff umwandeln.

hoffe das hilft dir ein bisschen mehr in dein Abenteuer

    
Olee Dee 31.08.2010 09:33
quelle

Tags und Links