Ich versuche MODI zu benutzen, um das Programm eines Fensters zu erkennen. Es funktioniert gut für Screenshots, die ich programmatisch mit win32 interop wie folgt ergreife:
%Vor%Dieses Bild wird dann in einer Datei gespeichert und läuft durch MODI wie folgt:
%Vor%Dieser Teil funktioniert gut, aber ich möchte nicht den gesamten Screenshot, nur Teile davon, OCR. Ich versuche, das Bild programmgesteuert wie folgt zu beschneiden:
%Vor%und dann OCR dieses kleinere Bild, jedoch MODI löst eine Ausnahme aus; 'OCR running error', der Fehlercode ist -959967087.
Warum kann MODI mit der Original-Bitmap umgehen, aber nicht mit der kleineren Version?
Sieht so aus, als ob die Antwort darin besteht, MODI eine größere Leinwand zu geben. Ich habe auch versucht, einen Screenshot von einem Steuerelement und OCR es zu machen und lief auf das gleiche Problem. Am Ende nahm ich das Bild des Steuerelements, kopierte das Bild in eine größere Bitmap und OCRed die größere Bitmap.
Ein anderes Problem, das ich fand, war, dass Sie eine richtige Erweiterung für Ihre Bilddatei haben müssen. Mit anderen Worten, .tmp schneidet es nicht ab.
Ich habe die Arbeit der Erstellung einer größeren Quelle in meiner OCR-Methode beibehalten, die in etwa so aussieht (ich behandle direkt Bildobjekte):
%Vor%Ich bin mir nicht sicher, was genau die Mindestgröße ist, aber es scheint, als ob 1024 x 768 den Trick macht.
Ja, die Beiträge in diesem Thread haben mir geholfen, es zum Laufen zu bringen, hier muss ich hinzufügen:
hat versucht, Bilder herunterzuladen (kleine) und dann ocr ...
- Bei der Verarbeitung von Bildern scheint ihre Größe 2 zu sein! (konnte Bilder ocr: 512x512, 128x128, 256x64 .. andere Größen meist fehlgeschlagen (wie 1103x334))
transparenter Hintergrund machte auch Probleme. Ich habe die besten Ergebnisse beim Erstellen eines neuen TIF mit powerof2 Grenze, weißer Hintergrund, das heruntergeladene Bild einfügen, speichern.
Das Skalieren des Bildes war für mich nicht erfolgreich, da OCR falsche Ergebnisse liefert, speziell für "deutsche" Zeichen wie "ü"
am Ende habe ich auch benutzt: doc.OCR (MODI.MiLANGUAGES.miLANG_ENGLISH, false, false);
mit Modi von Office 2003
Grüße
womd
Die Modi ocr funktioniert nur bei mir. versuche das Bild in "tif" zu speichern.
Entschuldige mein schlechtes Englisch
Das bedeutet, dass ich nicht möchte, dass es die Ausrichtung erkennt und keine Schräglage korrigiert. Jetzt funktioniert der Befehl gut für alle Bilder einschließlich des 2400x2496 tiff.
Aber Bild sollte in .tif sein.
Ich hoffe, das hilft Leuten, die das gleiche Problem haben.
Ich hatte das gleiche Problem "OCR läuft Problem" mit einigen Bildern. Ich skalierte das Bild (in meinem Fall um 50%), d. H. Reduzierte seine Größe und voila! es funktioniert!
Ich hatte das gleiche Problem während der Verwendung des
%Vor%in einer Tiff-Datei, die 2400x2496 war. Durch die Größenanpassung auf 50% (Reduzierung der Größe) wurde das Problem behoben, und die Methode gab keine Ausnahme mehr aus, erkannte jedoch den Text fälschlicherweise als Erkennung von "refence" anstelle von "reference" oder "712017" anstelle von "712517". . Ich habe immer wieder andere Bildgrößen versucht, aber alle hatten das gleiche Problem, bis ich den Befehl in
geändert habe %Vor%was bedeutet, dass ich nicht möchte, dass es die Ausrichtung erkennt und keine Schrägstellung korrigiert. Jetzt funktioniert der Befehl gut für alle Bilder einschließlich des 2400x2496 tiff.
Ich hoffe, dies hilft Menschen, die das gleiche Problem haben