Abrufen der Bounding Box der erkannten Wörter mit Python-Tesseract

Question

Abrufen der Bounding Box der erkannten Wörter mit Python-Tesseract

8

Ich verwende python-tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für Tesseract, der ein OCR-Code ist.

Ich verwende den folgenden Code, um die Wörter zu erhalten:

%Vor%

Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder anders ausgedrückt, eine Begrenzungsbox, die sie enthält) im Bild zurück. Ich habe mich gefragt, ob es auch einen Weg gibt, das zu bekommen.

python ocr tesseract image-processing python-tesseract

Abtin Rasoulian 30.12.2013, 00:15

quelle

2 Antworten

6

Unter Verwendung des folgenden Codes können Sie die Bounding Box für jedes Zeichen erhalten.

%Vor%

khushhall 13.07.2017 11:45

quelle

Tags und Links python ocr tesseract image-processing python-tesseract

Django: Verwenden von Annotate, Count und Distinct in einem Queryset Meteor Package api.add_files fügt den gesamten Ordner hinzu

score 10 · Accepted Answer

Die Methode

tesseract.GetBoxText() gibt die genaue Position jedes Zeichens in einem Array zurück.

Außerdem gibt es eine Befehlszeilenoption tesseract test.jpg result hocr , die eine result.html -Datei mit den Koordinaten jedes erkannten Wortes erzeugt. Aber ich bin nicht sicher, ob es über Python-Skript aufgerufen werden kann.