Abrufen der Bounding Box der erkannten Wörter mit Python-Tesseract

8

Ich verwende python-tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für Tesseract, der ein OCR-Code ist.

Ich verwende den folgenden Code, um die Wörter zu erhalten:

%Vor%

Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder anders ausgedrückt, eine Begrenzungsbox, die sie enthält) im Bild zurück. Ich habe mich gefragt, ob es auch einen Weg gibt, das zu bekommen.

    
Abtin Rasoulian 30.12.2013, 00:15
quelle

2 Antworten

10
Die Methode

tesseract.GetBoxText() gibt die genaue Position jedes Zeichens in einem Array zurück.

Außerdem gibt es eine Befehlszeilenoption tesseract test.jpg result hocr , die eine result.html -Datei mit den Koordinaten jedes erkannten Wortes erzeugt. Aber ich bin nicht sicher, ob es über Python-Skript aufgerufen werden kann.

    
lennon310 30.12.2013, 02:18
quelle
6

Unter Verwendung des folgenden Codes können Sie die Bounding Box für jedes Zeichen erhalten.

%Vor%     
khushhall 13.07.2017 11:45
quelle