Ich verwende python-tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für Tesseract, der ein OCR-Code ist.
Ich verwende den folgenden Code, um die Wörter zu erhalten:
%Vor%Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder anders ausgedrückt, eine Begrenzungsbox, die sie enthält) im Bild zurück. Ich habe mich gefragt, ob es auch einen Weg gibt, das zu bekommen.
tesseract.GetBoxText()
gibt die genaue Position jedes Zeichens in einem Array zurück.
Außerdem gibt es eine Befehlszeilenoption tesseract test.jpg result hocr
, die eine result.html
-Datei mit den Koordinaten jedes erkannten Wortes erzeugt. Aber ich bin nicht sicher, ob es über Python-Skript aufgerufen werden kann.
Tags und Links python ocr tesseract image-processing python-tesseract