python-tesseract, Seitenzahl 1

___ tag123python ___ Python ist eine dynamische und stark typisierte Programmiersprache, die die Usability betont. Zwei ähnliche, aber größtenteils inkompatible Versionen von Python sind weit verbreitet (2 und 3). Wenn Sie eine versionsspezifische Python-Frage haben, sollten Sie die Tags [python-2.7] oder [python-3.x] zusätzlich zum Tag [python] verwenden. Wenn Sie eine Python-Variante wie jython, pypy, iron-python usw. verwenden, kennzeichnen Sie diese bitte entsprechend. ___ qstnhdr ___ Abrufen der Bounding Box der erkannten Wörter mit Python-Tesseract ___ answer45079686 ___

Unter Verwendung des folgenden Codes können Sie die Bounding Box für jedes Zeichen erhalten.

%Vor%

___ answer20832430 ___

Die Methode

%code% gibt die genaue Position jedes Zeichens in einem Array zurück.

Außerdem gibt es eine Befehlszeilenoption %code% , die eine %code% -Datei mit den Koordinaten jedes erkannten Wortes erzeugt. Aber ich bin nicht sicher, ob es über Python-Skript aufgerufen werden kann.

___ qstntxt ___

Ich verwende python-tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für Tesseract, der ein OCR-Code ist.

Ich verwende den folgenden Code, um die Wörter zu erhalten:

%Vor%

Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder anders ausgedrückt, eine Begrenzungsbox, die sie enthält) im Bild zurück. Ich habe mich gefragt, ob es auch einen Weg gibt, das zu bekommen.

___ tag123tesseract ___ Tesseract ist eine OCR-Engine (Optical Character Recognition), die ursprünglich bei HP Labs entwickelt wurde und nun als Open-Source-Bibliothek mit einer von Google gesponserten Entwicklung verfügbar ist. ___ tag123ocr ___ Die optische Zeichenerkennung, normalerweise abgekürzt als OCR, ist die mechanische oder elektronische Übersetzung von gescannten Bildern von handgeschriebenem, maschinengeschriebenem oder gedrucktem Text in maschinencodierten Text. ___ tag123imageprocessing ___ Alles, was mit digitaler Bildverarbeitung zu tun hat, d. h. die Theorie und die Techniken, die verwendet werden, um Informationen aus digitalen Bildern zu extrahieren oder zu manipulieren. ___ tag123pythontesseract___ Python-tesseract ist eine Wrapper-Klasse für Tesseract OCR, mit der beliebige herkömmliche Bilddateien (JPG, GIF, PNG, TIFF usw.) gelesen und in brauchbaren Text umgewandelt werden können. ___

Antworten

Abrufen der Bounding Box der erkannten Wörter mit Python-Tesseract

Ich verwende python-tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für Tesseract, der ein OCR-Code ist. Ich verwende den folgenden Code, um die Wörter zu erhalten: %Vor% Dies gibt nur die Wörter und nicht...

30.12.2013, 00:15