hocr

hOCR ist ein offener Standard, der ein Datenformat für die Darstellung der OCR-Ausgabe definiert.
2
Antworten

Konvertiere hOCR in HTML-Tabelle

Ich bin auf der Suche nach einem Tool oder einer Idee, die in Python implementiert werden soll, um die hocr-Datei (generiert von tesseract in pro Anwendung) in eine HTML-Tabelle zu konvertieren. Die Idee besteht darin, die Textinformationen in d...
24.06.2015, 14:45