PDFMiner's Dokumentation sagt:
PDFMiner ermöglicht es Ihnen, die genaue Position von Text auf einer Seite zu erhalten
Ich habe jedoch nicht herausgefunden, wie ich das machen soll. PDFMiners "Dokumentation" ist eher spärlich, daher habe ich nicht verstanden, wie das geht.
Sie suchen nach der Eigenschaft bbox
für jedes Layoutobjekt. Es gibt ein paar Informationen zu zum Analysieren der Layout-Hierarchie in der PDFMiner-Dokumentation, aber nicht alles abdecken.
Hier ist ein Beispiel:
%Vor% Wenn Sie an der Position einzelner LTChar
-Objekte interessiert sind, können Sie rekursiv in die untergeordneten Layout-Objekte LTTextBox
und LTTextLine
einteilen, genau wie im obigen Beispiel mit LTFigure
.