Wie erhält man den Speicherort von Text in PDF mit PDFMiner?

8

PDFMiner's Dokumentation sagt:

  

PDFMiner ermöglicht es Ihnen, die genaue Position von Text auf einer Seite zu erhalten

Ich habe jedoch nicht herausgefunden, wie ich das machen soll. PDFMiners "Dokumentation" ist eher spärlich, daher habe ich nicht verstanden, wie das geht.

    
Glycan 11.08.2014, 16:35
quelle

1 Antwort

9

Sie suchen nach der Eigenschaft bbox für jedes Layoutobjekt. Es gibt ein paar Informationen zu zum Analysieren der Layout-Hierarchie in der PDFMiner-Dokumentation, aber nicht alles abdecken.

Hier ist ein Beispiel:

%Vor%

Wenn Sie an der Position einzelner LTChar -Objekte interessiert sind, können Sie rekursiv in die untergeordneten Layout-Objekte LTTextBox und LTTextLine einteilen, genau wie im obigen Beispiel mit LTFigure .

    
Matt Swain 12.08.2014 10:53
quelle

Tags und Links