Programmgesteuertes Lesen von PDF-Lesezeichen

8

Ich verwende einen PDF-Konverter, um auf die grafischen Daten in einem PDF zuzugreifen. Alles funktioniert gut, außer dass ich keine Liste der Lesezeichen bekomme. Gibt es eine Befehlszeilenanwendung oder eine C # -Komponente, die die Lesezeichen eines PDFs lesen kann? Ich habe die iText- und SharpPDF-Bibliotheken gefunden und schaue sie mir gerade an. Hast du jemals so etwas getan?

    
Robin Rodricks 27.03.2012, 06:30
quelle

4 Antworten

10

Probieren Sie den folgenden Code

aus %Vor%

Hinweis: Vergessen Sie nicht, iTextSharp DLL zu Ihrem Projekt hinzuzufügen.

    
chidambaram 04.05.2012, 06:34
quelle
2

Sie können Docotic.Pdf-Bibliothek für die Aufgabe ausprobieren, wenn Ihnen eine kommerzielle Lösung gefällt.

Hier ist ein Beispielcode, um alle Elemente der obersten Ebene aus Lesezeichen mit einigen ihrer Eigenschaften aufzulisten.

%Vor%

PdfOutlineItem -Klasse bietet auch Eigenschaften, die sich auf Gliederungsstile und mehr beziehen.

Haftungsausschluss: Ich arbeite für den Verkäufer der Bibliothek.

    
Bobrovsky 27.03.2012 16:39
quelle
1

Wenn eine kommerzielle Bibliothek eine Option für Sie ist, können Sie Amyuni PDF Creator .Net angeben ein Versuch.

Verwenden Sie die Klasse Amyuni.PDFCreator.IacDocument.RootBookmark , um die Wurzel des Baums der Lesezeichen, dann die Eigenschaften in IacBookmark , um auf jeden Baum zuzugreifen Element, um durch den Baum zu navigieren und Elemente hinzuzufügen, zu bearbeiten oder zu entfernen, falls erforderlich.

Der übliche Haftungsausschluss gilt

    
yms 27.03.2012 18:46
quelle
1

Sie können die PDFsharp-Bibliothek verwenden. Sie wird unter der MIT-Lizenz veröffentlicht, sodass sie auch in der Unternehmensentwicklung verwendet werden kann . Hier ist ein ungetestetes Beispiel.

%Vor%

Gotchas:

  • PdfSharp unterstützt offene PDFs nicht sehr gut über Version 1.6. (throws: cannot handle iref streams. the current implementation of pdfsharp cannot handle this pdf feature introduced with acrobat 6 )
  • Es gibt viele Arten von Strings in PDFs, die PDFsharp zurückgibt, einschließlich UTF-16BE Strings. (7.9.2.1 ISO32000 2008)
0xcaff 17.06.2016 21:39
quelle

Tags und Links