pdf-parsing

Behandelt das Extrahieren nützlicher Informationen aus PDF-Inhalten (z. B. Text oder Bilder).
1
Antwort

Was ist das (cid: 51) in der Ausgabe von pdf2txt?

Also versuche ich den Text aus einer PDF-Datei zu extrahieren, ich brauche seine Position, Breite, Höhe, Schriftart. Ich habe viele versucht, aber die nützlichste und vollständigste Lösung scheint PDFMiner zu sein, und in in diesem Fall, ge...
13.05.2013, 13:50
3
Antworten

So finden Sie eine leere Seite in der PDF-Datei

Ich kann keine leere Seite in der PDF-Datei finden. Ich habe das Internet gesucht, konnte aber keine gute Lösung finden.    Mit Itextsharp versuchte ich mit Seitengröße, Xobjects. Aber sie nicht   gib genaues Ergebnis. Ich habe es versuch...
09.06.2012, 15:30
3
Antworten

Seltsame Leerzeichen beim Parsen einer PDF

Ich muss ein PDF-Dokument analysieren. Ich habe den Parser bereits implementiert und die Bibliothek iText verwendet und bis jetzt funktionierte das ohne Probleme. Aber nein, ich muss ein anderes Dokument parsen, das sehr seltsame Leerzeiche...
10.08.2012, 12:36