Existiert eine Bibliothek, um Kennwörter aus PDFs programmatisch zu entfernen? [geschlossen]

8

Existiert eine Bibliothek, die "Besitzer" -Kennwörter aus PDF-Dokumenten entfernt, so dass der Text dann programmatisch daraus extrahiert werden kann? Etwas wie das Passwort-Wiederherstellungswerkzeug von PDF Technologies , das aber über die Befehlszeile oder von Python aufgerufen werden kann . Eine GUI-Schnittstelle ist für mich nicht wirklich nützlich, da die Anzahl der Dokumente so groß ist.

Bitte keine Kommentare zur Rechtmäßigkeit des Prozesses. Die betreffenden PDFs sind Eigentum, und der Text muss extrahiert werden, um Schlüsselwortwolken für den Dokumentensatz zu bilden.

    
Mike Cialowicz 17.11.2009, 18:09
quelle

3 Antworten

2

Ich weiß nichts über Python-Bibliotheken, aber für die Batch-Entfernung von Passwörtern aus PDF-Dokumenten haben meine Kollegen gute Erfahrungen mit PwdRemover (nicht frei).

    
Rook 17.11.2009, 18:15
quelle
6

Hier sind zwei weitere (Open-Source-) Tools für die Befehlszeilenverarbeitung:

QPDF: Ein Content-Preserving PDF-Transformationssystem :

%Vor%

pdftk - das pdf-Toolkit :

%Vor%     
rcs 17.11.2009 19:47
quelle
0

Wenn Sie das Passwort vergessen haben oder der Mitarbeiter, der die Dokumente verschlüsselt hat, das Unternehmen verlassen hat, können Sie PDFCrack wiederherstellen das Passwort (s).

    
Jason Sundram 11.07.2012 04:05
quelle