PDFToolKit

Aus gegebenem Anlass heute mal was mit PDFs:
Mit dem PDFToolKit lassen sich sowohl unter Linux, alsauch unter Windows, PDF-Dateien fast beliebig bearbeiten. Nicht den Text an sich! Aber man kann PDF-Dateien zusammenführen, einzelne Seiten (auch aus mehren Dateien) entnehmen und in einer neuen PDF-Datei speichern, verschlüsseln/entschlüsseln, Wasserzeichen einfügen, Seiten rotieren oder ein PDF reparieren und noch einiges mehr.

 

HP: https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/

 

Installieren:
Ich empfehle hier die Pakete zu nehmen. Diese sind auf der Downloadseite (http://www.pdflabs.com/docs/install-pdftk/), dort kann man aus der reichhaltigen Paketauswahl wählen und mit dem jeweiligen Tools der Distribution installieren.
(BSD ports: /usr/ports/print/pdftk)

Von den Sourcen funktioniert das nur mit ziemlichem gefrickel. >:-(
Wer gerne frickelt kann die, z.Zt. neuesten, Sourcen hier holen: wget https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/pdftk-1.44-src.zip

 

Beispiele:
– Die Seiten 10 bis 12 von einem PDF extrahieren und in einem eigeständigem PDF zu speichern:
$ pdftk infile.pdf cat 10-12 output outfile.pdf

– Die Seiten 10 bis 12 aus datei1.pdf, die Seiten 22 bis 25 aus datei2.pdf und die Seite 23 aus datei3.pdf zusammenführen:
$ pdftk A=datei1.pdf B=datei2.pdf C=datei3.pdf cat A=10-22 B=22-25 C=23 output outfile.pdf

– Mehere PDF-Dateien in eine einzige PDF-Datei zusammenführen:
$ pdftk datei1.pdf datei2.pdf datei3.pdf datei4.pdf cat output outfile.pdf
$ pdftk *.pdf cat output outfile.pdf

– PDF mit einem passwort schützen (und verschlüsseln):
$ pdftk infile.pdf output outfile.pdf user_pw geheimespasswort

– Eine html/txt-Datei an ein PDF (hier: Seite 23) anhängen:
$ pdftk infile.pdf attach_files website.html to_page 23 output outfile.pdf
$ pdftk infile.pdf attach_files textfile.txt to_page 23 output outfile.pdf

Mehr in der Manpage. 🙂

PS: Sollte das PDF mit einem „Owner password“ geschützt sein (nur der Ersteller kann das PDF ändern) und man dieses Passwort vergessen haben, dann könnte PDFCrack (http://sourceforge.net/projects/pdfcrack/) eventuell hilfreich sein. (Brute-Force- und Wordlist-Cracker.) Alternativ das PDF mittels PDFCreator (http://sourceforge.net/projects/pdfcreator/) (Windows only) in ein neues, ungeschütztes, PDF „drucken“. – Letzteres dürfte einfacher und schneller gehen. 😉