Operacje na plikach PDF

Program pdftk jest konsolowym narzędziem o całkiem sporych możliwościach, służącym do manipulowania plikami w formacie PDF; umożliwia między innymi rozbicie pliku na pojedyncze strony w formacie PDF, obracanie stron w dokumencie, jego szyfrowanie i deszyfrowanie, dodawanie znaku wodnego oraz zwykłe operacje na metadanych.

Poniżej opisanych zostało kilka najbardziej przydatnych i najczęściej używanych operacji, pełen opis zawiera podręcznik systemowy man lub strony info.

1. Składnia polecenia.

Polecenie wywołujemy następująco:

pdftk dokument.pdf opcje

1. Rozbicie dokumentu PDF na pojedyncze strony w formacie PDF

Służy do tego opcja burst; w efekcie z n stronicowego dokumentu uzyskamy n stron nazwanych domyślnie pg_00n.pdf;

pdftk dokument.pdf burst

Istnieje możliwość zmiany domyślnego nazewnictwa plików wyjściowych; ogólnie opcja służąca do zmiany nazwy pliku wyjściowego (jednego lub wielu) to output:

pdftk dokument.pdf output strona%03d.pdf

W powyższym przykładzie każda strona będzie zawierać w nazwie słowo strona oraz trzy cyfry, przy czym puste pola pomiędzy nazwą a numeracją stron zostaną wypełnione zerami; druga z cyfr definiuje ilość znaków numerycznych w nazwie pliku, tzn. obecnie strona siódma nazwana zostanie strona007.pdf, natomiast w przypadku opcji strona%05d.pdf będzie to strona00007.pdf; ogólnie, pdftk przyjmuje polecenia formatowania nazw zgodne ze specyfikacją funkcji printf() z C.

2. Łączenie kilku dokumentów PDF w jeden plik PDF.

Operację taką umożliwia polecenie cat, przy czym możliwe jest utworzenie nowego dokumentu z poszczególnych stron dokumentów;

pdftk dokument1.pdf dokument2.pdf ... dokument_n.pdf cat output scalony.pdf

Do danego pliku można odnoscić się poprzez referencję (prawdziwe wszędzie dla polecenia pdftk), tzn. przyporządkować literę alfabetu danemu plikowi:

pdftk A=dokument1.pdf B=dokument2.pdf cat A B output scalony.pdf

Utworzenie pliku zawierającego jedynie kilka stron odbywa się poprzez wyszczególnienie numerów stron z danych plików w żądanej kolejności, tzn. kolejność wystąpienia w poleceniu odpowiadać będzie kolejności w nowo utrworzonym dokumencie; w celu zdefiniowania zakresu stron używamy standardowo znaku - .

pdftk A=dokument1.pdf B=dokument2.pdf cat A1 A6-11 B3 B7-end output scalony.pdf

W ten sposób można także pozbyć się pewnych stron z dokumentu; możliwe jest także wykorzystanie jedynie parzystych bądź nieparzystych stron dokumentu, podając słowo kluczowe odd lub even bezpośrednio po podaniu zakresu stron do przetworzenia. Istotna jest kolejność, tnz. A1-14even nie będzie tym samym co A14-1even;

pdftk A=dokument1.pdf B=dokument2.pdf cat A1-8even B7 output scalony.pdf