Ceci est un supplément à la réponse de @Dennis du 18:06 30 juillet 2012. Il aborde certainement le cas le plus difficile.
Dans le cas le plus simple où le filigrane est un texte simple, sans ornement, par exemple
Smedley For Commissioner
les filigranes PDF non compressés pourraient être définis comme ceci :
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
où 75.96
est le décalage horizontal et 625
le décalage vertical pour ce cas particulier de filigrane. (Oui, on peut voir à la fois des nombres réels et des entiers.)
Une regexp comme celle qui suit fonctionnera pour tous ces filigranes, en ignorant toute variation dans leur emplacement :
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Soyez conscient, tho, qu'une variété d'opérateurs PDF modificateurs peuvent entrer en jeu avec des filigranes qui ont un formatage plus compliqué. Une telle fantaisie peut transformer ce que le lecteur attend (espère ?) d'une chaîne de caractères contiguës, facile à trouver, en une soupe d'alphabet. Par exemple,
E1 = mc² par Smedley™
pourrait être le produit de cela :
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
… ou bien pire si votre filigrane est coloré !
Ayant noté tout cela, je noterai également que PDFtk possède une version GUI qui prétend gérer les filigranes, en contrepartie d'un droit de licence de 4 $. Pas cher du tout !
D'un autre côté, je trouve que son site web annonce actuellement un support complet pour les O/S par le biais de Windows 8
et OS X 10.8 Mountain Lion
. Cette cuvée date de plus de 4 ans. PDFtk pourrait-il être dépassé ? Je pense que non, mais je ne sais pas.