Extraire les images d'un PDF
Sous Windows et Linux, en ligne de commande
1) Téléchargez xpdf (gratuit):
http://www.foolabs.com/xpdf/
Téléchargement direct pour Windows :
http://ctan.mines-albi.fr/support/xpdf/xpdf-3.02.zip (769 Ko).
Téléchargement direct pour Linux :
http://ctan.mines-albi.fr/support/xpdf/xpdf-3.02pl4-linux.tar.gz (11,4 Mo).
2) Dézippez ce fichier et récupérez pdfimages.exe
3) Récupérez les images de votre PDF:
pdfimages -j monpdf.pdf .
Créer un PDF à partir d'images
Avec Image Magick sous Linux
Il vous faut nommer les images pages par pages de 000.ext à XXX.ext
puis
pour créer un document PDF à partir d'une série d'images png :
convert -compress jpeg images_*.png document.pdf
ou plus simple si votre dossier est propre:
Si vous avez quelques message d'erreur du type
convert: not authorized `image.pdf' @ error/constitute.c/WriteImage?/1028.
Un développeur sadique a trouvé bon d'interdire les conversions vers le format PDF (et autres). Il faut éditer le fichier /etc/
ImageMagick?-6/policy.xml et supprimer (ou commenter) les lignes :
<!-- disable ghostscript format types -->
<policy domain="coder" rights="none" pattern="PS" />
<policy domain="coder" rights="none" pattern="EPS" />
<policy domain="coder" rights="read|write" pattern="PDF" />
<policy domain="coder" rights="none" pattern="XPS" />
ou ce message d'erreur
convert-im6.q16: DistributedPixelCache? '127.0.0.1' @ error/distribute-cache.c/ConnectPixelCacheServer?/244
Il faut modifier le fichier de configuration d'imagemagick pour augmenter le cache (attention à disposer de la mémoire correspondante!):
/etc/
ImageMagick?-6/policy.xml
<policy domain="resource" name="memory" value="3GB"/>
<policy domain="resource" name="disk" value="2GB"/>