Comment convertir Word (doc) en PDF sous linux ?
J'ai un ensemble de fichiers en format .doc, qui doivent être convertis en format .pdf. J'utilise Ubuntu linux.
J'ai un ensemble de fichiers en format .doc, qui doivent être convertis en format .pdf. J'utilise Ubuntu linux.
Alternative 1)
sudo apt-get install cups-pdf
Puis, naviguez vers Système > Administration > Impression et créez une nouvelle imprimante, définissez la comme imprimante de fichiers PDF, et nommez la comme “pdf”.
Puis lancez :
oowriter -pt pdf your_word_file.doc
Maintenant, vous trouverez votre fichier .pdf dans ~/PDF.
Alternative 2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
Si le paquet tetex-extra n'est pas disponible avec votre distribution, essayez texlive-base plus texlive-latex-base :
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
Vous pouvez utiliser :
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Si vous utilisez X, vous pouvez le faire via Open Office. Puisque vous êtes sur le point de vous opposer à ce que vous le fassiez manuellement, souvenez-vous qu'il y a quelques beaux scripts de macro dans Open Office pour que vous puissiez l'automatiser . Vous pouvez faire quelque chose de similaire avec AbiWord (AbiWord –to=pdf).
Si vous n'avez pas X, alors il y a un anti-mot, mais qui extrait simplement le texte - sans formatage ni graphiques. Il y a aussi wvWare que j'ai utilisé pour extraire en masse des images de fichiers doc, mais je n'ai jamais essayé de l'utiliser pour convertir des fichiers doc en pdfs.
Oh et les fichiers .docx peuvent bien avoir besoin de quelque chose de différent, mais comme ce ne sont que des fichiers xml zippés, il ne devrait pas être trop difficile de faire quelque chose d'utile avec eux. Pour l'extraction en masse d'images, il suffit de les décompresser et de copier le répertoire images, mais je n'ai jamais eu besoin de les convertir sous Linux.
Vous pouvez également le faire avec AbiWord :
sudo apt-get install abiword
Ensuite, vous pouvez charger des fichiers .doc dans l'interface graphique d'AbiWord et les exporter au format PDF, ou à partir de la ligne de commande :
abiword --to=pdf filename.doc
: [ AbiWord ]0x3
J'essaierais d'utiliser pour Linux
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
Pour Windows :
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter nécessite qu'OpenOffice.org fonctionne en tant que service et écoute sur le port 8100 (par défaut) ; la façon la plus simple de démarrer OpenOffice.org en tant que service est de le faire à partir de la ligne de commande :
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
```.
Open Office est un bon moyen d'avancer, mais la fidélité de conversion n'est pas toujours au rendez-vous.
Si vous recherchez une solution 100% Linux, c'est la meilleure façon de progresser. Cependant, si vous n'êtes pas contre une simple Windows Box et que vous écrivez un peu de code pour l'interfacer avec votre système Linux, alors jetez un oeil à ce post .
J'ai écrit ce billet pour que les clauses de non-responsabilité habituelles s'appliquent.
dopdf
dans le Windows virtuel dopdf
comme imprimante par défaut lors de l'installation.*.doc
dans le bureau virtuel et imprimez-la sur l'imprimante virtuelle dopdf
.*.pdf
apparaîtra dans le dossier My Documents
du Windows virtuel