Logiciels de modification de PDF

Préambule

Créer un pdf est facile

Il est facile de créer un pdf à partir d'open office ou de libre office. Ces suites bureautiques ont une extension le permettant…Enregistrer sous …modifier le format de sortie, et c'est fait.

Depuis Firefox, l'extension printtopdf permet d'enregistrer la page web en cours sous forme d'un fichier pdf. Le résultat peut être excellent comme plutôt moyen, voire minable selon l' encodage des pages web.

Ce ne sera pas le but direct de cet article de traiter de ces usages “aisés”.

Récupérer les informations d'un pdf est très difficile

Beaucoup de documents intéressants sont à ce format. Il sera possible de sélectionner du texte et de le coller dans un document texte. Idem pour les documents graphiques

Limitations

  1. Le copier coller de texte ne s'effectue que pour une page ou une partie de page, voire moins selon les pdf et l' outil qui les a créés. Idem on ne copie qu'une image à la fois !
  2. Ces opérations de récupération des données brutes (texte, graphiques) sont laborieuses et vite décourageantes. Souvent les graphiques sont irrécupérables.

La mise en forme des données récupérées reste à faire.

Raisons de base

Le format pdf est un format conteneur destiné à alléger les documents, et très souvent à les protéger de toute modification. Pour ces deux raisons, il n'est pas prévu qu'il soit éditable facilement.

Des logiciels de modification de pdf

Logiciels libre exclusivement

En général, et selon votre but, vous aurez besoin d'au moins deux à quatre logiciels parmi ceux listés ci-dessous.Et d'au moins trois à cinq ou six manipulations pour recréer un document personnalisé riche en formatage.

Deux familles de programmes

Cette répartition est arbitraire.

C'est aussi celle de l' excellent article de la documentation Ubuntu dans lequel nous avons puisé abondamment.

Importer et extraire les données

Titre : “Textes, images et mise en page”.

La première famille vous permet d'importer le fichier pdf dans un logiciel afin de pouvoir en extraire les données. C'est au sein de celle-ci que les opérations sont les plus laborieuses et les plus délicates, car il s'agit d'océriser le fichier.Néologisme fait à partir du terme OCR (reconnaissance de caractère). Les logiciels d'OCR extraient et recodent du texte brut à partir d'une image “figée”.

Vu la lourdeur en mémoire des manipulations de pdf sur des machines peu récentes, il sera souvent préférable de scinder un gros pdf en autant de pages que possible !

Mise en forme (modification, découpe) d'un pdf

“Découpe, fusion, réorganisation, rotation”

La seconde famille est plus légère d'emploi, car elle ne vise pas à l'exportation (l' arrachage de données), mais plus simplement à leur remise en forme interne, enlever des pages, changer des titres…

Textes, images et mise en page

Openoffice.org-pdfimport

Cf la documentation Icaunux : libreoffice_et_pdfimport

Dans les dépôts depuis Ubuntu 9.04, cette extension d'OpenOffice.org permet de modifier des PDF (en les important dans OOo Draw puis en les ré-enregistrant en PDF).

LibreOffice Draw

LibreOffice intègre directement l'ancienne extension pdf-import.

Il faut toutefois installer libreoffice-pdfimport, Version LibreOffice du module pdfimport. Pour importer le fichier PDF avec LibreOffice Draw il faut le choisir dans la boite de dialogue mais sans oublier de sélectionner le format “PDF - portable document format (Draw)” dans la liste déroulante “tous les fichiers”.

Pdfedit

Pour éditer vos PDF (moins intuitif que openoffice.org-pdfimport). http://doc.ubuntu-fr.org/pdfedit donne peu d'infos, mais le logiciel est assez intuitif.

Evince, inkscape et format svg

Le format svg

Cette page recense les logiciels fonctionnant sous Ubuntu qui permettent de créer et manipuler ce type de fichier

Le format SVG est un format graphique vectoriel ( en langage par balises de la famille XML ) qui permet de faire des dessins en 2 dimensions, des animations ou des applications graphiques pour le web.

  • Inkscape : c'est l'application par excellence pour créer et modifier des fichiers SVG.
  • The Gimp : permet d'importer un fichier SVG pour l'enregistrer en un autre format d'image (jpeg, png, …)
  • Uniconvertor : convertit des fichiers CDR, CDRX, CDT, CMX, AI, CGM, WMF, XFIG, SVG, SK, SK1, ou AFF, en fichiers AI, SVG, SK, SK1, CGM, ou WMF.

Inkscape

http://doc.ubuntu-fr.org/inkscape

tutos_video_inkspcape

page des tutos site inkscape

manuel d'utilisation en fr

Permet la modification des pdf. Encore à améliorer mais très efficace.

Il enregistre les fichiers en .svg et permet de les retravailler.

Choix de la taille de police, import d'image dans le fichier etc.

Evince

http://doc.ubuntu-fr.org/evince

Evince permet l'impression de pdf en svg.

imprimer dans un fichier, et choisir le format de sortie

Puis l'édition avec un éditeur de svg comme Inkscape (cf ci-dessus).

Il est possible d'annoter des PDF dans Evince

  • Cela se passe dans le volet de gauche de la fenêtre d'Evince. La touche F9 devrait permettre d'afficher ce panneau latéral.
  • Deux choix se présentent parmi les possibilités d'affichage : soit afficher les vignettes, soit afficher les annotations.
  • L'affichage des annotations permet d'accéder à deux onglets : “liste” et “ajouter”.
  • L'onglet “ajouter”. En cliquant sur le bouton du stylo, il est possible d'insérer dans le fichier une annotation.
Celle-ci est paramétrable en partie. A noter qu'elle n'est pas supprimable. Il faudra donc veiller à enregistrer son travail au fur et à mesure de manière à s'assurer un retour en arrière sans grands dommages.

Pas de support des formats pdf 1.7

Les formulaires utilisant le format XML Forms Architecture (XFA) ne peuvent pas être ouverts avec Evince, qui affiche alors le message d'erreur suivant: “ To view the full contents of this document, you need a later version of the PDF viewer.You can upgrade to the latest version of Adobe Reader from www.adobe.com/products/acrobat/readstep2.html

Il s'agit par exemple du formulaire de Demande de Certificat d'immatriculation d'un véhicule.La seule solution est alors d'utiliser Adobe Reader.

Poppler-utils

Il s'appuie sur Poppler qui est une bibliothèque de rendu PDF fondée sur l'afficheur PDF Xpdf. http://doc.ubuntu-fr.org/poppler-utils

  • Poppler-utils permet l'extraction de texte, d'images, (l'import vers html etc…)
  • Poppler-utils est un paquet logiciel fournissant un ensemble d'utilitaires en ligne de commande.
  • Ces utilitaires permettent notamment d'extraire du texte ou des images d'un fichier PDF
  • pour obtenir en retour des fichiers au format texte (TXT) ou HTML.

Les utilitaires fournis sont :

  • pdftotext : pour extraire le texte d'un PDF
  • pdfimages : pour extraire les images d'un PDF
  • pdftohtml : pour transformer un PDF en HTML
  • pdftops : pour convertir un PDF en PostScript
  • pdfinfo : pour lire les informations d'un PDF
  • pdffonts : pour obtenir les informations sur la police d'un PDF.

Commandes

L'option -h permet d'afficher une liste des paramètres disponibles pour chaque utilitaire. Par exemple pour lister les options de l'outil pdftotext saisissez dans un terminal la commande suivante:

  pdftotext -h
  pdftotext fichier.pdf fichier.txt
  pdfimages fichier.pdf
  pdftohtml fichier.pdf fichier.html

etc

Océriser

Les outils cités dans tout cet article servent, par abus de langage, à “océriser” un pdf.

Formats

Un PDF peut être en deux “formats”

  • le “format 1” étant un format où les éléments textuels du pdf sont en mode texte, c'est à dire qu'on peut effectuer des recherche textuelles et copier le texte du pdf.
  • le “format 2” étant un format où les éléments textuels du pdf ne sont pas en mode texte, on ne peut pas faire de recherche ou copier quoi que ce soit.

“Océriser”, c'est passer du format 2 au format 1. Il s'agit de transformer automatiquement un fichier contenant l’image d’un document en fichier texte, grâce à une “sorte de logiciel OCR pour pdf”

Desocériser

Dés océriser (néologisme) est le contraire: il s'agit de coder des données brutes afin de les placer au sein d'un conteneur (“une image”). Celle-ci pourra également être codée en protection du document.

Déocériser un PDF (pour empêcher le copié/collé) forum ubuntu-fr

Voir comment on peut protéger un pdf ci-dessous:

Ghostscript

Ghostscript permet de générer des fichiers PDF 1.3 protégés :

  gs -dBATCH -DNOPAUSE -q -sDEVICE=pdfwrite -dEncryptionR=3 -dKeyLength=40 -dPermissions=65472 -sOwnerPassword=null -sOutputFile=sortie.pdf -f Entree.pdf

L'option -dPermissions permet de sélectionner les actions autorisées : ici ni copier, ni coller, ni imprimer n'est autorisé. Ceci permet de garder un fichier de taille faible et de qualité identique.

ImageMagick

ImageMagick est un logiciel en ligne de commande très puissant de manipulation d'images dans pratiquement tous les formats existants.

Il consiste en une suite d'outils permettant par exemple de changer le format, l'échelle, l'orientation, rajouter une bordure ou du texte, appliquer un filtre, fusionner plusieurs image, animer une suite d'images, etc…

Il est possible d'utiliser ces différents outils dans des programmes écrits en C, C++, ruby, python, perl, etc.

Convertir un pdf en autant d'images qu'il y a de pages

Imagemagick permet de convertir un pdf en autant d'images qu'il y a de pages puis d'assembler toutes les images en un seul pdf.

Il suffit lancer la commande suivante à partir du dossier ou se trouve le pdf :

   convert METTRE_ICI_LE_NOM_DU_DOCUMENT.pdf output.png

Capture d'écran interactive

Utilisez la commande

   import ma_capture.png

Le curseur de la souris se transformera alors en « croix ».

Vous pourrez alors : cliquer une fois dans l'écran pour capturer tout l'écran. tracer un cadre avec un « cliquer-glisser » qui capturera la zone définie.

http://doc.ubuntu-fr.org/imagemagick

Découpe, fusion, réorganisation, rotation, etc...

Voici la seconde partie du document

Livret

Livret par Brunetton Livret réordonne les pages d'un PDF pour avoir une brochure PDF prête à l'impression.

PDFmod

PDFmod réorganise, tourne, combine et supprime des pages dans un PDF.

Il permet aussi d'exporter des images, de modifier le titre, le sujet, l'auteur, les mots-clés, la table des matières.

PDF Chain

PDF Chain permet de réorganiser, tourner, combiner et supprimer des pages dans un PDF, et aussi rajouter un watermark.

PDFshuffler

PDFshuffler permet de supprimer des pages, de les tourner, les assembler, les ré-arranger, mais aussi le rognage.

PDF Split and Merge: PDFSAM

PDF Split and Merge (PdfSam) permet de couper/assembler des PDF. (moins pratique que PDFshuffler et PDFmod). http://doc.ubuntu-fr.org/pdfsam

Briss

Briss peut rogner des PDF par sélection à la souris.

Autres logiciels

gscan2pdf : création, concaténation, compression de PDF depuis scanner ou fichiers. xournal : permet d'annoter, surligner… les PDF. flpsed permet d'annoter les PDF.

pdftk : manipulation de PDF en ligne de commande. pdfjumbler : réorganisation de fichier PDF. pdfcrack : pour gérer les PDF protégés par mot-de-passe (pdfcrack). pdfposter : assemblage de PDF pour créer un poster (pdfposter). pdfresurrect : pour gérer l'historique de vos PDF (pdfresurrect). whyteboard : dessiner et annoter des images sur un PDF. (présent dans les dépots depuis Oneiric whyteboard).

Outils en ligne

Quelques outils en ligne existent, mais leur emploi n'est pas très efficace, voire très décevant.

convertisseurs en ligne pdf vers odt sur forum icaunux

icp.ge.ch

[quote=“icp.ge.ch”] Voici 6 convertisseurs gratuits en ligne de fichiers pdf vers d’autres formats : odt, doc, bmp, etc. Ils réussissent dans cette tâche de manière plus ou moins heureuse, faites nous part de votre expérience dans le forum associé à cet article : [/quote]

Convert PDF to Word Software

Super-fast, Accurate, Best Way to Convert PDF Documents to Word http://convertpdftoword.net

zamzar.com

http://www.zamzar.com

Ne convertit pas le html.

pdfonline.com

convertfiles.com

Convert to Open-Office

Convert PDF to ODT

Online 100% Free 100% Free, no registration or e-mail required http://oconvert.com/converter/pdf-to-odt.html

J'ai testé: pas convainquant … Conversions hasardeuses.

http://www.oconvert.com/converter/pdf-to-odt.html ne fonctionne pas correctement…http://www.oconvert.com/convert-results/Z8KBr.odt/d3e8a/pdf bof …

Et sous windows ?

Les outils sous windows ne sont pas plus efficaces que sous Linux, à part peut être quelques logiciels payants.

Mais ne rêvons pas ! Vu leur coût modeste (moins de 50 € habituellement et sans doute plus pour quelques-uns), ils ne font pas non plus de miracles.

Liens

logiciels_de_modification_de_pdf.txt · Dernière modification: 2014/10/16 09:32 (modification externe)
GNU Free Documentation License 1.3
Powered by PHP Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0 Valid HTML5