Vous n'êtes pas identifié(e).
SOURCE
Document pdf complexe tableaux images, plus de 500 pages
Mal formaté.
BUT: passer en texte, pas le txt ( pauvre en formatage), mais du texte plus "riche" odt c'est bien.
Pas d'utilitaire performant dans les dépôts, ceux en ligne sont mauvais.
1 / Passage obligatoire par le HTML avec pdftohtml
c'est mieux ( plus simple) si nautilus_extensions est installé. car cela permet depuis l'explorateur d'ouvrir le terminal ( car on fait le boulot en console) - clic droit ouvrir dans le terminal
puis vous entrez la commande ( pas besoin d'être admin)
pdftohtml <nom_fichier.pdf> <nom_fichier.html>
Le résultat
donne fichier.html fichiers.html, fichier-ind.html et x fichiers png avec le numéro de la page d' origine, et si plusieurs images par page, un incrément -n
C'est fichiers.html qui nous intéresse.
2/ Ouvrir le html avec un navigateur
rem: Pas testé avec firefox; mais OPERA: clic droit ouvrir avec opera / afficher décocher images
3/
ensuite sélectionner le texte et le copier, puis le coller dans votre document odt créé pour l' occasion.
Il ne restera qu'à régler les soucis de retours à la ligne intempestifs, ainsi que les éventuelles coupures de mot devenues inutiles suite au reformatage de chaque ligne.
cf le post immédiatement précédent dans cette section...
AVANTAGES:
vous pourrez visualiser les images dans l'explorateur de fichiers avec evince et lancer même un diaporama.
ou tout simplement explorer toutes ces images depuis l' explorateur ( ctrl + pour grossir les vignettes.)
Hors ligne