Logiciels: pdf et txt: renommage, fusion

Rappel

L'article icaunux logiciels_de_modification_de_pdf

est plus long et exhaustif, mais pour des manipulations de base, ce qui suit doit suffire.

Fusion de fichiers txt

Ces manipulations s'exécutent en console, mais ce n'est pas si compliqué, et en tous cas moins que d'utiliser des logiciels en mode graphique, qui n'existent souvent pas…

Pas d'espaces dans les noms de fichier

Les noms de fichiers ne doivent pas comporter d'espaces. S'il y en a, vous renommez les fichiers avec pyRenamer (voir infra) !

Commande cat

  cat fichier1.txt fichier2.txt > fichier3.txt
Il serait utile d'utiliser une commande qui évite d'avoir à écrire le nom de chaque fichier.

Comment lister tous les fichiers d'un répertoire ? Avec la commande ls !

Ne lister que les fichiers qui nous intéressent:

   ls *.txt

Faire un copier coller de la liste apparue dans le terminal vers un éditeur de texte. Puis ajouter la commande cat au début du fichier, le signe > et le nom du fichier de sortie en fin de fichier.

Attention, il faudra peut être reclasser quelques fichiers dans l' ordre.

Refaire un copier coller vers le terminal cette fois.

Astuce

Comment afficher les noms de chaque fichier dans le fichier final avant le “copier-coller” ?

  head --lines=-0 *.txt > fichier.txt
Cette commande ne fonctionnera pas à moins que chaque fichier se termine par \n

Si pas de \n , alors essayer cette commande (non testée …)

   head -1000000  *.txt > fichier.txt

Renommer en masse: pyRenamer

Interface graphique, légère. Très très efficace. Prise en main rapide.

http://doc.ubuntu-fr.org/pyrenamer

Pour faciliter la prise en main de Pyrenamer, il est conseillé d'activer l'aperçu automatique et l'option “Garder les extensions” pour modifier facilement les noms de fichiers sans toucher à leur extension.

pdfsam

PDF Split and Merge (pdfsam) permet la division ou l'assemblage de documents PDF. Il se base sur Java pour fonctionner, il est donc multiplate-formes

Excellent, facile d 'utilisation .
Pour éviter les problèmes de compatibilité, décocher la case « compress output file ».

Extraire le texte d'un pdf: pdf to text

Rappel: il existe un article icaunux plus exhaustif sur le sujet

how-to-convert-all-pdf-files-to-text-within-a-folder-with-one-command

Les noms de fichiers ne doivent pas comporter d'espaces. S'il y en a, vous renommez les fichiers avec pyRenamer (voir supra) !
   commande   ls *.pdf | xargs -n1 pdftotext

convertit touss les pdf en txt dans un dossier

Liens rapides

logiciels/pdf_et_txt/renommage_fusion.txt · Dernière modification: 2014/09/18 05:34 (modification externe)
GNU Free Documentation License 1.3
Powered by PHP Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0 Valid HTML5