Classement et archivage pérènne des photos et vidéos numériques

Le contexte

Les rares données que je souhaite conserver pendant une durée infinie sont mes photos et vidéos. La majorité des documents et des données que je produit aujourd'hui à titre personnel n'auront aucune signification dans 15 ans. Ce qui n'est pas le cas des photos et vidéos.

Je ne parle pas ici de la pérénité du support de stockage. Ceci est une autre sujet que j'ai réglé depuis longtemps, en partant du principe qu'aucun support de stockage informatique destiné au grand publique n'est à longue durée. La solution m'a parut évidente : copier les données d'un ancien support vers un nouveau support.

Mes souhaits :

  • ranger mes photos et vidéos sur le PC suivant une arboresence simple du type : année, date rangement sur PC ou/et evenement afin de toujours pouvoir les retrouver sur ce principe, quoi qu'il arrive.
  • pouvoir retrouver mes photos et vidéos par une recherche sur des informations comme le lieu, le nom des personnes sur la photo, un nom d'événement particulier, etc..
  • pouvoir visualiser photos et vidéos directement dans le logiciel de base de donnée.
  • utiliser un logiciel de base de donnée photos et vidéo pérenne dans le temps.
  • archiver l'ensemble des photos et vidéos dans un fichier découpable en plusieurs parties d'environ 2.5 Go chacune pour faciliter la copie de sauvegarde sur disque dure USB externe. Il s'agit ici de regrouper une arboresence de répertoire et sous répertoire très complexe en queques fichiers.
  • pouvoir vérifier que les archives ne sont pas corrompues.
  • pourvoir facilement et rapidemement extraire une photo ou un répertoire complet de l'archive.
  • utiliser un logiciel d'archivage pérenne.

Ce que je fais

Quelques principes de base

Je suis sur Linux depuis longtemps, les principes ci-dessous sont valables quelque soit le système d'exploitation, mais les logiciels utilisés sont sous Linux.

Toutes mes photos se trouvent sur mon PC, en permanence. Je réalise une sauvegarde sur disque dur USB externe, mais ce ne sont que des sauvegardes.

Je parle de photos pour simplifier le texte, mais le comprendre comme photos et vidéos.

Tri et « nettoyage » des photos

Je crée un répertoire directement sur le bureau et je le nomme avec la date du jour, au format année-mois-jour (exemple : 2009-06-30). Ce format de date permet un tri automatique par date. J'ajoute éventuellement à la fin la description d'un événement particulier si toutes les photos sont concernées.

Nota : je ne mets jamais d'accent ni d'espace dans le nom du répertoire. C'est difficile pour un français, mais ceci évite beaucoup de problèmes lors des changements de PC et de système d'exploitation au fil des ans. Pour remplacer les espaces, j'utilise des tirets (touche 6), tirets bas (touche 8) ou des débuts de mot avec une majuscule.

Je copie les photos de l'appareil photo dans le répertoire puis j'efface les photos floues, les doublons, les ratés. C'est important car les photos vont s'accumuler au fil des ans et je ne souhaite garder que celles qui signifient quelque chose. J'effectue également la rotation des photos lorsque c'est nécessaire.

Je fais tout ceci avec un simple visualiseur d'image. La seule chose importante est qu'il ne change pas la date EXIF de la photo lors des rotations. Je pourrais faire ceci directement dans le logiciel de base de données, mais actuellement je préfère le faire en dehors.

Déplacement du répertoire

Je déplace le répertoire du bureau vers son emplacement définitif, dans l'arborescence de stockage des photos sur mon PC.

J'ai un répertoire « sommet » nommé Images qui contient tous les autres sous répertoires. Ce répertoire Images contient un répertoire Famille et d'autres pour mes activités associatives. Viennent ensuite des sous-répertoires par année (2007, 2008, 2009). Je place le répertoire avec mes nouvelles photos dans l'année correspondante.

Indexation des nouvelles photos

L'indexation est un point indispensable pour la recherche les photos dans le futur. J'utilise Kphotoalbum (http://www.kphotoalbum.org), un logiciel pour le bureau KDE.

J'ai paramétré Kphotoalbum pour qu'il prenne en compte les photos du répertoire « sommet » Images. Dans Kphotoalbum, j'ouvre le répertoire que je viens de déplacer pour afficher les vignettes des photos.

Je sélectionne les photos qui sont sur un même lieu (ville, etc..) et je les marques toutes simultanément avec le nom du lieu. Si le lieu est déjà présent dans la base, la frappe des premières lettres du lieu affiche une sélection réduite.

De la même façon, je marque les photos avec les évènements (anniversaire, mariage, etc..) ou des mots clefs particuliers (Canyoning, fantaisie, etc..).

Pour le marquage des personnes, Kphotoalbum possède un mécanisme très pratique. Je visualise les photos une par une et en grand format afin de voir les personnes. Lorsque la photo est affichée, l'appui sur une lettre du clavier va marquer la photo avec cette lettre. J'utilise la lettre « D » pour David, « H » pour Hélène, etc. Je marque de cette façon toutes les personnes présentes sur la photo. Je procède la même façon pour toutes les photos. Je fais ensuite une recherche sur une des lettres, exemple « D », ce qui affiche toutes les photos marquées avec « D ». Je sélectionne toutes les photos affichées et je les marque avec le vrai nom David. Comme précédemment, si la personne est déjà présente dans la base, la frappe des premières lettres affiche une sélection réduite. Je procède de la même façon pour toutes les lettres utilisées. Avec un peu d'habitude cette phase se réalise rapidement.

Kphotoalbum est un logiciel libre qui évolue régulièrement. Sa base de donnée des photos, c'est à dire l'emplacement, le nom, la somme de contrôle (checksum) des photos et tout leurs marquages, sont dans un fichier indépendant au format XML. Avec une certaine expérience, il est possible de le lire directement. Mais le plus important c'est que si nécessaire, il sera possible dans 20 ans de relire les liens entre les photos et leurs marquages. Ce ne sera peut-être pas facile mais cette possibilité existe, indépendamment de Kphotoalbum, ce que peu de logiciels peuvent prétendre faire aujourd'hui.

Ceci est un point important pour que le temps passé sur l'indexation ne soit pas perdu.

Création d'une archive des photos

La copie de nombreux répertoires, sous répertoires et fichiers vers un disque dure USB externe m'a posé quelquefois des problèmes : interruption de copie et durée très importante de celle-ci. Pour éviter ces problèmes, je créé une archive avec toutes les photos et c'est cette archive que je copie.

J'utilise un logiciel libre nommé Dar (http://dar.linux.free.fr) Ce logiciel est fantastique mais n'a rien à voir avec un logiciel de compression de fichier (rar, zip, etc..). Il va permettre de :

  • créer un fichier d'archive unique à partir d'un répertoire de « sommet », avec tous ses sous-répertoires et fichiers.
  • découper ce fichier d'archive en plusieurs fichiers de taille définie. J'ai choisi une taille à 2,5 Go mais n'importe quelle valeur est possible.
  • vérifier l'intégrité des fichiers présents dans l'archive.
  • compresser les fichiers d'une façon générale et sélectionner certains types de fichiers, comme JPG, TIFF, MP3, AVI, etc.. à ne pas compresser. Il s'agit de ne pas compresser une deuxième fois un fichier déjà compressé. Ceci est un gain de temps considérable pour la création d'une archive de photos et vidéos.
  • exclure des répertoires et des types de fichiers.

Dar est un logiciel conçu pour pouvoir fortement personnaliser ses processus d'archivages à l'aide de scripts, il ne possède pas d'interface graphique en propre. Mais il existe au moins deux interfaces graphiques indépendantes sous Linux : Kdar (http://kdar.sourceforge.net) pour le bureau KDE et DarGui (http://dargui.sourceforge.net) tout type de bureau (en GTK+). Ces deux interfaces graphiques permettent de réaliser toutes les opérations nécessaires pour l'archivage des photos, mais beaucoup d'autres fonctions de Dar ne sont pas prises en charge. J'utilise Kdar, bien qu'il semble ne plus évoluer depuis quelques années, principalement parce qu'il permet d'enregistrer les réglages dans un fichier externe. A l'utilisation suivante, il suffit de lire ce fichier pour retrouver tout ses réglages, ce qui est un gain de temps intéressant. DarGui semble évoluer rapidement et est également très pratique.

Kdar et DarGui vont permettre facilement de :

  • visualiser très très rapidement le contenu d'une archive, sous forme d'une arborescence. Contrairement aux logiciels de compression, c'est un fichier catalogue embarqué dans l'archive qui est lu, aucun désarchivage n'est réalisé.
  • extraire rapidement d'une l'archive un fichier unique ou un répertoire unique avec ses fichiers. Là encore nous sommes très loin du comportement des logiciels de compression.
  • contrôler la validité des fichiers dans l'archive.

Pour donner une idée, 10 Go de photos sont archivées en environ 35 minutes sur mon PC (qui n'est plus très jeune).

Sauvegarde des archives sur le disque dur USB externe

Ici, le problème n'est pas la copie des archives mais d'être certain qu'elles ne seront pas corrompues lors de la copie et d'avoir un moyen pour vérifier cette intégrité dans le futur.

J'utilise une somme de contrôle (checksum) pour réaliser cela. J'ai choisi SHA1 comme compromis entre finesse du checksum et rapidité pour la calculer (MD5 aurait été plus rapide, mais je peux me permettre ce luxe de précautions).

Je calcule les checksums de toutes les archives sur le PC. Ces checksums sont écrits dans un fichier au format texte. Le calcul des checksum se fait par une ligne de commande dans une console ouverte dans le répertoire où sont placées les archives. La commande

sah1sum *.dar > images_2009-06-30.sha1

va calculer les checksum de tous les fichiers archives (dar) et écrire ces checksums dans un seul fichier nommé images_2009-06-30.sha1.

Je copie les archives et le fichier des checksums dans un répertoire sur le disque dur USB externe.

Je vérifie le checksum de toutes les archives sur le disque dure USB externe. La vérification des checksums se fait sur le même principe, en ouvrant une console à partir du répertoire de sauvegarde des archives sur le disque dur USB externe. La commande

sah1sum -c images_2009-06-30.sha1

va lancer la vérification des checksums de toutes les archives du fichier images_2009-06-30.sha1 et afficher le résultat de la vérification pour chaque archive.

Pour terminer, j'efface les archives sur mon PC, pour préserver mon espace disque dur.

Si je dois copier les archives du disque dure USB externe vers un autre support ou PC, j'utilise le fichier des checksums à chaque fois pour vérifier l'intégrité des archives après la copie.

Tout ceci prenant un certain temps (même la copie est longue) et étant répétitif, j'ai écrit un script pour automatiser l'opération. J'ai passé un certain temps pour l'écrire mais il fonctionne bien et me permet d'automatiser l'ensemble du processus de copie sur le disque dure USB externe, depuis la création d'un répertoire spécifique sur le disque USB jusqu'à la suppression des archives sur le PC.

Nota

Divers

Je ne renomme jamais les photos elles-mêmes sauf si j'ai des photos de différents appareils photo et que les noms de fichiers sont identiques.

Il faut un espace disque PC important pour procéder de cette façon, car la taille des fichiers archive est équivalente à ce qu'il faut archiver. 10 Go de photos donnent environ 10 Go de fichiers archives, il faut avoir un espace disque libre supérieur à 10 Go.

Je n'effectue pas d'archivage incrémental, pour l'instant. Le temps d'archivage et de copie sur disque dur USB externe est encore relativement réduit, ce qui permet d'archiver la totalité de mes photos à chaque fois. Sécurité absolue. Je devrais probablement réviser ce choix lorsque j'aurais 500 Go de photos.

Je conserve sur le disque dur USB externe jusqu'à 5 archives réalisées à des dates différentes. Ensuite j'efface les plus anciennes.

La suppression de fichiers de plusieurs Go peut prendre du temps en raison de leurs déplacement dans la corbeille. J'effectue donc cette suppression en console, avec la commande 'rm -r -f *.dar'. Attention, très rapide mais sans filet.

Kphotoalbum

Une fonction pratique est le regroupement des index par catégories. Exemple : les membres d'une famille peuvent être groupés dans une catégorie « Famille XXXX », ce qui rend très pratique la sélection de la bonne personne et la recherche.

Les recherches se font par personnes, évènements, date, lieu, etc.. et sont multi-critères.

L'affichage des photos et vidéo se fait directement dans Kphotoalbum.

Kphotoalbum a beaucoup d'autres fonctions que je n'utilise pas.

Dar

Dar se prête très bien à l'automatisation de l'archivage. Il est possible de paramétrer très finement le comportement désiré dans un fichier texte et de lancer une commande Dar avec ce fichier texte en argument.

classement_et_archivage_perenne_des_photos_et_videos_numeriques.txt · Dernière modification: 2011/09/03 17:29 (modification externe)
GNU Free Documentation License 1.3
Powered by PHP Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0 Valid HTML5