Version 0.2 ----------- 25 octobre 2002 : ajouts - Teresa Gomez-Diaz 22 octobre 2002 : version originale - Joel Marchand Préambule ========= * les dégats des eaux, du feu, du vol, etc les crashs logiciels les erreurs humaines etc sont des événements probables !! -> faire des roulements sur les bandes ne pas les stocker à coté des lecteurs relire effectivement les bandes au moins de temps en temps en avoir "loin" du bureau (ex : à son domicile) -> seule vraie garantie archivage mais attention à respecter d'éventuelles clauses de confidentialité des données issues par ex. de contrats * ce qui suit ne parle que de sauvegarde centralisée sur un stockage centralisé. On ne croit pas ni à la sauvegarde centralisée d'un stockage très distribué sur les postes persos, ni au fait que les gens fassent par eux-meme des sauvegardes dignes de ce nom. Support ======= * technologies à bande différentes tailles physiques : 4mm, 8mm, 1/2" différentes capacités : auj. une bande est à nouveau souvent plus petite qu'un disque dur ! différentes technologies : hélicoidales : 1 tete qui se déplace sur n pistes linéaires : n tetes sur n pistes en // -> plus cher, car plus compliqué différentes débits : combien de Mo/s ? en pratique, par 'tar', on n'obtient que la moitié -> pour avoir autre chose, cad >90%, il faut, comme pour la gravure de CD, alimenter parfaitement, par ex. via un 'dd' du gros fichier .tar déjà fait sur disque différents prix : ceux des lecteurs, des media constante : attachement SCSI compression hardware par le dérouleur : jusqu'à un facteur 2, avec le meme algo que 'compress' -> en pratique sur des fichiers de matheux pures : 1.7 difficile de faire des benchs à cause des effets de cache et qu'il faudrait faire de grosses manips pour que cela soit pertinent * DAT - 4mm - le plus utilisé sans doute, car le meilleur rapport prix/capacité - DDS 1 (2/4), DDS 2 (4/8), DDS 3 (12/24), DDS 4 (20/40) - jusqu'au DDS 2, constat : technologie pas fiable 1 lecteur par an ! bandes écrites, mais illisibles -> grosses frayeurs -> autres avis contraires et donc positifs - quelques bons retours d'expériences avec des DDS 3 quid des DDS 4 ? * DLT - 1/2" - le cran au-dessus : technologie plus professionnelle - plus chère DLT 15/30 - 20/40 - 40/80 SuperDLT 110/220 - 160/320 compatibilité ascendante en lecture - mes proches collègues : on aime nettement plus que le DAT très grande fiabilité - 0 problème sur plus de 5 ans - unanimité pour dire que cela marche bien * LTO - grand concurrent du DLT, moins cher/Go il y a qqs mois, mais quid auj. avec le SuperDLT 160/320 ? - lecteur 100/200 - un retour d'expérience très bon * AIT et autres - personne ne connait * robotique - librairies composées de 1 (ou plusieurs) lecteurs avec n (éventuellement très grand) bandes - cout exponentiel - plus petit modèle : environ 2 fois le prix d'un lecteur - pilotage : très dépendant du logiciel - bien réfléchir à l'usage versus le prix * gravage de CD-ROM - réponse actuelles des utilisateurs - fiabilité ? pérennité ? - demain gravage de DVD ? -> ca reste de ttes facons pour des volumes individuels constat professionnel : ce n'est pas de la sauvegarde - trucs et astuces sur le sujet : plus on grave vite, moins c'est fiable les CD gravés sont très sensibles à la lumière, aux doigts, aux rayures, ... les CD-R pas chers sont moins bons que les plus chers si on veut relire partout, il faut faire de l'ISO 9960 et alors, pas besoin des zolis logiciels clic-clic -> un outil en ligne comme 'cdrecord' est mieux. Logiciels ========= * notion de sauvegarde totale incrémentale ; diff / à la dernière totale différentielle ; diff / à la dernière sauvegarde * outils maison basés sur l'usage des commandes cpio pas forcément obsolète / tar mais => culture Unix ancienne tar sans doute le plus utilisé portable :-) dump la tradition Unix, mais cela dépend du f.s -> pas portable charme de l'interactivité dans la restauration dd garanti sans bug :-) efficace (cf + haut) pour accéder au lecteur à utiliser en couplage avec un .tar préalable mt commande permettant de sauter de fichiers en fichiers sur la bande -> au lieu de faire un énorme 'tar' unique, faire plusieurs 'tar' en utilisant la fonction 'norewind' du device, et utiliser 'mt -f /dev/... fsf n', pour aller au n+1 tar sur la bande -> temps d'accès nettement amélioré garde au chaud de l'"index des fichiers" via par exemple la conservation du produit de tar t ou nettememnt mieux tar c ; ecriture tar t ; relecture -> verification rem : ca prend du temps ! * logiciels libres - Amanda très ancien + développement tjs vivant : garantie aucune interface GUI => forte culture Unix les bandes peuvent etre relues par les outils 'tar' ou 'cpio' :-) orienté 1 seule bande & petits volumes gestion des robotiques ? client Windows - Arkeia gratuit pour 1 serveur + 1 client mais 50 KF pour 1 serveur + 7 clients on peut relire les bandes sans le logiciel maitre, avec des outils fournis deux bons retours d'expérience client Windows - autres ? il y en a un en développement qui promet, mais lequel ? * logiciels payants Unix - grands logiciels professionnels pour grosse configuration et fortement distribué les prix sont souvent très elevés ex : Time Navigator de Quadratec (France) Networker de Legato souvent mis en oeuvre par le CRI nécessitent un administrateur dédié et compétent attention au syndrome : on a oublié de sauver la base d'index la machine qui tourne le soft maitre est H.S. .... plusieurs avis différents : - complémentaire uniquement par rapport à sa propre sauvegarde, car sinon délégation d'une grosse responsabilité - mais si le CRI fait cela bien, quel confort ! - Tina, c'est très confortable pour la restitution - Tina, ca a aussi des bugs => modif sur le f.s ! - autres logiciels Unix plus abordables ? * monde Macintosh - Retrospect logiciel déjà ancien et qui évolue encore : garantie notion de poste maitre et de postes clients sauvegarde totale et incrémentale interface à la Mac, mais non immédiatement triviale - outil DUMP (?) gratuit sous MacOS <=9 ? - outil HSFpacks sous MacOS 10 ? * monde Windows - Backup livré avec les systèmes Windows : ca marche en fait. - ?? * systèmes d'archivage - très lourds et très chers - nos volumes de données croisent nettement moins vite que les disques durs. -> il suffit d'etre raisonnablement conservateur et ordonné pour garder tout dans son $HOME au fur et à mesure que le temps passe ex perso : depuis 1986, mon $HOME fait 400 Mo - rapport cout/organisation/usage par les gens disproportionné complexité réelle pour savoir quoi, quand, sur quel media, à quel format, avec telle technologie, archiver qqch - aucun intéret dans nos environnements - je n'ai jamais eu vent de tels vrais usages dans nos environnements - par contre, cela vaut le coup de faire des "photos" de tous les fichiers du labo sur les media de sauvegardes. Ils ont la durée de vie du media et de la technologie du lecteur (DDS, puis DLT chez nous). -> quelques cas réels d'usage, qui justifient le peu d'efforts que cela m'a demandé - attention au syndrome il faut retrouver le source TeX de l'article soumis par un thésard parti il y a 2 ans -> idée : garder tout en ligne, car les disques le permettent Exemple de Jussieu ================== * depuis 4 ans : 1 lecteur DLT 15/30 + 3 lecteurs DLT 20/40 externes sur 2 serveurs de fichiers 1 serveur Mac - AppleShare IP 1 serveur de messagerie * logiciel : tar / !! - on aime bien - on maitrise - c'est portable, durable - les bandes sont relisibles partout, tout le temps - ca suffit à nos besoins - cout minimal -> pas de robotique de logiciel à maintenir, à payer * on complète pour les autres serveurs n'ayant pas de DLT directement attachés, en sauvant les fichiers importants /etc /usr/local la plus value qu'on y met au-delà de l'OS à coup de rsync + ssh de root à root + clef privée vers le serveur de fichiers * pour le Mac sous MacOS, usage de Retrospect, mais en mode local * pour minimiser les couts de sauvegarde, cad concrètement allonger la durée de vie des DLT, on impose un $HOME <= 500 Mo sur les disques SCSI et sauvés le reste en scratch sur les disques IDE en miroir * par contre, on garde en ligne tous les comptes utilisateurs, meme ceux qu'on a bloqués, puis supprimés. On met simplement les fichiers sur un disque moins cher. Remarques en vrac ================= * j'aime bien les lecteurs externes autonomes -> indépendance en cas de crash du serveur hote ou de sinistre * plus l'informatique est omni-présente, plus on centralise, plus on devient responsable -> dualité : tache chiante et sans interet grosse responsabilité - pas droit à l'erreur