Sun Inner Circle: For Business & Technology Leaders Sun Inner Circle: For Business & Technology Leaders

La nouvelle équation économique de l'archivage de données


Le CTO Stockage de Sun explique pourquoi la bande a le vent en poupe

Chris Wood Que font les entreprises avisées avec les montagnes de données qu'elles génèrent ? Selon Chris Wood, le CTO de l'entité Data Storage Management Practice de Sun, la réponse réside dans un système d'archivage multiniveau intelligent tirant parti des avantages économiques du stockage sur bande. Sun Inner Circle a récemment rencontré Chris Wood afin de mieux comprendre pourquoi la bande est toujours d'actualité d'un point de vue économique et concurrentiel.

Inner Circle : Qu'est-ce qui motive le besoin d'archiver à long terme ?

Chris Wood : L'archivage à long terme répond essentiellement à trois types de considérations : l'accroissement des besoins de conformité réglementaire, la nécessité d'une bonne gouvernance d'entreprise et la prise de conscience du potentiel de l'information historique en tant qu'arme concurrentielle. Dans nombre d'organisations, ces trois facteurs aboutissent à un doublement de la quantité annuelle de données à archiver.

Les économies potentielles que permet un archivage intelligent de l'information ne sont pas non plus à négliger. Je pense notamment au cas de ce constructeur automobile qui a décidé d'archiver les informations relatives à chaque étape du processus de construction. Cette mesure lui permet aujourd'hui de réduire le nombre de véhicules à rappeler en cas de défaut de fabrication : l'entreprise n'a qu'à identifier l'unité de production et les machines à l'origine du défaut, puis à rappeler les seuls véhicules issus de ces installations — et non l'ensemble de la flotte en circulation ! Il s'agit d'un exemple parmi d'autres, qui montre bien l'impact de l'information archivée sur le mode de fonctionnement d'une entreprise.

IC : Comment sait-on que des données sont mûres pour l'archivage ?

CW : Comme presque toutes les questions liées au stockage, la décision d'archiver doit toujours être liée au coût de conservation des informations stockées. Il est important de pouvoir justifier de l'utilité des données présentes sur un disque en rotation. Nombre d'organisations font des pieds et des mains pour optimiser les systèmes dont elles ont besoin pour fonctionner au quotidien, alors que ceux-ci sont souvent encombrés d'informations ne nécessitant pas d'accès fréquents.

Il importe également de faire clairement la distinction entre stockage et archivage. Par exemple, un e-mail enregistré sur la bande de sauvegarde d'un serveur ne fait pas partie des données archivées — il s'agit d'une simple sauvegarde. Lors de l'archivage, les données anciennes sont retirées de la base de données active, ce qui libère de l'espace pour traiter plus efficacement les informations courantes.

En transférant des données vers une archive protégée, non seulement vous améliorez la performance des serveurs associés à la base de données, mais vous réduisez substantiellement les besoins en stockage en diminuant le volume de données à traiter. Cela dit, bien des entreprises ont du mal à identifier les données en fin de cycle actif — c'est pourquoi Sun propose des services d'évaluation leur permettant d'analyser et d'identifier les données candidates à l'archivage.

Un format de stockage ouvert est indispensable pour réaliser des économies à long terme, car les formats de fichier sont nécessairement appelés à évoluer (...) La pire chose qu'une entreprise puisse faire en archivant ses données, c'est de les enregistrer dans un format propriétaire.

IC : Comment les entreprises peuvent-elles préparer l'accès à leurs données dans le futur sans savoir comment les formats de fichier vont évoluer ?

CW : Les migrations de données reviennent cher. Le rôle d'une archive bien conçue est donc d'en limiter la fréquence à environ une fois tous les 20 ans. Un format de stockage ouvert est indispensable pour réaliser des économies à long terme, car les formats de fichier sont nécessairement appelés à évoluer. De plus, les équipements et les applications actuellement capables de lire certains types de données ne seront peut-être plus disponibles dans un futur éloigné. La pire chose qu'une entreprise puisse faire lorsqu'elle archive ses données, c'est de les enregistrer dans un format propriétaire.

Historiquement, Sun a toujours conçu ses nouvelles générations de lecteurs de bande de telle sorte qu'ils soient capables de lire le format des supports bande de précédente génération. C'est ainsi que nos actuelles bibliothèques de bandes Sun StorageTek 9840 peuvent encore lire les supports correspondant à la première génération de cette famille de produits — ce qui représente près de 20 ans de rétrocompatibilité intégrée.

IC : Comment rendre l'archivage de données plus économique ?

CW : Pour l'essentiel, on peut considérer qu'un archivage est économique lorsqu'il permet d'accéder aux anciennes données dans leur format original, sans se préoccuper de savoir si elles sont stockées sur disque ou sur bande. Pour commencer, cette caractéristique permet à l'organisation de choisir le lieu d'archivage le plus judicieux pour chaque type de données. Mais l'accessibilité de l'information historique à travers les applications d'origine permet en outre d'éviter les étapes consistant à extraire manuellement les données pour les convertir dans leur format initial. De cette façon, un document de traitement de texte ou une feuille de calcul resteront immédiatement accessibles en tant que tels.

Sun gère cet aspect au moyen d'une couche logicielle spécialisée appeléeSun StorageTek Storage Archive Manager (SAM). Cette couche présente aux applications une interface unifiée de lecture/écriture des données d'archive, qui les dispense de connaître le type de support ou de réseau de stockage sous-jacent. Les utilisateurs ont également la possibilité d'adjoindre à SAM des politiques permettant à cette couche logicielle de contrôler la localisation physique des données, ce qui allège considérablement la tâche de l'administrateur système.

De plus, SAM est conçu pour protéger les investissements existants en stockage de données : le logiciel est en effet capable de restaurer n'importe quel type de données quelle que soit l'application qui les a créées — ou le type de réseau sur lequel elles sont stockées.

IC : Vous avez fait plusieurs fois référence à la bande magnétique. Pourquoi celle-ci devrait-elle jouer un rôle aussi important dans l'archivage à long terme ?

CW : La bande s'avère extrêmement économique en termes de consommation électrique, de capacité de stockage et d'encombrement physique. Tout compte fait, il est plus économique de conserver les données opérationnelles actives sur disque et de stocker tout le reste en archive. N'oubliez pas qu'au repos, la bande ne consomme aucune énergie. Et comme les données qu'elle contient ne font pas l'objet d'accès fréquents, pourquoi gaspiller de l'énergie pour une chose qui ne sert qu'occasionnellement ?

Les cartouches de bande se passent fort bien de plancher surélevé, ce qui permet de conserver l'espace du datacenter pour les systèmes qui en ont réellement besoin — serveurs, lecteurs à support rotatif, équipements réseau ou autres. De plus, avec une solution telle que SAM, l'information historique reste accessible et peut aisément être transférée sur disque.

Pour tout ce qui touche au coût global de conservation des données ou à la réduction de l'espace occupé pour l'archivage, c'est la bande qui sort à chaque fois gagnante.

IC : Comment la capacité de stockage sur bande s'inscrit-elle dans l'équation économique du système d'archivage ?

CW : Pour tout ce qui touche au coût global de conservation des données ou à la réduction de l'espace occupé pour l'archivage, c'est la bande qui sort à chaque fois gagnante. Avec le système de fichiers Sun SAM, il est possible de remplir une bande à raz bord de façon à y stocker deux fois plus de données que sur un disque — pour un encombrement physique sensiblement équivalent. Souvenez-vous de plus que la plupart des disques affichent des taux d'utilisation voisins de 50 %. Enfin, la bande la bande permet de compresser les données selon un facteur de deux à un. Si bien que, compte tenu des économies d'espace engendrées par SAM, la capacité de la bande est potentiellement supérieure de 400 % à celle du disque.

Par ailleurs, si l'on considère le coût d'achat initial, la bande présente un excellent rapport qualité-prix. Déployés dans un système bénéficiant d'une maintenance correcte, les supports bande durent trois fois plus longtemps que les cinq ans de cycle de vie moyen du lecteur disque. Et sur cette durée de vie accrue, le coût des opérations à effectuer sur les données — copie, déplacement, réplication et migration — se révèle moins important dans la mesure où ces activités interviennent moins fréquemment qu'avec le disque.

IC : Quels sont les problèmes de sécurité associés au stockage à long terme ?

CW : Une archive doit absolument être sécurisée — faute de quoi elle ne vaudrait pas les ressources investies. D'où la nécessité d'une fonctionnalité de chiffrement intégrée assurant la sécurité de l'archivage et du stockage. Pour justifier pleinement cet investissement, nombre de solutions d'archivage de Sun sont entièrement protégées par le chiffrement AES-256 — l'algorithme cryptographique leader approuvé par la NSA (National Security Agency). C'est notamment le cas de lecteurs de bande tels que le Sun T10000, ou le 9840D récemment annoncé par Sun, ainsi que les bibliothèques de bandes Sun SL8500 et 3000. Avec de telles solutions, une personne mal intentionnée s'emparant d'une bande d'archive aura très peu de chances d'accéder à l'information qu'elle contient. Il s'agira en ce cas d'une simple perte de bande, et non d'un vol de données.

Sun prévoit d'introduire le chiffrement du système de fichiers sur l'ensemble de son offre stockage au cours des quelques années à venir, ainsi que dans le système de fichiers Sun ZFS d'ici la fin de l'année. Il deviendra alors possible de chiffrer sélectivement les données stockées sur tous types de supports de stockage — disque optique, holographique ou traditionnel. Pour les possesseurs d'archives de données, ce chiffrement sélectif offrira l'assurance que, même s'il parvient à traverser le pare-feu, un intrus ne sera pas en mesure de lire des données.

IC : Quelles perspectives d'avenir dans le domaine de l'archivage de données ?

CW : efficace — ce qui suppose de disposer de l'expertise nécessaire pour identifier le support le plus approprié pour un stockage à long terme. L'offre de Sun couvre aujourd'hui la totalité du spectre des systèmes de stockage — depuis les systèmes disque ou bande les plus performants jusqu'aux accès aux données sur bande les plus rapides du marché. À ma connaissance, aucune autre organisation ne peut en dire autant, et je ne doute pas que ces qualités rendront de grands services à nos clients en cette époque où la frugalité est l'une des clés de l'efficacité opérationnelle.

À propos de Chris Wood
Leighton C. "Chris" Wood Junior est directeur et CTO de l'entité Data Management Storage Practice de Sun. Il a la responsabilité d'identifier et de fournir les meilleures solutions technologiques aux problèmes de gestion de données les plus complexes. Avant de rejoindre ses fonctions actuelles en 2007, Chris Woods occupait le poste de directeur technico-commercial et marketing au sein de l'organisation Global Network Storage Sales de Sun, où il supervisait les activités de support technique, de formation et de développement de produits associées aux solutions de stockage réseau.