Sun et Solaris explorent les particules avec le CC-IN2P3

Sun et Solaris explorent les particules avec le CC-IN2P3

Le CC-IN2P3 est aujourd’hui l’un des grands centres de calcul mondiaux pour la physique des hautes énergies. Ce centre permet aux chercheurs impliqués dans les grandes expériences de physique d’avoir accès à distance à une très grande puissance informatique. Depuis plus de vingt ans, le CC-IN2P3 a joué un rôle majeur dans le traitement des données des plus importantes expériences scientifiques de la discipline.

Défis client

  • Les données générées par le LHC et leur exploitation représentent un véritable défi informatique par le débit et le volume des informations à traiter.

Solution

Sun a prôné l’utilisation de machines combinées (1 serveur embarquant l’espace de stockage) – Sun Fire X4500 dits « Thumpers » qui était avantageuse du point de vue de l’encombrement, de la consommation électrique, de la volumétrie par serveurs et des tarifs.

Résultats commerciaux

  • Le Centre de Calcul de l’IN2P3 a acquis 46 machines Sun Fire X4500 d’une capacité totale de 400 To pour assurer les traitements informatiques liés aux expériences LHC.
  • « sur un plan économique, le coût d’acquisition de cette nouvelle capacité de stockage a finalement été inférieure à nos prévisions »
  • « en termes d’exploitation : nous avons adopté un schéma de mutualisation des ressources pour éviter de sous-utiliser notre capacité et la technologie de Sun se prête parfaitement à ce type d’architecture. »
  • « avantages liés à une faible consommation électrique et un encombrement minimal »

Produits et services

  • Solaris 10
  • 46 Sun Fire X4500

Etude de cas

A la pointe du traitement haute performance pour la physique des hautes énergies
La physique des hautes énergies est une discipline qui génère de grandes quantités de données à analyser. Ces besoins particuliers ont très tôt nécessité la création en France d’un centre de calcul spécialisé dans la fourniture de ressources informatiques pour cette communauté de recherche, regroupée au sein de l’Institut national de physique nucléaire et de physique des particules (IN2P3). Le Centre de Calcul de l’IN2P3/CNRS, plus communément appelé CC-IN2P3, a été créé pour répondre à ces besoins.

Le CC-IN2P3 est aujourd’hui l’un des grands centres de calcul mondiaux pour la physique des hautes énergies. Grâce à son équipement composé de quelques milliers de processeurs, à son expertise dans le traitement de grandes quantités de données et les réseaux à très haut débit, le CC-IN2P3 permet aux chercheurs impliqués dans les grandes expériences de physique d’avoir accès à distance à une très grande puissance informatique. Depuis plus de vingt ans, le CC-IN2P3 a joué un rôle majeur dans le traitement des données des plus importantes expériences scientifiques de la discipline.

Un accélérateur de particules de nouvelle génération
Aujourd’hui, le CC-IN2P3 doit relever un nouveau défi : le LHC (Large Hadron Collider), le plus grand accélérateur de particules du monde sera mis en production en 2008. Avec 40 millions de collisions par seconde et 1010 collisions enregistrées par an, les données générées par le LHC et leur exploitation représentent un véritable défi informatique par le débit et le volume des informations à traiter.

Installé au CERN (Organisation européenne pour la recherche nucléaire), dans un tunnel circulaire de 27 kilomètres situé sous la frontière franco-suisse, le LHC est le plus grand accélérateur de particules du monde. Projet scientifique unique en son genre, le LHC combine à lui seul tous les superlatifs : c’est le plus grand, le plus complexe, le plus puissant accélérateur jamais construit. Il est aussi l’exemple d’une collaboration réussie entre des milliers de chercheurs et ingénieurs issus du monde entier. Plus précisément, le LHC est une machine qui accélère deux faisceaux de protons ou d'ions lourds et les fait rentrer en collision au centre de détecteurs géants. Répartis sur l'accélérateur, quatre détecteurs enregistrent le passage de centaines, voire de milliers de particules engendrées au croisement des faisceaux. Les signaux électroniques détectés permettent de caractériser les particules et ainsi de remonter aux processus physiques mis en jeu lors des collisions.

Une grille pour traiter des quantités de données... astronomiques
Actuellement, aucun centre de calcul n’est capable d’absorber seul toutes les données générées par le LHC. Les informaticiens ont donc imaginé un système capable de répondre aux besoins de cet accélérateur de nouvelle génération. C’est ainsi qu’est né le projet d’infrastructure de grille mondiale : le W-LCG (Worldwide LHC Computing Grid).

La grille de calcul LCG est un réseau de centres de calcul répartis dans le monde entier. Lorsqu’une demande est énoncée à un point d’entrée du système sur l’ordinateur de l’un des centres de calcul, la grille est capable d’identifier les endroits disponibles du réseau pour fournir des ressources (stockage sur disques, stockage permanent sur bandes magnétiques, capacité de calcul, logiciels adaptés...) et de les utiliser pour satisfaire la demande du chercheur.

Constituée d'une douzaine de centres de calcul lors de son lancement en septembre 2003, la grille de calcul du LHC est aujourd’hui un réseau de plus d’une centaine de sites situés sur 3 continents : Europe, Amérique, Asie. Ces centres fournissent dès à présent une puissance de calcul comparable à celle de plus de 20 000 ordinateurs personnels « combinés » entre eux et qui devrait atteindre celle de 70 000 processeurs quand le LHC sera en exploitation en 2008.

Le Centre de Calcul de l’IN2P3 est l’un des piliers de cette infrastructure puisqu’il fait partie des onze centres mondiaux de premier niveau de cette grille. Mais pour relever le défi que représente le LHC, le CC-IN2P3 est également amené à augmenter ses ressources. En 2006, le CC-IN2P3 a lancé un appel d’offres visant à la fourniture de 400 Téraoctets utiles de ressources de stockage.


« A l’issue de cette mise en concurrence, nous avons reçu quatre réponses que nous avons analysées en fonction de cinq critères : volumétrie par serveur, performances intrinsèques (débit), qualité (processeurs, carte mère...), redondance disque (RAID 5) et caractéristiques électriques, thermiques et mécaniques Compte tenu de l’augmentation de la charge de travail et des énormes besoins en capacité liés aux expériences du LHC, chaque critère revêt une importance capitale. Par exemple, nous avons dû tenir compte de l’encombrement de notre salle machines et du taux de dissipation thermique des serveurs, pour éviter de mettre à rude épreuve un système d’air conditionné déjà très sollicité. Parallèlement, nous souhaitions adopter une attitude écologiquement responsable et donc contrôler au mieux la consommation électrique. »
— Pierre Larrieu, responsable des achats et des marchés publics au CC-IN2P3

Des performances matérielles et logicielles supérieures
Les critères ont été pondérés et la note finale attribuée à chacune des réponses tenait également compte des tarifs et des garanties proposées. « Plusieurs alternatives ont été proposées. Sun par exemple, a prôné l’utilisation de machines combinées (1 serveur embarquant l’espace de stockage) – Sun Fire X4500 dits « Thumpers » – alors que d’autres proposaient de relier un serveur à des baies de disques. Du point de vue de l’encombrement, de la consommation électrique, de la volumétrie par servepoursuit M. Larrieu.

« D’autres arguments ont joué en faveur de Sun. D’une part ZFS, le gestionnaire de volumes de Solaris 10 apporte des progrès notables en matière de gestion des espaces et des disques, qui simplifient drastiquement le travail des administrateurs. Cette simplification répond à notre désir d’éviter toute couche logicielle intermédiaire superflue entre l'administrateur et la machine. Nous privilégions les lignes de commande plutôt que les interfaces, car elles nous permettent d’automatiser intégralement des procédures, ce qui nous apporte des garanties d'uniformité des installations. Gérer manuellement environ 1200 serveurs serait impossible, voire irresponsable » ajoute Xavier Canehan, administrateur système au CC- IN2P3. « D’autre part, ZFS utilise un mécanisme de détection et de correction d’erreur (« End to end data integrity ») particulièrement performant, assurant l’intégrité des données non seulement lors de lecture mais également d'écriture. »

Des tests ont été réalisés en conditions réelles, c'est-à-dire dans le cadre de l’exploitation de deux applications de stockage « dCache » et « Xrootd », ainsi que du système de stockage hiérarchique HPSS. « Nous utilisons ces applications, développées par d'autres centres de recherche en physique des hautes énergies, pour gérer les espaces de stockage et fournir l’accès aux données des expériences » explique Loïc Tortay, administrateur du stockage au CC-IN2P3. « Les tests génériques, couvrant à la fois les opérations de lecture et d’écriture, ont comparé les performances de Solaris avec celles de Linux, ce dernier étant désormais supporté par Sun. Les résultats obtenus nous ont poussés à choisir Solaris, tout en n'excluant pas l'utilisation de Linux. Les performances avec Solaris sont globalement supérieures, principalement grâce à ZFS. Il en va de même pour le support du matériel. Enfin, l’administration des machines est plus aisée et les services de support de Sun, désormais fournis par un technicien dédié, sont d’excellente qualité. »

Maîtrise des coûts, fiabilité, convivialité
Après environ une année d’utilisation, les bénéfices recensés par le Centre de Calcul de Lyon de l’IN2P3 sont multiples. « Au-delà des performances de ZFS dont nous avons déjà parlé, nous bénéficions aujourd’hui d’autres avantages qui se révèlent décisifs pour la compétitivité de nos activités. Par exemple, sur un plan économique, le coût d’acquisition de cette nouvelle capacité de stockage a finalement été inférieure à nos prévisions, ce qui est d’autant plus important que nous représentons un organisme émargeant sur des fonds publics » décrit Xavier Canehan. « L’aspect économique se prolonge également en termes d’exploitation : nous avons adopté un schéma de mutualisation des ressources pour éviter de sous-utiliser notre capacité et la technologie de Sun se prête parfaitement à ce type d’architecture. »

La fiabilité est évidemment un élément essentiel pour un centre de calcul hébergeant des projets de recherche internationaux aussi stratégiques. « Parallèlement aux avantages liés à une faible consommation électrique et un encombrement minimal (seulement 6 mètres linéaires en tout, contre au moins 9 m pour les autres réponses à notre appel d’offres), la fiabilité est une caractéristique essentielle de la technologie Sun » conclut Loïc Tortay. « En effet, depuis le début de notre exploitation le matériel s’est admirablement comporté et nous n’avons déploré aucune panne majeure. Nous avons choisi d’acquérir une machine supplémentaire (« Spare ») qui nous sert à changer les disques rapidement en cas de panne, sans nécessité de recourir à un contrat de maintenance haut de gamme et coûteux. »

Avec ce projet, le LHC va très probablement lever un coin du voile sur notre compréhension de l'origine de la masse, la nature de la matière noire, bien plus abondante que la matière ordinaire dans le cosmos, l'énergie noire qui domine l'évolution de l'univers et l'asymétrie matière-antimatière. Sun Microsystems est particulièrement fier de participer à ces travaux prestigieux.

Aide rapide
France: