Penser pétaflops : les supercalculateurs en Europe
Source : Tom's Guide | Mots-clés : petaflops, genome | Thèmes : Small Business
La semaine dernière, nous étions à la conférence « Penser pétaflops », organisée à l’Institut Pasteur. Cette conférence était destinée à montrer les investissements effectués en Europe dans le domaine des supercalculateurs et l’intérêt de ce type de machine.
L’intérêt des supercalculateurs
Il faut d’abord se rendre compte de ce qu’est un supercalculateur : une machine équipée de (parfois) plusieurs milliers de processeurs, destinée aux calculs intensifs. Les supercalculateurs utilisent parfois de simples processeurs x68 (comme les Xeon mais peuvent aussi utiliser des GPU ou des architectures totalement différentes (comme certains Cray). On peut considérer que la puissance disponible dans un supercalculateur de 2008 sera proposée dans un serveur (tout du moins un cluster de serveurs) dans 5 ans et que nos PC offriront la même puissance dans une dizaine d’années.
Que calcule-t-on ?
Un supercalculateur permet de par exemple prédire le temps : actuellement, on travaille sur des unités de base de l’ordre de 10 km et descendre à des unités de 2,5 km ou de 1 km de côtés devrait permettre de prédire le temps de façon bien plus précise. Le principal problème vient du temps de calcul : un supercalculateur classique en France prend plus de temps à calculer avec une précision élevée que le temps lui-même. Un autre exemple vient de la simulation de bactérie : sans un supercalculateur récent, il est impossible de simuler le fonctionnement d’une cellule. Pour un organisme vivant, on estime que les ordinateurs seront capables de simuler entièrement une bactérie comme Escherichia Coli d’ici 2050. En sachant que le génome d’un organisme simple comme Mycobacterium tuberculosis est stocké dans 4,4 Mo et qu’un humain nécessite 2,9 Go d’espace de stockage, on comprend que simuler entièrement un être humain n’est pas pour tout de suite.
En pratique, ce sont les programmes PRACE et GENCI (en France) qui vont permettre d’augmenter la puissance de calcul en Europe en organisant la gestion des machines et les choix technologiques, car le continent est nettement en retard sur les États-Unis.
-
Actualité précédente
Les SMS plus chers que des données... -
Actualité suivante
Emtec annonce son clone de l'Eee PC



Et où en sont exactement les USA dans ce domaine?
http://www.top500.org/stats/list/30/regions

http://www.top500.org/stats/list/30/osfam
Remarque sur la news : (tout du moins un cluster de serveurs)
Mais plutôt : (tout du moins un cluster de calculs)
Car un cluster, même seul est un serveur... le service clustering !
Mon athlon64 x2 3800+ calcule plus vite xD
Si nous étions en retard uniquement dans ce domaine nous n'aurions pas à nous plaindre!
alala vivement dans le futur (tout du moins niveau technologie..) nous arons un ex-supercalculateur dans une pitite puce, comme celà l'est actuellement pour d'autres ex-supercalc
J'y étais, c'était bien sympa comme colloque
Cependant il ne faut pas écarter l'utilisation des grilles de calcul, notamment EGEE qui sera utilisée par le projet LHC (qui va à ce que j'ai entendu dire générer jusqu'à 15 PetaOctets de données par an à analyser)
Le futur ce sera les processeurs quantiques
là on pourra réellement parler de super calculateurs
et ils sont déjà depuis longtemps en développements
de plus quelques essais on déjà était réalisé avec succé
on parlera alors de milliards de calculs par seconde
Il arrive aussi que le facteur limitant ne soit pas la ressource de calcul, mais la quantité de mémoire associée. D'où l'idée de plus en plus parler de parallélisme plutôt que de puissance brute
Il suffit de regarder les nouvelles infrastructures des super calculateurs qui vont être mis en place dans ces programmes PRACE pour voir que le parallélisme est une solution usitée pour répondre aux problème de temps de calcul et de mémoire allouée.
Ce qu'il m'a le plus étonné lors de ce colloque, c'est d'apprendre les différences semble t'il importantes entre 3 programmes parallèles écris en Fortran, C et C++. Apparemment C++ est à la ramasse tandis que Fortran est loin devant. Je n'imaginais pas une telle différence.
et les projet BOINC dans tous ça ???
http://fr.wikipedia.org/wiki/BOINC
BOINC n'est pas fait pour le même type d'utilisation. D'une part tu as beaucou pde latence entre le temps où tu soumets un calcul et celui où tu obtiens le résultat. Donc difficile d'utiliser BOINC pour des calcul trop énormes et itératifs. De plus, tu peux difficilement compter sur des bécanes de luxe (qui réservent pendant des heures 4 à 8 Go de RAM à ton calcul)
J'avais lu que le plus gros et puissant cluster de processeurs actuellement en fonctionnement, est celui de nos propres Playstation 3 quand on les connecte au projet Folding@Home. Ce projet qui associe Sony à l'Université de Stanford permet de faire avancer la recherche sur les protéïnes. La puissance totale avait déjà dépassé le pétaflop fin 2007. Et comme il y a de plus en plus de PS3 qui rejoignent le projet, ce nombre ne fait qu'augmenter.
Ce projet de playstation 3 dépasse le pétaflop... en pointe. Maintenant, est ce que tous les utilisateurs de Play3 branche réguilèrement leur console. Je ne pense pas. En tout cas moi je préfère ne pas faire chauffer la mienne pour ça
...En tout cas moi je préfère ne pas faire chauffer la mienne pour ça
Ce débat a déjà eu lieu sur un autre topic. On n'allume pas sa PS3 uniquement pour se connecter au projet ! Ca tourne en tâche de fond pendant qu'on utilise la PS3 à autre chose, comme jouer, écouter un CD ou regarder un DVD.
Les ordinateurs quantiques ne serons pas les ordinateurs personnels de demain (à mon avis) puisque leur comportement et leur utilisation sera tout autre. Ce n'est pas pour rien qu'il n'existe pas tant que ça d'algo pour CPU quantiques. Les processeurs de demain serons les processeurs asynchrone parce que nos ordinateurs actuel passe leur temps à attendre, la durée d'un période d'un processeur est le temps que dure la plus longue opération (exemple : appel d'un fonction enregistrement de tout les registres, ... De 200 à 300 coups d'horloge selon les architectures) ou encore dans les Processeurs CISC (Intel PC), les opérations multimédias, 3D (les RISC (motorola MAC (avant puisque maintenant les MAX sont passés à des CPU Intel))). Donc 95% du temps un processeurs attend !!! Les ordinateurs asynchrone des qu'ils ont fini l'instruction en cour il passe à la suivant et là ça sera une vrai révolution !. Donc pour comparer 2 CPU asynchrone il faudra une nouvelle unité mêlant les données statistique comme l'écart type de la durée des instructions, avec la probabilité d'apparition de tel ou tel instruction, ...
C'est vrai que si on fait du parcours de graph la majorité du temps c'est la mémoire qui nous manque mais : Le parallélisme n'a rien avoir avec les capacités de stockages même en faisant du calcul parallèle on sépare un gros calcul en plein de petit calcul ce qui fait que ça va plus vite. Ou on fait du calcul parallèle (dans nos ordis) pour éviter que ça rame lors des tâches les plus lourdes. Typiquement dans un jeu une tâche pour l'interface graphique, une tâche pour l'AI, et la parti graphique est envoyé à la carte graphique qui est la plus forte en calcul parallèle.