Loading...
 
[Show/Hide Left Column]

Tracker Item History Help

Close
warningNot logging
Tracker changes are not being logged: Go to Action log admin to enable

Version Date User Field ID Field Old New
3 13:03 181 Context Les machines massivement paralleles ont des architectures tres complexes, et sont formes par des milliers de processeurs multicoeurs et accelerateurs. La plupart des algorithmes actuels ne sont pas capables d'exploiter ecacement ces architectures. Des des majeures dans ce domaine sont le coût eleve des communications par rapport au coût des calculs et le taux de defaillances tres eleves de ces machines peta/exaflopiques. Avec des superordinateurs
composes de plus d'un million de coeurs, le temps entre deux pannes devient si important que les simulations numeriques peuvent ne pas pouvoir abooutir a la solution recherchee.
C'est dans ce contexte de recherche que les objectifs de cette these sont denis.
qui sera eectuee pendant cette these se concentre sur le probleme de tolerance aux fautes
dans le cadre des algorithmes en algebre lineaire qui minimisent les communications 3. Des
solutions a ce probleme peuvent ^etre fournis au niveau systeme
Les machines massivement paralleles ont des architectures tres complexes, et sont formes par des milliers de processeurs multicoeurs et accelerateurs. La plupart des algorithmes actuels ne sont pas capables d'exploiter efficacement ces architectures. Des defis majeurs dans ce domaine sont le coût élevé des communications par rapport au coût des calculs et le taux de defaillances tres élevés de ces machines peta/exaflopiques. Avec des superordinateurs
composes de plus d'un million de coeurs, le temps entre deux pannes devient si important que les simulations numeriques peuvent ne pas pouvoir abooutir a la solution recherchee.
C'est dans ce contexte de recherche que les objectifs de cette these sont definis.


3 13:03 183 Objectives La recherche qui sera eectuee pendant cette these se concentre sur le probleme de tolerance aux fautes dans le cadre des algorithmes en algebre lineaire qui minimisent les communications 3. Des solutions a ce probleme peuvent
etre fournis au niveau systeme en utilisant par exemple des points de sauvegarde et de reprise (checkpointing), cependant de telles solutions sont reconnues ne pas
etre scalables. Nous proposons de prendre en compte ce probleme egalement
au niveau des algorithmes numeriques, lorsqu'une solution adaptee peut être proposee danscertains cas.
Notre objectif est de comprendre, pour certaines methodes iteratives ainsi que des noyaux de calcul associes, quels algorithmes permettent de tolerer les defaillances sans augmenter par un facteur important les besoins en memoire ou en terme de calcul. Certaines de ces methodes utilisent deja des informations redondantes, et nous souhaitons utiliser ces informations pour tolérer des fautes.
La recherche qui sera effectuee pendant cette these se concentre sur le probleme de tolerance aux fautes dans le cadre des algorithmes en algebre lineaire qui minimisent les communications 3. Des solutions a ce probleme peuvent être fournis au niveau systeme en utilisant par exemple des points de sauvegarde et de reprise (checkpointing), cependant de telles solutions sont reconnues ne pas être scalables. Nous proposons de prendre en compte ce probleme egalement
au niveau des algorithmes numeriques, lorsqu'une solution adaptee peut être proposee danscertains cas.
Notre objectif est de comprendre, pour certaines methodes iteratives ainsi que des noyaux de calcul associes, quels algorithmes permettent de tolérer les défaillances sans augmenter par un facteur important les besoins en memoire ou en terme de calcul. Certaines de ces methodes utilisent deja des informations redondantes, et nous souhaitons utiliser ces informations pour tolérer des fautes.
2 13:03 188 Co-advisors Laura GRIGORI
Laura GRIGORI
Janna BURMAN
1 13:03 190 Year 2013 2014
1 13:03 192 Starting september 2013 september 2014

Ecole Doctorale Informatique Paris-Sud


Directrice
Nicole Bidoit
Assistante
Stéphanie Druetta
Conseiller aux thèses
Dominique Gouyou-Beauchamps

ED 427 - Université Paris-Sud
UFR Sciences Orsay
Bat 650 - aile nord - 417
Tel : 01 69 15 63 19
Fax : 01 69 15 63 87
courriel: ed-info at lri.fr