Loading...
 
[Show/Hide Left Column]

Sujets Help

View Item

Domain Interaction
Domain - extra Bioinformatics
Year 2010
Starting Septembre
Status Open
Subject Visualisation interactive pour l'assemblage et la fouille de données visuelle en génomique bactérienne
Thesis advisor FEKETE Jean-Daniel
Co-advisors Stéphane Descorps-Declère (Institut Pasteur)
Laboratory INRIA-Saclay AVIZ
Collaborations
Abstract Depuis le début des années 2000, la vitesse de séquençage de génomes a augmenté d’un facteur 15,000!. Cependant, les méthodes de reconstruction et d’annotation de ces génomes n’ont pas suivies.
L'objectif de cette thèse sera donc de fournir des outils visuels permettant l'assemblage interactif de génomes complets à partir de prétraitements et l'étude de la variabilité génomique, en particulier appliquée à des populations bactériennes.

Context La découverte, en 1977, par Frederick Sanger du principe de séquençage de l'ADN à donnée naissance à une discipline scientifique majeur: la génomique. Dès lors, celle-ci c'est intéressée à étudier la biologie des organismes par l'étude de leurs génomes. La technologie permettant d'accéder à la séquence des macromolécules d'ADN a très peu évoluée pendant 20 ans. Il a fallut attendre les années 2000 et des avancées déterminantes en matière de biochimie et de nanotechnologie pour permettre la mise au point d'une nouvelle génération de séquenceurs offrant la possibilité de paralléliser un très grand nombre de réactions sur un support moléculaire.
Les effets conjugués de l'accroissement de la capacité de séquençage, des temps de production réduit, et du cout moindre ont favorisé le développement de programmes de séquençage portant sur des populations d'individus permettent d'étudier la diversité génétique existant entre et au sein d'espèces.
Objectives Parmi l'ensemble des problèmes nouveaux nécessitant le développement de nouvelles approches analytiques, il nous est apparu important de traiter deux problèmes qui nous semble fondamentaux : l'assemblage et détection de variabilités dans des populations d'individus. S'agissant d'assemblage ou des détections de variabilités, de nombreuses analyses peuvent être accomplies à l'aide d'outils automatiques mais certaines étapes nécessitent l'expertise et le jugement humain. Pour ces étapes clés, la visualisation augmente la capacité de l'utilisateur à conduire des analyses complexes.
L'objectif de cette thèse est de fournir des outils visuels permettant l'assemblage interactif de génomes complets et l'étude de la variabilité génomique, en particulier appliquée à des populations bactériennes.
Work program Dans un premier temps, la thèse focalisera son attention sur l'assemblage de génomes complets. L'assemblage consiste à ordonner et fusionner un ensemble de fragments génomiques extrait de façon aléatoire (les reads) en une liste de séquences plus grandes continues et contiguës si possible (les contigs).
Nous nous proposons de développer une représentation visuelle innovante permettant à un utilisateur de manipuler de très gros graphes de ces contigs indirectement et de façon interactive.
L'idée est de permettre de valider certains problèmes visibles à partir du graphe à l'aide d'outils interactifs d'aide à la décision.
Dans un second temps, la thèse portera ses efforts sur la conception d'un système de visualisation capable de travailler sur des listes de génomes constituant des populations afin de comparer des génomes entre eux.
Extra information La thèse se déroulera à l'INRIA Saclay et à l'Institut Pasteur.
Prerequisite Le candidat devra être familier avec les concepts biologiques sous-jacents et, autant que possible, avoir déjà réalisé des interfaces et idéalement des visualisations interactives.
Details
Expected funding Institutional funding
Status of funding Expected
Candidates
user
Created Saturday 17 of April, 2010 00:34:28 CEST
LastModif Saturday 17 of April, 2010 00:42:46 CEST


Ecole Doctorale Informatique Paris-Sud


Directrice
Nicole Bidoit
Assistante
Stéphanie Druetta
Conseiller aux thèses
Dominique Gouyou-Beauchamps

ED 427 - Université Paris-Sud
UFR Sciences Orsay
Bat 650 - aile nord - 417
Tel : 01 69 15 63 19
Fax : 01 69 15 63 87
courriel: ed-info at lri.fr