Jean-Jacques Codani, {\sc Inria}-Rocquencourt

Cartographie physique globale du G\'enome humain : aspects th\'eoriques, algorithmiques et informatiques

Le s\'equen\c cage direct de grandes r\'egions d'ADN n'est pas \`a l'heure actuelle la mani\`ere la plus efficace de collecter ses informations structurales (co\^ut \'elev\'e, outils d'interpr\'etation peu performants, \ldots). Il est donc n\'ecessaire, pour cibler le s\'equen\c cage, de disposer d'une ``carte'' de plus faible r\'esolution~: la {\em carte physique}. Cette approche permet, en particulier, une acc\'el\'eration consid\'erable de la localisation et l'isolement des g\`enes impliqu\'es dans les maladies h\'er\'editaires. Il s'agit de construire un ordre d'intervalles (un intervalle \'etant un fragment d'ADN clon\'e), sachant que l'on ne dispose, pour chaque intervalle que d'informations parcellaires et entach\'ees d'erreur. Nous d\'eveloppons ici cette probl\'ematique, et d\'etaillons les aspects th\'eoriques, algorithmiques et informatiques (exploitation du parall\'elisme intrins\`eque) de l'approche utilis\'ee par G\'en\'ethon. A ce jour, 60\% du g\'enome est couvert par 1200 groupes de clones chevauchant (aussi appell\'ees {\em contigs}) totalisant 10000~clones. Nous \'evoquons enfin les probl\`emes qui subsistent, parmi lesquels l'ordonnancement des contigs, l'int\'egration d'informations tr\`es diff\'erentes et la mod\'elisation des caract\'eristiques exp\'erimentales.