Mutualisation des compétences et des équipements français
pour l’analyse génomique et la bio-informatique

Accueil > Les plateformes de France Génomique > CEA / Institut de Génomique (Genoscope & CNG), laboratoires d’informatique et de bioinformatique

CEA / Institut de Génomique (Genoscope & CNG), laboratoires d’informatique et de bioinformatique

Les laboratoires d’informatique et de bio-informatique de l’Institut de Génomique interviennent tout au long des processus de génération des données et de leurs traitements primaires et secondaires. Il s’agit de délivrer des ensembles de données élaborés spécifiquement en fonction des applications, afin de les rendre utilisable pour apporter des réponses aux questions des biologistes :

- infrastructure système, calcul, stockage et réseau,
- gestion de production (développement et exploitation de LIMS),
- automatisation des processus de production de données et du contrôle qualité,
- assemblage de grands génomes et de metagénomes eucaryotes,
- annotation et analyse comparative de génomes eucaryotes,
- détection et annotation de variants.

Equipements :
L’architecture informatique est centrée sur les données. La capacité de stockage, basée sur des serveurs de fichiers attachés au réseau, est de l’ordre de 2 Po. Les moyens de calculs en connexion directe avec ces serveurs de données sont majoritairement des serveurs x86_64 (environ 1.500 cœurs, typiquement 8 Go/cœur). Quelques machines « grande mémoire » (2-3 To) sont utilisées pour des applications spécifiques comme l’assemblage de metagénomes eucaryotes.
La définition du cycle de vie des données permet de mettre en œuvre des dispositifs différenciés de sauvegarde et d’archivage.

Principales réalisations :
Aujourd’hui, l’infrastructure informatique et les équipes de l’institut sont en mesure de traiter le volume de données généré par 17 séquenceurs de type Hiseq2000. Les données brutes et les résultats des analyses sont disponibles sur des sites Web à accès restreint, en téléchargement ou pour des interactions homme-machine au travers de « genome browser ».
- Assemblage et/ou annotation de grands génomes : bananier (530 Mbases), cacaoyer (430 Mbases), chromosome 3B du blé (1 Gbases), truite ( 2,5 Gbases), café ( 710 Mbases)…
- Recherche et validation de variants associés aux grandes pathologies humaines : cancers, Alzheimer, maladies métaboliques, maladies rares…
- les traitements de plusieurs projets France-Genomique sont pris en charge sur l’e-infrastructure localisée au TGCC, au travers de processus d’échange de données, de portage de code, et d’orchestration.

Labels/ Démarche qualité
 :
Les fonctions support informatique et achats informatique sont certifiés dans le cadre de la certification ISO 9001v2008 du Laboratoire d’Analyses Bioinformatiques pour la Génomique et le Métabolisme.

En savoir plus : http://www.genoscope.cns.fr / http://www.cng.fr

Responsables de la plateforme :
Claude Scarpelli, Jean-Marc Aury, Patrick Wincker

CEA / IBFJ / Genoscope & CNRGH
2, rue Gaston Crémieux 91057 EVRY Cedex - FRANCE
Laboratoires d’Informatique Scientifique,
Laboratoires de Statistiques et d’Informatique,
Laboratoire d’Analyse Bio-informatique des Séquences

Contact : bioinfo-fg@genoscope.cns.fr


Toutes les versions de cet article : [English] [français]