Genotoul Bioinfo
Des ressources informatiques à l’échelle, des logiciels et banques de données régulièrement mis à jour, et des compétences en bioinformatique pour valoriser les données en sciences du vivant.

Genotoul Bioinfo
Des ressources informatiques à l’échelle, des logiciels et banques de données régulièrement mis à jour, et des compétences en bioinformatique pour valoriser les données en sciences du vivant.
Genotoul Bioinfo
Adossée au laboratoire INRAE Mathématique et informatique appliquées de Toulouse (MIAT) et composante du GIS Genotoul, la plateforme Genotoul Bioinfo développe depuis près de 15 ans une expertise dans le domaine de la bioinformatique pour la génomique, la métagénomique et l’analyse des ARNs non codants. Cette expertise lui a permis de mettre en place une infrastructure dédiée, ouverte et à l’échelle, qui accueille près de 1 000 utilisateurs, mais aussi de contribuer à de nombreuses études portant sur une large diversité d’organismes (bactéries, archées, plantes, animaux, hommes).
A l’appui de son expertise, la plateforme produit des outils originaux lui permettant d’offrir un accompagnement efficace dans les projets scientifiques. Ses perspectives s’inscrivent dans une évolution des compétences en regard des applications innovantes générées par les capacités des nouvelles technologies de séquençage et des besoins autour de la donnée (infrastructure adaptée, intégration de données, plan de gestion des données…).
Expertises et services
- Hébergement de comptes utilisateurs : cluster de calcul, 500 Go sauvegardé, 1 To d’espace de travail et support aux utilisateurs,
- Hébergement de machines virtuelles,
- Accès aux plus de 200 banques de données du domaine,
- Accès aux plus de 600 logiciels du domaine,
- Traitement de données en collaboration : assemblage et annotation de (méta)génomes, analyse des données issues du séquençage à haut débit (méthylation, expression des ARNs, analyse de variants SNP et structuraux…),
- Développement de logiciels.
Moyens et équipements
Cluster de calcul (3000 cœurs) et stockage (2 PB) :
- 68 nœuds Dell PowerEdge C6220 (processeur Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50 GHz, 20 cœurs par nœud (40 threads avec hyperthreading), 256 GB de RAM par nœud),
- 48 noeuds Bullx R424-E4 (processeur Intel(R) Xeon(R) CPU E5-2683 v4 @ 2.10 GHz, 32 cœurs par nœud (64 threads avec hyperthreading), 256 GB de RAM par nœud),
- Nœud de visualisation Bullx R421-E4 (processeur Intel(R) Xeon(R) CPU E5-2683 v4 @ 2.10 GHz, 32 cœurs (64 threads avec hyperthreading), 128 GB de RAM, carte graphique Nvidia K40),
- Nœud SMP Bullx S6131 (processeur Intel(R) Xeon(R) CPU E7-8890 v4 @ 2.20 GHz, 48 cœurs (96 threads avec hyperthreading), 1536 GB de RAM et espace « scratch », Baie NetApp E2712 avec une capacité utile de stockage de 21.8 TiB),
- Nœud SMP SGI-UV2000 (processeur Intel(R) Xeon(R) CPU E5-4650 v2 @ 2.40 GH, 120 cœurs (240 threads avec hyperthreading), 3 TB de RAM et espace « scratch » avec une capacité utile de stockage de 22 TiB),
- Espace disque temporaire HPC (GPFS (IBM) : 860 TB, 4 serveurs IO, 7 modules de stockage (SSD, SAS et SATA), bande passante 20 GB/s, 20 K entrées/sorties par seconde),
- Espace disque temporaire HPC (Spectrum Scale (IBM) : 1 PiB, 3 serveurs IO, 4 modules de stockage (SSD, NL-SAS), bande passante 40 GB/s, 500 K entrées/sorties par seconde).
Espaces de stockage « projets » (2 PB) :
- 3 baies de type NAS EMC-Isilon (gamme capacitive) pour un total de 1.6 PB incluant la réplication,
- 2 baies de type NAS Dell-Compellent (FluidFS) pour un total de 500 TB incluant la réplication,
Autres serveurs (connexion, administration, virtualisation...) :
- 2 serveurs de connexion cluster SGE (32 cœurs et 128 GB de RAM chacun),
- 2 serveurs de connexion cluster SLURM (64 cœurs et 128 GB de RAM chacun),
- Serveur d'administration du cluster SGE (4 cœurs, 16 GB de RAM),
- Serveur d'administration du cluster SLURM (40 cœurs, 128 GB de RAM),
- Serveur de monitoring (24 cœurs, 32 GB de RAM),
- Serveur d'export NFS de l'espace disque de calcul (16 cœurs, 96 GB de RAM),
- 3 serveurs de virtualisation VMware (64 cœurs et 784 GB de RAM chacun),
- Baie de disques pour l'hébergement des machines virtuelles (40 TB),
- Serveur de cloud expérimental (40 cœurs, 128 GB de RAM).








Comment soumettre un projet ?
Pour accéder aux ressources de Genotoul Bioinfo, il est nécessaire de créer un compte utilisateur sur le site de la plateforme. Plusieurs formulaires sont à votre disposition pour déposer une demande en ligne : installation d’un logiciel ou d’une banque, accès à une ressource exceptionnelle (plus d’espace de stockage, accès aux machines à grande capacité de mémoire…) et accompagnement sur un projet scientifique en collaboration.
Exemple d'utilisation
Annotation des régions intergéniques conservées chez les microsporidies
L’équipe d’Eric Peyretaillade à l’Université Clermont Auvergne a contacté la plateforme dans le cadre de l’annotation d’un génome de microsporidie, avec une demande ciblée sur l’annotation des régions intergéniques conservées au sein de trois espèces. Ce travail a mis en évidence dans ces organismes minimaux une quinzaine d’ARNs non codants (snoRNAs, snRNAs…) dont le snRNA U1, essentiel à la machinerie d’épissage et jusque-là jamais détecté par une approche de bioinformatique. Il a également montré, dans les régions 5’UTR de ces ARNnc, la présence systématique de motifs caractéristiques de la machinerie (polymérase) liée à la transcription chez ces organismes.
Pour en savoir plus : Belkorchia A. et al. (2017). Comparative genomics of microsporidian genomes reveals a minimal non-coding RNA set and new insights for transcription in minimal eukaryotic genomes. DNA Research, 24(3):251-260.
Contact
Genotoul Bioinfo
24 chemin de Borde Rouge
CS 52627, Auzeville
31326 Castanet-Tolosan
Région : Occitanie+33 (0)5 61 28 52 82
anim.bioinfo-occitanie-toulouse@inrae.fr
Site de la plateforme
THÉMATIQUES : Bioinformatique
TUTELLES : INRAE
INFRASTRUCTURES NATIONALES : IFB, France Génomique
LABELLISATION IBiSA : 2009
RESPONSABLES SCIENTIFIQUES :
Christine Gaspin
RESPONSABLES TECHNIQUES :
Christophe Klopp
RESPONSABLES QUALITÉ :
Annick Moisan
MOTS CLÉS : Bioinformatique, Génomique, Métagénomique, Traitement de données, Assemblage, Annotation de génomes, RNA-Seq, sRNA-Seq, MET-Seq, Analyse de variants, Intégration de données, ARN non codant, ARNnc, Développement logiciel, Chaînes de traitement, Galaxy
Fiche mise à jour en 2022