Du calcul intensif pour détecter des virus émergents

Les virologues de l’Institut Pasteur de la Guyane en partenariat avec BioGeco, le Centre National de Calcul IDRIS et l’équipe IIS de la DSI de l’Institut Pasteur à Paris développent un projet appelé « Ecoviromics ». Ce projet vise à caractériser la diversité virale ou « virome » de plusieurs hôtes de la faune guyanaise qui servent de réservoirs potentiels de zoonoses (maladies transmises de l’animal à l’homme), en fonction des conditions environnementales. Au cours de ce projet, différents viromes seront analysés en fonction de leur hôte, des conditions environnementales dans lesquels ils sont retrouvés et des types de prélèvements (organes cibles, sang, salive….). Pour obtenir ces viromes, des dizaines de millions de séquences d’ADN ont été produites, et seront analysées afin de savoir quels virus sont présents dans un prélèvement.

Pour identifier ces séquences ADN, des outils de bioinformatique sont nécessaires. L’un d’entre eux, « le BLAST », permet de comparer ces millions de séquences à l’ensemble des bases de données publiques disponibles. Cependant, il nécessite des grandes capacités de calcul. Le projet Ecoviromics met en œuvre une version parallélisée du BLAST (possibilité d’utiliser en parallèle des milliers de machines de calcul pour effectuer un BLAST sur des millions de séquences). Ce projet démarre par une phase de calcul « haute performance », que nous avons développée lors d'un accès préparatoire au Centre National de Calcul IDRIS. Le temps de calcul de cette phase d'alignement des séquences avec une ou plusieurs bases de référence était jusqu'à maintenant un frein au développement de ces études. Ecoviromics permettra d’identifier de nouveaux virus potentiellement pathogènes. L'analyse des patrons de diversité virale au sein des hôtes, selon l'espèce et les environnements, permettra de développer des travaux d'écologie virale - au même titre que s'est développée l'écologie microbienne - sur une base moléculaire.