Analyse de la structure génétique basée sur la variation rare

Lieux du stage

Le travail se fera majoritairement à l’institut du thorax à Nantes en collaboration avec plusieurs laboratoires de génétique et inclut une période de formation d’au moins un mois à Grenoble. Cette formation principalement en statistique est essentielle pour le bon déroulement du stage.

Durée - Période

5 à 6 mois (à positionner sur la période Mars-Septembre 2019)

Responsables

  • Isabel Alves, l'institut du thorax, Nantes
  • Michael Blum, TIMC-IMAG, Grenoble

Profil recherché

Cette proposition de stage s’adresse à un.e étudiant.e de niveau Master 2 compétent en statistique et en programmation, motivé par le développement de méthodes pour étudier l’histoire évolutive des populations.
L'étudiant.e travaillera sur le développement d’une nouvelle méthode pour analyser la distribution des allèles rares entre individus et identifier des groupes d’individus qui partagent un excès d’allèles rares.

Sujet détaillé

Les avancées récentes des technologies de séquençage permettent désormais de séquencer à bas coûts une quantité importante d’individus. Cette quantité d’information apporte de nouveaux défis dans le domaine de la génétique des populations. Un des défis concerne le développement de méthodes statistiques capable d’utiliser au maximum l'information contenue dans la variation génétique rare. Les allèles rares sont souvent plus récents et par conséquent ils sont géographiquement plus structurés et plus informatifs sur l'histoire récente des populations.
Dans ce cadre l’objectif du stage sera de développer une méthodologie pour détecter la structure des populations (figure 1) en utilisant la distribution des allèles rares partagés entre individus. Pour mesurer l’efficacité et la précision de la méthode nous utiliserons des données génétiques simulées.
Les méthodes de simulation existantes permettent de générer des génomes entiers pour un ensemble d’individus à partir de modèles démographiques. Dans ce cas les modèles considérés incluent un modèle d’une population structurée en clusters et d’une population où la structure s'établit à cause de la distance géographique.

fig1

Le second objectif de ce stage est d’utiliser la méthode développée sur les génomes entiers de ~850 individus d’origine française. Ces individus ont été recrutés sur un critère de stabilité géographique de leur famille (lieux de naissance des 4 grands-parents à moins de 15 km).

Les activités du stagiaire peuvent être résumées ainsi :

  • Revue bibliographique des différentes méthodologies existantes pour l’identification de la stratification génétique des populations.
  • Développement en R ou Python d’une nouvelle méthode d’identification des groupes d’individus qui partagent un excès d’allèles rares.
  • Utilisation d’un pipeline (déjà développé dans notre laboratoire) de simulation de données de séquences en fonction d’un scénario démographique pour tester la nouvelle méthodologie.
  • Évaluation de la nouvelle méthode sur des données réelles, c’est-à-dire des génomes entiers de ~850 individus français.
Ce stage est proposé dans le cadre du projet FROGH financé par l'Agence Nationale pour la Recherche

Références bibliographiques

  • FROGH: http://www.agence-nationale-recherche.fr/Project-ANR-16-CE12-0033
  • VaCaRME (Vaincre les Maladies Cardiovasculaires, Respiratoires et Métaboliques) www.vacarme-project.org
  • Karakachoff M, et al. Fine-scale human genetic structure in Western France. European Journal of Human Genetics (2014)
  • Schraiber JG and Akey JM 2015 Methods and models for unravelling human evolutionary history. Nature Reviews Genetics volume 16 , pages 727–740
  • O’Connor TD et al. Rare Variation Facilitates Inferences of Fine-Scale Population Structure in Humans Molecular Biology and Evolution 32(3): 653–660

Contacts

Merci d'adresser votre CV et lettre de motivation à :
  • isabel.alves@univ-nantes.fr
  • michael.blum@univ-grenoble-alpes.fr

Référence de l'offre

ALVES_VARIATION