Andrew B. Nobel

La variation génétique dans une population est généralement étudiée par l’analyse des polymorphismes mononucléotidiques (SNP), qui sont des variantes génétiques se produisant sur des sites spécifiques du génome. L’analyse des loci de traits quantitatifs d’expression (eQTL) cherche à identifier les variantes génétiques qui affectent l’expression d’un ou plusieurs gènes : une paire gène-SNP pour laquelle l’expression du gène est associée à la configuration allélique du SNP est appelée eQTL. L’identification des eQTL s’est avérée être un outil puissant dans l’étude et la compréhension des maladies dans les populations humaines et autres.

En utilisant des tableaux modernes de génotype et d’expression, une analyse eQTL typique peut impliquer des millions de SNP et des dizaines de milliers de gènes, ce qui rend le calcul et les tests multiples des défis clés. Même les analyses eQTL locales (cis) qui limitent l’attention aux gènes et SNP proches peuvent impliquer des dizaines de millions de paires gène-SNP. Nos premiers travaux sur l’analyse eQTL portaient sur le calcul rapide des statistiques d’association dans les populations homozygotes et sur les tests ultérieurs. Nous étudions actuellement l’utilisation de méthodes de test itératives pour améliorer la puissance des analyses eQTL complètes (trans). En complément des tests eQTL, nous avons récemment développé un modèle log-linéaire simple pour évaluer la taille de l’effet d’un eQTL, un problème important qui n’a pas reçu beaucoup d’attention systématique dans la littérature.

À ce jour, la plupart des études eQTL ont considéré les effets de la variation génétique sur l’expression dans un seul tissu (généralement le sang). Une prochaine étape importante est l’analyse simultanée des eQTL dans plusieurs tissus. L’analyse multi-tissus a le potentiel d’améliorer les résultats des études eQTL sur un seul tissu en empruntant la force entre les tissus, et d’aborder des questions biologiques fondamentales sur la nature et la source des différences entre les tissus. Une caractéristique importante des études sur les tissus multiples est qu’un SNP peut être associé à l’expression d’un gène dans certains tissus, mais pas dans d’autres. En collaboration avec le NIH Genotype-Tissue Expression (GTEx) Consortium, nous avons développé une procédure empirique Bayes, appelée MT-eQTL, pour l’analyse eQTL multi-tissus. Cette procédure, qui permet de tester des schémas complexes d’association entre plusieurs tissus, est l’une des deux méthodes utilisées pour tester les eQTL dans le récent article de Science du Consortium. La procédure MT-eQTL est limitée à neuf ou dix tissus, mais nous travaillons actuellement sur des extensions qui permettront d’atteindre jusqu’à vingt ou trente tissus.

Leave a Reply