Le projet HapMap est un projet international créé pour développer une carte des haplotypes du génome humain afin de cataloguer les régions de similitudes et de différences génétiques entre les individus et de mieux comprendre la relation entre le génome et la santé humaine. Il a débuté en octobre 2002 et a impliqué des partenaires de recherche au Royaume-Uni, au Nigeria, en Chine, au Japon, au Canada et aux États-Unis, et a atteint son objectif de compléter la carte trois ans plus tard.
Concept HapMap
HapMap est le catalogue des variations génétiques communes (également appelées polymorphismes) présentes dans l’espèce humaine. Son contenu décrit la nature de ces variations, leur emplacement dans le génome et leur répartition dans les différentes populations. Les variations les plus courantes sont les polymorphismes nucléotidiques simples ou SNP (Single Nucleotide Polymorphism), qui sont des variations d’un seul nucléotide dans la séquence. On estime qu’il y a environ 10 millions de SNP dans le génome humain. Leur importance repose sur le fait qu’ils peuvent être associés à d’autres SNP responsables de maladies ou associés à un risque accru de souffrir d’une anomalie de santé, de sorte qu’ils peuvent servir de marqueurs pour localiser les gènes responsables dans les séquences.
Le projet HapMap vise à étudier la grande majorité de ces SNP et leur organisation dans les chromosomes. Il est ainsi possible d’établir des haplotypes ou des régions chromosomiques de polymorphismes associés. En raison de leur proximité dans le génome, ils ont tendance à être hérités ensemble, car la probabilité que des événements de recombinaison se produisent entre eux est très faible. Par la suite, les SNP qui sont des marqueurs uniques pour ces haplotypes, appelés « SNP de marquage », peuvent être identifiés. Ces informations sont publiées dans HapMap.
Les phases du projet visent à identifier un certain nombre de SNP dans le génome et se terminent lorsque les données obtenues sont publiées. À ce jour, le projet comporte trois phases :
Cibles
Le projet lui-même n’utilise pas ces informations pour établir un lien entre les polymorphismes et les maladies, mais il permet à d’autres chercheurs d’étudier le sujet sur la base des informations qu’ils fournissent, dans ce que l’on appelle les études d’association. Grâce aux SNP marqueurs, les chercheurs peuvent, entre autres, localiser les gènes impliqués dans des pathologies cliniquement importantes. Cela permet de réduire le séquençage du génome du patient à un nombre limité de SNP marqueurs afin de déterminer la combinaison d’haplotypes que possède le patient par rapport à la maladie à étudier.
Les informations recueillies au cours du projet sont rendues publiques dans la base de données SNP du NCBI une fois qu’une phase est terminée. Le libre accès à ces informations les met à la disposition de toutes les institutions de recherche biomédicale dans le monde, afin de trouver de nouvelles méthodes de prévention, de diagnostic et de traitement des maladies. Les principaux objectifs sont de trouver :
Un autre avantage pour la santé humaine qui peut être tiré de HapMap est, par exemple, la personnalisation des traitements médicaux afin d’en améliorer l’efficacité et d’en réduire les effets indésirables.
Technologie
Différents centres de recherche ont utilisé différentes technologies de séquençage pour développer HapMap :
Toutes ces formes de génotypage sont spécifiquement orientées vers la détection des SNP et sont effectuées sous des contrôles de qualité stricts afin que l’information diffusée soit de bonne qualité.
Population analysée
De nombreux haplotypes sont communs à l’ensemble de la population mondiale, mais certains sont plus répandus dans certaines populations que dans d’autres. En outre, de nouveaux haplotypes peuvent être apparus plus récemment et être limités à un seul groupe de population. C’est pourquoi des populations d’origines différentes (africaine, asiatique et européenne) ont été utilisées comme point de départ. Les groupes qui ont participé à l’analyse des phases I et II sont les suivants :
Le nombre total de personnes analysées est de 269, dont le sang périphérique a été extrait. À partir de ces échantillons, des lignées cellulaires ont été établies en culture, dont l’ADN a été obtenu, sans qu’à aucun moment un échantillon ne puisse être associé à un individu spécifique.
Outre ces groupes, des études complémentaires ont été menées pour vérifier si les résultats sont similaires dans d’autres populations et s’ils sont représentatifs dans ce cas.
Pour compléter la phase III, d’autres groupes ont été inclus, tels que des Italiens et des résidents nord-américains d’origine chinoise ou sud-américaine, ce qui a permis d’atteindre un nombre de 1184 personnes d’origines beaucoup plus diverses que lors des phases précédentes.