anthropologie moléculaire

Discipline qui étudie la génétique des populations humaines, en se fondant sur les variants individuels au niveau de la molécule d'ADN.

GÉNÉTIQUE

Sont tout spécialement étudiés par cette discipline les problèmes de l'origine de notre propre espèce, Homo sapiens sapiens. Les données récentes relatives aux variants du chromosome Y, porteur des gènes de masculinité à transmission exclusivement paternelle, permettent maintenant de confirmer et de préciser les modalités de notre origine africaine « du côté d'Adam ».

La théorie moléculaire actuellement la plus acceptée est celle dite « de l'origine africaine » selon laquelle l'Homme moderne serait apparu initialement en Afrique (il y a de cela plus de 100 000 ans) ; à partir de cette contrée d'origine, il aurait ensuite colonisé tout l'Ancien Monde, en y remplaçant progressivement les autres formes d'Hommes archaïques qui s'y trouvaient. Cette théorie est fondée essentiellement sur les résultats obtenus concernant les variations de séquence de l'ADN mitochondrial, petite molécule circulaire contenue dans des organites cellulaires et à transmission maternelle, à partir de laquelle il est possible de remonter jusqu'à l'Ève de nos origines.

La théorie africaine de l'origine de l'Homme

C'est Allan Wilson, ancien professeur de biochimie à l'université de Berkeley (États-Unis) et aujourd'hui décédé, qui a émis dès sa publication initiale de 1987 la théorie africaine de l'origine de l'Homme contemporain fondée sur les polymorphismes de restriction de la molécule d'ADN mitochondrial.

Cette théorie est bien admise de nos jours par la quasi-totalité des chercheurs travaillant activement sur le sujet dans les laboratoires d'anthropologie moléculaire, mais lors de son émission elle se heurta à un certain nombre de critiques d'ordre expérimental et méthodologique, dont les principales sont les suivantes : l'effectif des individus dans les populations étudiées lors des expériences initiales était trop peu important ; les Africains les représentant ne provenaient pas de populations autochtones ; le branchement proposé initialement entre groupe africain et groupe non africain – distinction à la base même de la théorie – résultait en fait d'un biais dû au choix a priori par l'expérimentateur d'une modalité d'évolution particulière par rapport aux autres évolutions possibles ; et, enfin, l'ADN mitochondrial – qui ne concerne qu'une toute petite partie du génome – ne représentait qu'une modalité d'hérédité particulière propre à cet organite et, n'étant pas généralisable, les résultats qui découlent de son étude ne s'appliquent pas à l'ensemble de nos gènes. Dans leurs publications ultérieures, Wilson et ses collaborateurs sont revenus sur l'ensemble de ces critiques, en démontrant leur absence de fondement. Pour notre part, les travaux originaux que nous avions effectués à l'époque concernaient les variants d'un marqueur génétique hautement informatif particulier situé sur le chromosome Y. L'utilisation de ce marqueur chez un certain nombre de populations aborigènes a permis la construction d'un « réseau orienté » représentatif des combinaisons de variants à ce marqueur, démontrant effectivement la très grande ancienneté des Pygmées africains par rapport aux autres populations humaines.

L'Afrique représente un ensemble d'ethnies que le généticien peut étudier à l'occasion de prises de sang, et grâce à ce que l'on nomme des « marqueurs ». La nature des marqueurs génétiques a beaucoup évolué dans le passé : les premiers utilisés étaient les groupes sanguins, un petit nombre de caractères immunologiques de la membrane des globules rouges. Les variants de l'hémoglobine (molécule transporteuse de l'oxygène dans le sang) ont suivi, et ont été très étudiés en Afrique, à cause des pathologies (drépanocytose et thalassémies) qui leur sont associées. Puis, grâce à l'utilisation de la technique d'électrophorèse sur gel, ont pu être étudiés et utilisés de nombreux variants des protéines du sérum et des enzymes situés à l'intérieur des érythrocytes. Les marqueurs protéiques les plus performants ont cependant été ceux du système HLA (antigènes des globules blancs), et dont l'exploitation à des fins de comparaisons ethniques et d'étude des migrations de populations continue encore activement de nos jours.

Les marqueurs ADN uniparentaux

Depuis environ une quinzaine d'années une nouvelle génération de marqueurs très performants a vu le jour : les variants de la molécule d'ADN elle-même. La révélation des variants individuels (« polymorphismes ») de l'ADN nécessite la mise en œuvre d'une technique complexe, le Southern blot, procédé particulier de buvardage qui porte le nom de son découvreur. Les principales étapes nécessaires pour visualiser de tels polymorphismes sont les suivantes : extraction de l'ADN de longue taille à partir des lymphocytes sanguins, digestion de cet ADN par les enzymes de restriction (qui reconnaissent des sites spécifiques), séparation des fragments de restriction sur gel d'agarose, transfert de ces fragments sur membrane de nitrocellulose ou de nylon, et hybridation de ces membranes avec une sonde (fragment d'ADN cloné et marqué au phosphore radioactif). Les polymorphismes ainsi obtenus, et qui correspondent à des variants individuels au niveau des sites de restriction différentiels de la molécule d'ADN, sont finalement visualisables par autoradiographie sous la forme de bandes, migrant à des niveaux différents selon les échantillons sanguins étudiés.

Il existe deux grandes catégories de polymorphismes de l'ADN : les marqueurs nucléaires et les marqueurs uniparentaux. L'essentiel des polymorphismes connus (plusieurs milliers à ce jour) est révélé après hybridation avec des sondes complémentaires de séquences d'ADN situées dans le noyau des cellules. Les sondes utilisées (correspondant aux gènes albumine, aux différentes chaînes de l'hémoglobine, aux gènes HLA de classe II .), conjointement avec les panoplies disponibles d'enzymes de restriction, permettent à chaque système de mettre en évidence de multiples variants individuels, ou de combinaisons de variants (haplotypes). Tout comme pour les variants protéiques, mais avec une beaucoup plus vaste ampleur, ces polymorphismes et haplotypes sont de plus en plus utilisés comme marqueurs de variation individuelle dans les populations humaines et permettent, notamment, des comparaisons entre les populations aborigènes (de par leur ancienneté probable, elles devraient a priori permettre d'aboutir à des considérations d'importance sur les problèmes d'origine et d'évolution humaine). Les marqueurs nucléaires présentent les mêmes défauts de nature que les polymorphismes protéiques, étant soumis à chaque génération à l'alternance méiose-fécondation, ce qui a pour effet de perturber singulièrement la transmission verticale idéale des variations de séquence.

C'est la raison principale pour laquelle les polymorphismes de l'ADN à transmission uniparentale ont été recherchés. Une première catégorie de tels variants concerne les polymorphismes de restriction de la molécule d'ADN mitochondrial, propagés uniquement par la mère (à chaque génération le lot de molécules d'ADN mitochondrial est, pour l'essentiel, transmis par l'ovule). Nous avons nous-mêmes découvert et utilisé les polymorphismes principaux spécifiques du chromosome Y, qui eux sont à transmission exclusivement paternelle. De tels polymorphismes sont donc propagés verticalement (du grand-père au père, puis au fils et au petit-fils), inchangés (au taux de mutation près, événement fort rare) dans les généalogies. Leur étude permet donc une analyse fine des comparaisons entre populations.

Les polymorphismes remarquables du chromosome Y

La sonde qui nous a permis de découvrir les polymorphismes du chromosome Y se nomme p49 (le 49e plasmide étudié). Grâce à des expériences d'hybridation in situ nous avons pu démontrer que la séquence correspondante était localisée sur la partie proximale du bras long du chromosome Y, exactement dans la région dite Yq1, 12, c'est-à-dire dans une partie du chromosome Y qui n'échange pas de séquences avec le chromosome X lors de la méiose. Lorsque des ADN provenant d'individus de sexe masculin sont digérés par l'enzyme de restriction nommée Taq1, 18 bandes sont révélées sur les autoradiogrammes (numérotées de A à R), 2 d'entre elles seulement (K et L) correspondant à des séquences localisées sur d'autres chromosomes que le Y. Parmi les bandes correspondant aux séquences de l'Y, 5 d'entre elles (les bandes A, C, D, F et I) sont variables selon les individus (migrant à différents niveaux, ou pouvant être présentes ou absentes selon les individus).

Dans un premier temps, nous avons montré dans des généalogies la transmission de père en fils de ces différents variants ou de leurs combinaisons haplotypiques. Dans une population de référence de Paris, par exemple, la fréquence des différents haplotypes est très particulière, avec seulement 16 haplotypes présents, dont l'un (numéroté XV, et qui présente les combinaisons alléliques numérotées A3, C1, D2, F1, I1) rend compte à lui tout seul d'approximativement un quart de l'effectif des chromosomes étudiés. Par la suite, nous avons montré que les distributions des haplotypes Y observés étaient assez caractéristiques des différentes populations considérées (cela est surtout valable parmi les populations aborigènes) et témoignaient de leurs histoires évolutives respectives.

La question que nous nous sommes posée concernait celle de la filiation entre les différents haplotypes au cours de l'évolution humaine. Nous avons utilisé le principe de la parcimonie : la transition entre deux états se fait d'autant plus préférentiellement qu'elle est plus économe, c'est-à-dire que l'on peut passer d'un haplotype à un autre par un nombre minimal de mutations (il est possible par exemple de passer de l'haplotype numéroté XIV à l'haplotype XV par la seule transition des allèles D1 à D2). En appliquant ce principe de proche en proche à tous les haplotypes que nous connaissions alors, il a été possible d'ordonner sur un premier réseau (les haplotypes représentés à l'origine étant les plus anciens) l'ensemble des combinaisons alléliques observées. Par la suite il a été mis un peu d'ordre dans ce réseau en exploitant le fait que, d'une façon générale, les polymorphismes révélés par l'enzyme Taq1 comportent le doublet CG de bases de l'ADN (bases cytosine et guanine) connu pour changer rapidement au cours de l'évolution, et ce dans un sens unique particulier donné ; il en résulte de façon pratique qu'il doit nécessairement y avoir au cours de l'évolution une perte progressive des sites Taq1, d'où une augmentation de taille des allèles observées.

L'algorithme utilisé par le Pr Serge Hazout (de l'université de Paris-VII) pour ordonner les haplotypes a consisté à utiliser des hypothèses de départ de plus en plus simplifiées, pour rendre les modalités de filiation entre haplotypes les plus parcimonieuses possibles ; les résultats de son programme ont finalement rendu optimales pour l'origine de l'haplotype ancestral le plus probable les solutions qui indiquaient préférentiellement le XIII (A3, C0, D1, F1, I1). C'était là un résultat théorique intéressant, qui méritait d'être confronté avec les faits. Cet haplotype ancestral prédit est bien retrouvé en fait. Une première vérification concerne la recherche de l'haplotype Y correspondant chez les primates anthropoïdes, singes les plus proches de l'Homme (la séquence p49 est conservée chez ces primates). Or, pour le chimpanzé, l'haplotype prépondérant trouvé est très voisin du XIII.

Haplotypes de l'Y

Il était particulièrement intéressant d'étudier les répartitions haplotypiques chez les Pygmées d'Afrique, populations aborigènes connues de longue date par les anthropologues comme représentant le tout premier groupement humain habitant la forêt dense d'Afrique. L'étude des haplotypes p49 chez les Pygmées Akas d'Afrique centrale a montré : que l'haplotype XIII y est prépondérant (représentant environ 30 % de l'effectif) ; qu'ils présentent de plus (à titre d'haplotype rare) le XVIII, prédit de façon théorique être encore plus primitif que le XIII (le XVIII n'avait jusqu'ici pas encore été découvert dans les autres populations aborigènes) ; que leur répartition haplotypique montre une prédominance des haplotypes de bas grade dans l'évolution (outre le XVIII, le plus primitif qui soit, deux de niveau 1, une étape de mutation postulée – avec le XIII et le XVI –, et trois encore de niveau 2, – le XIV, le VIII et le XII) par rapport à celle des populations bantoues avoisinantes étudiées, caractérisées par la prédominance des haplotypes IV et V. Par la suite, nous avons retrouvé le même type de répartition haplotypique chez les Pygmées N'Buti (de l'Afrique de l'Est), quoique à un moindre degré, la distribution des Akas d'Afrique centrale étant plus proche de l'origine. De ces études on peut conclure que les Pygmées Akas sont vraisemblablement les peuples les plus anciens en Afrique, et même dans le monde. J'ai affirmé dans mes écrits que Adam devait ressembler à un chasseur-cueilleur Aka, et que le jardin d'Éden se situait en actuelle République centrafricaine, dans la région comprise entre le fleuve Oubangui, la Lobaye et la rivière Sanaga (où vivent les Pygmées Akas de nos jours).

La notion d'« Adam moléculaire » a fait son chemin, depuis nos travaux initiaux. Un article à grand retentissement vient d'être publié à ce sujet dans la presse spécialisée : le prix Nobel Walter Gilbert, de l'université de Harvard, et ses collaborateurs ont séquencé un ADN de 729 paires de bases provenant d'une région non codante d'un des gènes de détermination testiculaire situé sur le chromosome Y, et l'ont comparé chez 38 personnes de différentes origines géographiques ; comme aucune variation de séquence n'a pu être constatée parmi ces diverses personnes, alors que des différences notables dans la séquence homologue sont présentes chez les singes anthropoïdes, les auteurs en ont déduit une origine récente de notre espèce ; la datation proposée est parfaitement compatible avec les données de la théorie de l'origine africaine d'Allan Wilson.