La diversité génétique humaine et les facteurs socio-culturels
Professeur

(Université de Tokyo - Département des Sciences biologiques)

Dans les lignes qui suivent, j’analyserai plusieurs exemples qui montrent que la diversité génétique des humains (homo sapiens) a été affectée par des facteurs qui ne sont pas biologiques, mais sociaux et culturels. Ces facteurs-là, liés aux moyens de subsistance des lignées masculines et féminines, à la structure sociale, à la culture alimentaire, etc., ont une répercussion sur des événements démographiques. La génétique des populations interprète chaque « population » comme un pool génétique. L’évolution est la fluctuation de la fréquence des allèles (les différents types de gènes) dans le pool génétique, fluctuation provoquée par la sélection naturelle, les mutations, les migrations (les flux de gènes) et les dérives génétiques aléatoires1. Les mutations sont un processus biologique cellulaire. En revanche, les autres agents sont liés à l’histoire démographique de la population. C’est ce qui explique que les facteurs socio-culturels se reflètent dans la diversité génétique humaine, sachant qu’ils sont liés à la démographie des populations.

Dans quelle mesure la démographie est-elle liée à la diversité génétique ? La dérive génétique aléatoire est la fluctuation de la fréquence des allèles qui a lieu par hasard, alors que la sélection naturelle est la modification inévitable de la fréquence des allèles. L’effet des migrations sur la modification de la fréquence allélique représente le versant spatial de la dérive génétique aléatoire. La taille de la population efficace (Ne) est la taille de la population susceptible de se reproduire. Quand Ne est finie, le rôle de la dérive génétique aléatoire est plus important que celui de la sélection naturelle. Quand Ne est infinie, le rôle de la sélection naturelle dans les changements de fréquence des allèles est plus important, c’est-à-dire plus divers que dans le cas d’une Ne finie. Comme la Ne des êtres humains est relativement petite, les fréquences alléliques des sites polymorphes des génomes humains sont surtout sensibles à la dérive génétique aléatoire et aux migrations qui provoquent des mélanges entre les populations. Quand la sélection naturelle se produit peu, si un allèle a l’avantage de survivre, la région génomique comprenant cet allèle augmente dans une population. Si le phénomène est plus rapide que le brassage par recombinaison, la région génomique comprenant l’allèle avantageux devient homogène dans la population : c’est ce qu’on appelle un « balayage sélectif »2.

La diversité génétique est le produit de la dérive génétique aléatoire, de la sélection naturelle et du flux génétique. Il est donc absurde de penser que seuls les facteurs génétiques jouent un rôle dans tout ce qui constitue le déterminisme génétique.

Les données sur le génome humain ont augmenté de façon exponentielle au cours des dernières années. La généralisation des séquenceurs de nouvelle génération a permis d’avoir des kits de réactifs meilleur marché, et le séquençage du génome humain est devenu plus rapide. Le Projet Génome Humain a mis une quinzaine d’années pour aboutir, mais aujourd’hui, le séquençage du génome humain prend une semaine. C’est ainsi que la « génétique des populations » a donné naissance à la « génomique des populations ». En pratique, les tests génétiques commercialisés et facilement accessibles ont du succès parce qu’ils proposent des analyses génomiques pour un coût raisonnable. Personnellement j’ai peur que cette facilité d’accès ne donne lieu à un nouveau déterminisme génétique synonyme de discrimination et d’exclusion sociale. C’est un vrai danger. Par ailleurs je note que peu de gens savent que la diversité génétique est affectée par les facteurs socio-culturels tels que le mode de vie et le comportement alimentaire.

Je ne mentionnerai pas ici les études principalement fondées sur les données de l’ensemble du génome. Je mettrai en avant les études qui portent sur des loci haploïdes tels que l’ADN mitochondrial (ADNmt) et le chromosome Y, ou sur un seul locus (une région génomique particulière) de loci diploïdes (autosomiques), car le système de transmission de l’ADNmt et du chromosome Y est beaucoup plus simple que celui du génome autosomique. Les données que nous avons sur l’ADNmt et le chromosome Y sont intelligibles, ce que j’ai brièvement expliqué ci-dessus, si bien que les lecteurs n’auront aucun mal à comprendre les exemples qui montrent que la diversité génétique humaine est influencée par les facteurs socio-culturels. S’agissant de ces exemples, il existe de nombreux articles faisant état d’observations similaires. Pour des raisons de clarté, je ne ferai référence qu’aux articles les plus représentatifs, notamment ceux qui s’appuient sur nos propres études.

1. Diversité génétique intra-population et moyens de subsistance

La diversité génétique au sein d’une population est affectée par la démographie en fonction des moyens de subsistance des humains. La distribution des dispersions par paires (PMD) est représentée sur le graphique de la figure 1 par le nombre de différences de bases sur l’axe horizontal, et par le ratio d’individus présentant une différence deux par deux sur l’axe vertical. Dans l’analyse PMD d’un haploïde, si une population connaît une expansion démographique (une augmentation rapide de sa taille), il faut théoriquement s’attendre à ce que cette distribution suive une courbe en forme de cloche (distribution normale). En revanche, quand une population a une taille constante (sans expansion démographique antérieure), la forme n’est plus celle d’une cloche.

Distribution des dispersions par paires (PMD)

Figure 1 : Distribution des dispersions par paires (PMD).

L’axe horizontal représente le nombre de différences de bases ; l’axe vertical représente le ratio des personnes qui présentent une différence par paire.

À l’origine, la relation entre les moyens de subsistance et l’histoire démographique, établie à partir de données génétiques, a été analysée sur des populations africaines. Watson et al. (1996)3 ont examiné les PMD des séquences nucléotidiques de l’ADNmt, puis ils les ont comparées avec celles des chasseurs-cueilleurs et des producteurs de nourriture. Dans les groupes dont l’ethnographie atteste de traditions de chasse-cueillette, la distribution n’est pas en forme de cloche, ce qui sous-entend qu’ils n’ont pas connu de croissance démographique rapide. En revanche, dans les groupes producteurs de nourriture, la distribution est en forme de cloche, ce qui sous-entend des expansions démographiques antérieures. Les moyens de subsistance se reflètent donc dans la démographie et entraînent des différences de diversité génétique au sein des populations.

Pour autant, les schémas PMD ne sont pas toujours fixes, ni chez les chasseurs-cueilleurs ni chez les producteurs de nourriture. En partant des données d’ADNmt publiées dans une étude d’Oota et al. (2001)4, j’ai étudié les PMD de quatre populations pratiquant la culture sur brûlis dans la jungle vallonnée du Nord de la Thaïlande (Fig. 1). Les Akha avaient une distribution relative en forme de cloche, tandis que les Lahu noirs, les Karen rouges et les Karen blancs avaient des modèles de distribution en forme de cloche molle, ce qui sous-entend des tailles de population constantes. Si l’on s’en tient aux moyens de subsistance, les individus qui vivent de l’agriculture sur brûlis sont considérés comme des producteurs de nourriture. Or, les courbes démographiques des populations pratiquant l’agriculture itinérante sur brûlis étaient proches de celles des populations de chasseurs-cueilleurs. La définition typologique des moyens de subsistance ne suffit donc pas à estimer correctement l’histoire démographique.

2. Patrilocalité et matrilocalité dans les différents types de migration et diversité génétique

Les systèmes de reproduction et les régimes matrimoniaux jouent aussi sur la diversité génétique, surtout pour l’ADNmt et le chromosome Y, puisque l’un et l’autre révèlent les schémas de transmission des lignées maternelle et paternelle. Seielstad et al. (1998)5 sont les premiers à avoir analysé l’ADNmt et le chromosome Y de plusieurs populations en se penchant sur les liens entre la distance génétique (c’est-à-dire la diversité entre les populations) et la distance géographique en Europe (Fig. 2).

Corrélations entre les distances génétiques

Figure 2 : Corrélations entre les distances génétiques (valeurs Fst) fondées sur les données de l’ADNmt ou du chromosome Y et les distances géographiques (km) en Europe.

Les cercles représentent l’ADNmt ; les carrés représentent le chromosome Y.

Ils ont découvert des distances génétiques liées au chromosome Y plus importantes chez les populations éloignées les unes des autres que chez les populations voisines, mais les disparités sont beaucoup plus faibles pour la distance génétique liée à l’ADNmt. La moyenne des distances génétiques liées au chromosome Y est beaucoup plus élevée que celle de l’ADNmt. Il est donc probable que les hommes se sont moins déplacés que les femmes d’une population à une autre. Par conséquent, les fréquences des types de chromosomes Y des populations ont bougé suivant une dérive génétique aléatoire, alors que les fréquences des types d’ADNmt ont été homogénéisées par les migrations fréquentes entre les populations. D’où l’hypothèse proposée par Seielstad et al. : le régime patrimonial patrilocal se reflète dans la diversité entre ADNmt et chromosome Y en Europe.

Pour tester cette hypothèse, Oota et al. (2001) se sont intéressés aux groupes minoritaires du Nord de la Thaïlande, car ce sont des groupes classés à la fois suivant des modèles de résidence patrilocale et matrilocale dans une région relativement petite (Fig. 3a).

Carte du Nord de la Thaïlande et des groupes minoritaires

Figure 3a : Carte du Nord de la Thaïlande et des groupes minoritaires.

Ils se sont penchés sur trois groupes matrilocaux et trois groupes patrilocaux en analysant l’ADNmt et le chromosome Y. Les résultats sont apparus clairement. Quand ils analysaient la diversité génétique au sein d’une population, la diversité de l’ADNmt était plus élevée dans les groupes patrilocaux que dans les groupes matrilocaux, tandis que la diversité du chromosome Y était plus élevée dans les groupes matrilocaux que dans les groupes patrilocaux (Fig. 3b).

Diversité génétique intra-populations

Figure 3b : Diversité génétique intra-populations fondée sur les données d’ADNmt ou de chromosome Y dans les groupes matrilocaux et patrilocaux.

Diversité génétique entre les populations

Figure 3c : Diversité génétique entre les populations (distances génétiques) fondée sur les données d’ADNmt ou de chromosome Y dans les groupes matrilocaux et patrilocaux.

En examinant la diversité génétique entre les populations, la moyenne des distances génétiques par paires fondées sur les haplotypes du chromosome Y était plus élevée dans les groupes patrilocaux que dans les groupes matrilocaux, tandis que la moyenne des distances génétiques par paires fondées sur les séquences nucléotidiques de l’ADNmt était plus élevée dans les groupes matrilocaux que dans les groupes patrilocaux (Fig. 3c). En d’autres termes, les modèles de résidence matrilocale et patrilocale liés aux régimes matrimoniaux se reflétaient dans la diversité de l’ADNmt et du chromosome Y. Ces résultats allaient évidemment dans le sens de l’hypothèse de Seielstad et al. (1998).

Oota et al. (2002)6 ont analysé l’ADNmt et le chromosome Y de populations entières d’Asie de l’Est. Pour l’ADNmt, les distances génétiques par paires entre les populations étaient fortement liées aux distances géographiques entre les populations (Fig. 4).

Corrélations entre les distances génétiques et les distances géographiques

Figure 4 : Corrélations entre les distances génétiques (valeurs Fst) fondées sur les données de l’ADNmt ou du chromosome Y et les distances géographiques (km) en Asie de l’Est.

Les cercles représentent l’ADNmt ; les carrés, le chromosome Y.

En revanche, pour le chromosome Y, ces distances étaient sans lien avec les distances géographiques entre les populations (Fig. 4). Ce schéma était apparemment différent du schéma européen. Cependant, la distance génétique moyenne par paire fondée sur le chromosome Y était environ 2 fois plus élevée que la distance fondée sur l’ADNmt, ce qui permet de penser que le schéma de l’Asie de l’Est était essentiellement le même qu’en Europe. Ce hiatus expliquerait les résultats sous-entendant des sociétés au caractère patriarcal plus marqué dans les populations d’Asie de l’Est que dans les populations européennes. On parle de « migration/brassage biaisé selon le sexe » pour qualifier ce phénomène qui va sans doute avec un système patriarcal.

3. Le débat sur le chromosome Y de Gengis Khan

Une étude réalisée au même moment a révélé une interprétation différente des caractéristiques du chromosome Y en Asie de l’Est : les distances génétiques plus élevées entre populations et l’absence de corrélation entre distances génétiques et distances géographiques sont dues à la polygamie, qui va avec des sociétés aux caractère patriarcal beaucoup plus marqué. Zerjal et al. (2003) ont analysé le chromosome Y de nombreuses populations de l’Est du continent eurasiatique et ont découvert qu’un haplotype spécifique, situé au cœur d’une structure en étoile, avait des fréquences élevées en Asie de l’Est et en Asie centrale. Cette structure étoilée, située dans le réseau phylogénétique, a théoriquement le même sens que la forme de cloche dans un PMD : elle correspond à une expansion démographique. Celle-ci se serait produite il y a entre 1 000 à 2 000 ans, ce qui correspond à la fondation de l’empire mongol7. En outre, cet haplotype Y a été découvert dans la zone qui était occupée par l’empire mongol. Zerjal et al. l’ont interprété en expliquant qu’une lignée masculine avait réussi à s’étendre sur une immense aire géographique, sous-entendant que cette lignée serait apparentée à la famille de Genghis Khan. Les schémas identifiés dans le chromosome Y étaient comparables au balayage sélectif que l’on observe dans les régions du génome où a eu lieu une sélection naturelle positive. En revanche ils n’avaient aucune preuve d’avantage biologique pour l’haplotype Y. Ils ne pouvaient que constater la reproduction réussie de la lignée Y qui indiquait un régime matrimonial particulier, sans doute la polygamie. Zerjal et al. (2003) qualifient ce phénomène de « sélection sociale » plutôt que de « sélection biologique ».

De leur côté, Ilumäe et al. (2016)8 ont examiné des séquences entières du chromosome Y dans des populations de l’Est du continent eurasien et ont daté l’expansion de l’haplotype Y qui, selon Zerjal et al. (2003), serait celui de Gengis Khan à plus de 5 000 ans, ce qui signifie qu’il n’y aurait pas de lien entre l’expansion démographique et l’empire mongol. Nous ne savons pas exactement pourquoi on observe des distances génétiques plus élevées dans le chromosome Y que dans l’ADNmt, ni pourquoi aucune corrélation n’apparaît entre les distances génétiques et les distances géographiques dans le chromosome Y en Asie de l’Est. Il n’en demeure pas moins que la différence constatée entre l’Europe et l’Asie de l’Est s’explique par les migrations de population et les événements démographiques liés à la transition des moyens de subsistance.

4. L’agro-pastoralisme et la taille efficace de la population

Récemment, plusieurs études d’ensembles de données importants ont révélé des schémas démographiques sexués fondés sur des diversités d’ADNmt et de chromosome Y dans différentes populations du monde. Karmin et al. (2015)9 ont identifié des séquences entières de chromosome Y de plusieurs populations et les ont comparées à des séquences d’ADNmt. Ils ont découvert qu’un goulot d’étranglement, c’est-à-dire une réduction de Ne s’était produit relativement récemment en Asie de l’Ouest et en Europe, après le goulot baptisé « Out of Africa ». D’après leurs estimations, la date de cette réduction correspondrait à la révolution néolithique, c’est-à-dire au passage d’une société de chasse et de cueillette à une société produisant son alimentation. La Ne de l’ADNmt a continué et continue encore à augmenter depuis 50 000 ans, tandis que la Ne du chromosome Y a cessé d’augmenter il y a 10 000 ans environ et a nettement diminué une fois il y entre 8 000 et à 5 000 ans.

Comme cette chute de Ne a eu lieu en Asie de l’Ouest avant d’avoir lieu en Europe, et qu’elle correspond à la période de la révolution néolithique respectivement en Asie de l’Ouest et en Europe, Karmin et al. (2015) pensent que les changements socio-culturels induits par les pratiques de l’agriculture et du pastoralisme (l’agropastoralisme) ont favorisé une disparité des chances de reproduction parmi les hommes. C’est peut-être parce que l’agro-pastoralisme a créé une différence entre riches et pauvres. Les hommes riches se sont reproduits plus facilement que les hommes pauvres, un avantage qui s’est reflété dans la taille efficace de la population de l’ensemble de la société. En revanche, aucune déviation n’a été mise en évidence dans les chances de reproduction des femmes, ni aucun changement dans la Ne de la société entière (Fig. 5).

Déviation des chances de reproductions

Figure 5 : Distribution des chances de reproductions chez les hommes, absente chez les femmes.

Le développement de l’agropastoralisme a sans doute été différent dans les parties occidentales et orientales du continent eurasien. Chaque région a sans doute également connu des processus différents. Certaines régions ont sûrement adopté l’agropastoralisme sans problèmes, alors que d’autres ne l’ont adopté que récemment. Ces variations ont donné lieu à des courbes migratoires et des événements démographiques disparates, lesquels ont influencé les caractéristiques de la structure génomique des populations individuelles.

5. Influence du pastoralisme et de l’agriculture sur l’évolution des gènes

Le développement de l’agropastoralisme se reflète également sur l’évolution des régions génomiques (qui reflète aussi celle des gènes) liées aux différences phénotypiques entre les populations. Je citerai un exemple connu : la mutation de l’enzyme lactase qui annule l’intolérance au lactose. Les bébés grandissent avec le lait de leur mère qui contient du lactose. Ils ont une enzyme qui digère et transforme le lactose en glucose et en galactose. La lactase est surtout sécrétée dans l’intestin grêle des bébés pendant la période de lactation et s’arrête au sevrage. C’est ce qui explique que certains adultes sont intolérants au lactose : ils ne le digèrent pas. Une étude récente portant sur l’ensemble du génome montre qu’il existe des mutants pour lesquels la sécrétion de la lactase ne s’arrête pas avec le sevrage10. Il s’agit d’une mutation qui se produit dans la région du promoteur de LCT, le gène de la lactase, et qui empêche l’arrêt de la sécrétion de la lactase. La mutation manifeste des signes de balayage sélectif (sélection positive) dans la région chromosomique. La fréquence de la mutation est importante dans certaines populations européennes et africaines qui pratiquent l’élevage laitier. Aujourd’hui, ce phénomène est considéré comme un exemple de l’influence de la culture alimentaire (en l’occurrence, des cultures dans lesquelles les populations boivent du lait d’animaux domestiques) sur l’évolution du génome humain.

Autre exemple, les mutations des gènes liées à la digestion de l’alcool. Quand on boit de l’alcool, l’éthanol est d’abord transformé en acétaldéhyde, puis l’acétaldéhyde est transformé en acide acétique dans le foie. L’enzyme de la première étape est l’alcool déshydrogénase (ADH) ; celle de la deuxième étape est l’aldéhyde déshydrogénase (ALDH). Le génome humain comprend 7 gènes ADH et 16 gènes ALDH. Quand une personne boit de l’alcool, ce sont avant tout trois gènes ADH et le gène ALDH2 qui s’expriment dans le foie. L’un des gènes ADH (ADH1B) présente un polymorphisme génétique : le polymorphisme nucléotidique simple (SNP) transforme l’arginine (Arg) en histidine (His) à la 48è position d’acide aminé, le premier ayant une activité faible, le second, une activité élevée11. Le gène ALDH2 présente également un polymorphisme génétique : le SNP transforme l’acide glutamique (Glu) en lysine (Lys) à la 504e position d’acide aminé, le premier ayant une activité enzymatique, l’autre une déficience de cette activité. Les gens qui ont un déficit en ALDH2 présentent des caractéristiques phénotypiques – bouffées de chaleur, maux de tête et nausées – si elles boivent trop d’alcool. Quand une personne possède un allèle de haute activité (His) dans l’ADH1B, l’éthanol est rapidement métabolisé en acétaldéhyde par oxydation. Si quelqu’un a en plus l’allèle déficient (Lys) dans l’ALDH2, l’acétaldéhyde n’est pas oxydé en acide acétique et il s’accumule.

L’acétaldéhyde est toxique pour l’homme. Or on remarque une fréquence élevée d’un allèle de haute activité de l’ADH1B en Asie de l’Ouest et de l’Est12, mais jusqu’ici, l’allèle déficient de l’ALDH2 n’a été repéré qu’en Asie de l’Est13. Oota et al. (2004) ont identifié des signaux impliquant une sélection positive sur l’allèle déficient de l’ALDH214, et Han et al. (2007) ont de solides preuves d’un balayage sélectif sur l’ensemble de gènes ADH15.

Les résultats des études de génétique des populations fondées sur les ensembles de gènes ADH et de gène ADLH2 laissent penser que la faible tolérance à l’alcool est un avantage dans la sélection naturelle. Cet atout inattendu pourrait s’expliquer par l’effet toxique de l’acétaldéhyde. Une concentration élevée d’acétaldéhyde dans le sang est toxique, non seulement pour les personnes, mais pour les agents pathogènes, en particulier les parasites du sang. Or la consommation d’alcool pourrait avoir un lien avec la prévention des maladies infectieuses et contribuer à la pression sélective concernant les gènes impliqués dans le système métabolique de l’alcool chez les êtres humains. Mais pourquoi est-ce que cela n’aurait fonctionné que dans les populations d’Asie de l’Est ? La raison exacte nous est encore inconnue. Nous avons un indice : la région qui présente des fréquences alléliques élevées pour l’allèle hautement actif de l’ADH1B et l’allèle déficient de l’ALDH2 correspond à la zone originale de la culture du riz en Asie de l’Est, où de nombreux cas infectieux de parasites sanguins, de paludisme, d’amibiase et autres ont été signalés. Les rizières de grande échelle se transforment suivant les changements de la nature, ce qui crée sans doute un environnement hospitalier pour ces agents pathogènes. C’est pourquoi les transformations de l’environnement laissent des traces dans le génome humain. Mais la culture fait aussi partie de notre environnement et les variations culturelles laissent également une empreinte dans le génome humain.

6. Les modifications spatiales et temporelles de la structure génétique des populations

Les moyens de subsistance influent sur la démographie, laquelle laisse des traces dans le génome humain. Il est possible de repérer ces modulations démographiques en examinant les données génomiques des populations aujourd’hui. Cela dit, les analyses d’ADN ancien sont plus révélatrices des modifications de la structure génétique des populations liés à la démographie et aux événements migratoires.

Les Jomon et les Yayoi sont des cultures préhistoriques de l’archipel japonais qui correspondent plus ou moins à des sociétés de chasseurs-cueilleurs (pour les premières) et d’agriculteurs (pour les secondes). Les études anthropologiques expliquent que les Jomon étaient des chasseurs-cueilleurs indigènes depuis environ 16 000 ans, tandis que les Yayoi étaient des agriculteurs qui ont migré de la partie orientale du continent eurasien16. Comme la datation du riz carbonisé sur les terres cuites de l’île de Kyushu a été estimée à 3 000 ans, on pense que la période Yayoi a commencé il y a environ 3 000 ans, et que la destination de ces migrants apportant avec eux la technique de la culture du riz était le Nord de l’île de Kyushu17.

Oota et al. (1995)18 ont examiné l’ADNmt de restes humains excavés d’un site archéologique situé au nord de Kyushu. Deux styles d’inhumation coexistaient sur ce site depuis la période Yayoi. Le premier était le « dokobo », une pratique typique de la période Jomon qui consiste à enterrer les restes humains directement dans la terre. Le second était le kamekan, un terme qui désigne une jarre-cercueil en terre cuite très largement utilisée à l’époque Yayoi. Les analyses d’ADN ancien ont montré que l’ADNmt des individus enterrés dans ces kamekan avait une plus faible diversité de séquences nucléotidiques que les individus inhumés suivant la tradition dokobo et occupait un type de séquence majeur (Fig. 6).

Réseau phylogénétique

Figure 6 : Réseau phylogénétique fondé sur les séquences nucléotidiques de l’ADNmt issues de 26 restes de squelettes humains retrouvés sur un tumulus de coquilles du site appelé Takuta-Nishibun, dans la partie nord de Kyushu, au Japon.

Les cercles représentent les séquences-types de l’ADNmt. Les chiffres indiqués sur les branches sont les positions des nucléotides de la région de la boucle D de l’ADNmt où les positions des nucléotides ont changé. La taille des cercles est proportionnelle au nombre d’individus qui ont ce type de séquence. Les numéros d’identification comprenant la lettre K représentent les individus excavés de kamekan ; ceux qui ont la lettre D représentent

les individus excavés de dokobo.

De leur côté, les preuves archéologiques de ce site sous-entendent des disparités temporelles importantes entre les deux traditions : les dokobo sont plus anciens que les kamekan. Oota et al. (1995) en ont conclu que si la diversité de l’ADNmt varie suivant les deux types de sépulture, ce serait à cause du remplacement de la population qui a eu lieu sur ce site. Il est probable que les individus enterrés façon dokobo étaient des autochtones de la lignée Jomon, et que les individus enterrés façon kamekan étaient des migrants de la partie orientale du continent eurasien qui avaient peut-être des liens consanguins du côté maternel.

Wang et al. (2000) ont examiné l’ADNmt de restes humains de deux périodes (vieilles de 2 500 et de 2 000 ans) excavés d’un site archéologique situé à Linzi, en Chine, et comparé l’ADNmt de personnes vivant aujourd’hui dans la zone de leurs fouilles19. L’ADN ancien était endommagé et fragmenté ; la longueur de la séquence d’ADNmt qui pouvait être examinée était courte ; seuls cinq types de séquence ont été repérés. Cependant, la fréquence des séquences d’ADNmt variait beaucoup suivant les deux périodes. La structure génétique d’une population aujourd’hui n’est pas la même que celle de son équivalent antérieur, y compris dans une même zone géographique, parce que les dérives génétiques et les migrations modifient rapidement les modèles de fréquence des séquences-types.

Plus récemment, un séquençage de génome a été effectué à partir de nombreux échantillons anciens, révélant effectivement des remplacements de population. McColl et al. (2018) ont examiné d’anciens génomes nucléaires d’Asiatiques du Sud-Est et de Japonais Jomon d’Ikawazu et revu l’histoire du peuplement de l’Asie du Sud-Est20. Lors de la période prénéolithique, les chasseurs-cueilleurs hòabìnhiens occupaient l’Asie du Sud-Est jusqu’à ce que l’agriculture se développe et s’étende. Selon l’hypothèse dite « à un niveau », les chasseurs-cueilleurs hòabìnhiens se sont convertis à l’agriculture et sont devenus des agriculteurs sans bénéficier de flux génétique externe important. Dans l’hypothèse « à deux niveaux », des agriculteurs ont migré du Nord et remplacé les chasseurs-cueilleurs hòabìnhiens il y a 4 000 ans environ. Les analyses de génomes anciens ont montré que les spécimens vieux de 8 000 à 4 000 ans (le plus ancien appartenait à la culture Hòabìnhian) étaient étroitement liés aux chasseurs-cueilleurs actuels d’Asie du Sud-Est, tandis que les spécimens vieux de 4 000 à 500 ans étaient très différents des chasseurs-cueilleurs prénéolithiques/actuels et proches des Asiatiques de l’Est actuels (Austro-asiatiques, Tai-Kadai, Austronésiens, Chinois du Sud, etc.). Cela voudrait dire que les chasseurs-cueilleurs prénéolithiques ont été remplacés par des agriculteurs néolithiques.

En même temps, les analyses des génomes anciens ont révélé des traces d’un mélange entre chasseurs-cueilleurs prénéolithiques et agriculteurs néolithiques postérieurs à la divergence entre les chasseurs-cueilleurs prénéolithiques et les anciens Asiatiques de l’Est. Au Japon, les Jomon d’Ikawazu, vieux de 2 500 ans, avaient une affinité beaucoup plus marquée avec les chasseurs-cueilleurs hòabìnhiens qu’avec les Asiatiques de l’Est actuels. C’est ainsi que les données issues des génomes anciens confortent une hypothèse « multi-niveaux », bien plus compliquée que les hypothèses à « un niveau » ou « deux niveaux ».

7. Conclusions

J’ai proposé ici des cas liés, soit à des facteurs non biologiques, soit aux fréquences des gènes des êtres humains (fréquences alléliques). Le déterminisme génétique a tendance à être considéré comme un principe biologique mais c’est une erreur : les exemples que j’ai évoqués montrent que la diversité génétique humaine est très sensible aux facteurs non biologiques tels que les moyens de subsistance, les régimes matrimoniaux, la sélection sociale et la sélection naturelle. Certes, l’idée va à l’encontre de la doxa, mais les gens qui s’intéressent aux facteurs non biologiques ne devraient avoir aucun mal à le comprendre. Comme je l’ai dit plus haut, les généticiens des populations partent de l’idée qu’une « population » est un pool génétique. Or une « population » n’est pas a priori, mais a posteriori celle que les généticiens définissent comme telle, de sorte qu’une « population humaine » a toujours quelque chose de provisoire.

S’il existait une « race » qui serait une sous-espèce de l’homo sapiens, nous aurions une distance génétique substantielle entre des populations humaines. Or, nous n’en avons pas. La diversité intra-population d’une population donnée est toujours modulée par la dérive génétique aléatoire, la sélection naturelle et les événements migratoires. Cette diversité, qui correspond à la distance génétique entre les populations, varie aussi au fil du temps. C’est ce qui explique que les généticiens des populations n’ont plus recours au terme « race » et qu’aucune « race » n’est une sous-espèce de l’homme.

J’insisterai pour dire que les chercheurs doivent prendre conscience du « mode de pensée » de la génétique des populations si nous voulons comprendre les données du génome humain. De ce point de vue-là, la plupart des « découvertes » que les gens font sur leur ascendance grâce aux tests génétiques directement accessibles au consommateur (tests dits DTC) sont trompeuses, car aucun de ces tests n’inclut le mode de pensée de la génétique des populations. Il existe des entreprises qui vendent des tests d’ADN fondées les haplogroupes d’ADNmt. Mais les haplogroupes d’ADNmt ne révèlent théoriquement qu’un ancêtre 1/2n sur n génération(s) antérieures. Un exemple : si vous voulez savoir qui étaient vos ancêtres il y a 3 000 ans, cet intervalle représente 100 générations, si l’on considère qu’une génération correspond à 30 ans. Vous avez donc théoriquement 2100 ancêtres. Les tests ADN exploitant l’ADNmt, eux, ne vous indique qu’un seul de vos 2100 ancêtres.

Les tests ADN fournissent des informations sur les populations qui possèdent un haplogroupe d’ADNmt à fréquence élevée, mais il s’agit de populations actuelles puisque les données de fréquence des haplogroupes d’ADNmt sont générées à partir de populations vivantes. Vous savez où vit la population actuelle, mais vous ne savez pas où elle vivait avant. Comme je l’ai écrit plus haut, l’histoire de l’humanité est ponctuée de nombreux événements migratoires. La seule chose que les données sur les haplogroupes d’ADNmt vous révéleront, c’est que vous avez un ancêtre commun avec cette population vivante qui remonte à telle ou telle date.

Le problème est le même pour les tests ADN qui exploitent les données du génome autosomique. Certains vous proposeront des pourcentages des « populations de vos ancêtres ». Mais ces pourcentages sont aussi issus de données génomiques de populations actuelles et peuvent être effectués en partant du principe qu’aucune population n’a migré. Un test ADN peut révéler que vous êtes à 50 % européen, à 30 % chinois et à 20 % indien. Mais il s’agit des « Européens », des « Chinois » et des « Indiens » d’aujourd’hui. Les composants génétiques de ces populations ont forcément été modifiés par la dérive génétique aléatoire, les événements migratoires et la sélection naturelle. Il est impossible de définir l’étalon de ce que sont les Européens, les Chinois et les Indiens. Les pourcentages indiqués par les tests ADN sont donc trompeurs, peu importe qu’ils soient fondés sur des masses de données issues de l’ADN autosomal.

Les populations révèlent évidemment des différences génétiques qui viennent de la dérive génétique aléatoire, des événements migratoires et de la sélection naturelle, mais, en soi, les différences génétiques entre les populations sont très faibles et fluctuantes. Chez les êtres humains, la différence moyenne entre les génomes est inférieure à 0,2 %. Il est donc important de bien comprendre la génétique des populations pour éviter les malentendus nés des quantités de données qui nous avons sur le génome des populations. Il est aussi impératif de le comprendre pour éviter la marée montante du racisme.

Déplier la liste des notes et références
Retour vers la note de texte 11509

1

D. L. Hartl, A Primer of Population Genetics, 3rd ed., Sunderland, Sinauer, 2000.

Retour vers la note de texte 11510

2

D. L. Hartl, A. G. Clark, Principles of Population Genetics,  4th ed., Sunderland, Sinauer, 2007.

Retour vers la note de texte 11511

3

E. Watson et al., « mtDNA sequence diversity in Africa », Am J Hum Genet., 59(2), 1996, p. 437-44.

Retour vers la note de texte 11512

4

H. Oota et al., « Human mtDNA and Y-chromosome variation is correlated with matrilocal versus patrilocal residence », Nat Genet., 29(1), 2001, p. 20-1.

Retour vers la note de texte 11513

5

M. T. Seielstad, E. Minch, L. L. Cavalli-Sforza, « Genetic evidence for a higher female migration rate in humans », Nat Genet., 20(3), 1998, p. 278-80.

Retour vers la note de texte 11514

6

H. Oota et al., « Extreme mtDNA homogeneity in continental Asian populations », Am J Phys Anthropol., 118(2), 2002, p. 146-53.

Retour vers la note de texte 11515

7

T. Zerjal et al., « The Genetic Legacy of the Mongols », Am J Hum Genet., 72(3), 2003, p. 717-21.

Retour vers la note de texte 11516

8

A. M. Ilumäe et al., « Human Y Chromosome Haplogroup N : A Non-trivial Time-Resolved Phylogeography that Cuts across Language Families », Am J Hum Genet., 99(1), 2016, p. 163-73.

Retour vers la note de texte 11517

9

M. Karmin et al., « A Recent bottleneck of Y chromosome diversity coincides with a global change in culture », Genome Res., 25(4), 2015, p. 459-66.

Retour vers la note de texte 11518

10

S. A. Tishkoff et al., « Convergent adaptation of human lactase persistence in Africa and Europe », Nat Genet., 39(1), 2007, p. 31-40.

Retour vers la note de texte 11519

11

M. V. Osier et al., « A global perspective on genetic variation at the ADH genes reveals unusual patterns of linkage disequilibrium and diversity », Ann Hum Genet., 71(1), 2002, p. 84-99.

Retour vers la note de texte 11520

12

H. Oota et al., « The evolution and population genetics of the ALDH2 locus: random genetic drift, selection, and low levels of recombination », Ann Hum Genet., 68(Pt 2), 2004, p. 93-109.

Retour vers la note de texte 11521

13

H. Li et al., « Ethnic related selection for an ADH Class I variant within East Asia », PLoS One, 3(4), 2008, e1881.

Retour vers la note de texte 11522

14

H. Li et al., « Refined geographic distribution of the oriental ALDH2*504Lys (nee 487Lys) variant », Ann Hum Genet., 73(Pt 3), 2009, p. 335-45.

Retour vers la note de texte 11523

15

Y. Han et al., « Evidence of positive selection on a class I ADH locus, Am J Hum Genet., 80(3), 2007, p. 441-56.

Retour vers la note de texte 11524

16

K. Imamura, Prehistoric Japan : new perspective on insular East Asia, London, UCL Press Ltd, 1996.

Retour vers la note de texte 11525

17

J. Habu, Ancient Jomon of Japan, Berkeley, Cambridge University Press, 1996.

Retour vers la note de texte 11526

18

H. Oota et al., « A genetic study of 2,000-year-old human remains from Japan using mitochondrial DNA sequences », Am J Phys Anthropol, 98(2), 1995, p. 133-45.

Retour vers la note de texte 11527

19

L. Wang et al., « Genetic structure of a 2,500-year-old human population in China and its spatiotemporal changes », Mol Biol Evol., 17(9), 2000, p. 1396-400.

Retour vers la note de texte 11528

20

H. McColl et al., « The prehistoric peopling of Southeast Asia », Science, 361(6397), 2000, p. 88-92.

Revenir à l'atelier