banner
Lar / blog / Genomas antigos do Himalaia iluminam a história genética dos tibetanos e seus tibetanos
blog

Genomas antigos do Himalaia iluminam a história genética dos tibetanos e seus tibetanos

Jun 08, 2023Jun 08, 2023

Nature Communications volume 13, Número do artigo: 1203 (2022) Citar este artigo

17k acessos

6 Citações

46 Altmétrica

Detalhes das métricas

Os tibetanos atuais adaptaram-se genética e culturalmente ao ambiente de alta altitude do planalto tibetano, mas questões fundamentais sobre suas origens permanecem sem resposta. Pesquisas arqueológicas e genéticas recentes sugerem a presença de uma população primitiva no Planalto nos últimos 40 mil anos, seguida pela chegada de grupos subsequentes nos últimos 10 mil anos. Aqui, obtemos novos dados do genoma de 33 indivíduos antigos de locais de alta altitude na margem sul do planalto tibetano no Nepal, que mostramos serem os mais próximos dos tibetanos atuais. Eles derivam a maior parte de sua ascendência de grupos relacionados a populações neolíticas tardias na borda nordeste do planalto tibetano, mas também abrigam um componente genético menor de uma ascendência eurasiana distinta e profunda do Paleolítico. Em contraste com seus vizinhos tibetanos, os atuais falantes não tibetanos de tibeto-birmanês que vivem em altitudes médias ao longo das margens sul e leste do Planalto formam uma linhagem genética que reflete uma história genética distinta. Finalmente, uma comparação entre montanheses antigos e atuais confirma a seleção positiva contínua de alelos adaptativos de alta altitude.

O planalto tibetano é caracterizado por condições hipobáricas, terreno acidentado, temperaturas frias e uma produtividade biológica relativamente baixa. Apesar dessas restrições, os tibetanos étnicos se adaptaram com sucesso a esse ambiente e viveram no planalto por milênios1. Compreender suas adaptações genéticas e culturais a este desafiador ambiente hipóxico é de grande interesse arqueológico, antropológico, genético e fisiológico2. Para fazê-lo completamente, é necessário responder a muitas questões fundamentais sobre as origens das populações tibetanas atuais, incluindo as populações de origem e os movimentos iniciais dos povos no planalto, o momento do estabelecimento das populações permanentes do planalto e o estabelecimento dos pools genéticos ancestrais. aos tibetanos atuais.

Embora os dados arqueológicos relativos aos primeiros movimentos populacionais no planalto sejam escassos, o local da Caverna Baishiya Karst (3280 msnm, metros acima do nível do mar) no extremo nordeste do planalto tibetano sugere a presença de povos relacionados a Denisovan entre 160 e 60 mil anos atrás (kya)3,4,5. As datas no local Nywa Devu (4600 msnm) no planalto central sugerem uma presença humana moderna entre 30 e 40 kya6. Se algum desses locais reflete um assentamento permanente de humanos no Planalto é desconhecido. Meyer et al.7 propõem uma ocupação inicial permanente do planalto central em Chusang (4270 msnm) por caçadores-coletores entre 7,4 e 12,7 kya. Em contraste, Chen et al.8 e outros argumentaram que uma população permanente no planalto central não era possível até o advento da agricultura baseada na cevada por volta de 3,6 kya. O último modelo geralmente presume que a agricultura foi introduzida no Planalto por migrantes de locais de altitude mais baixa (<2500 msnm) ao longo das margens nordeste do Planalto; acredita-se que esses migrantes tenham contribuído substancialmente para o pool genético dos tibetanos atuais9.

No entanto, evidências de origens múltiplas e mais complexas dos tibetanos atuais também são apoiadas por dados genéticos. Marcadores uniparentais densamente amostrados podem ser atribuídos em sua maior parte a linhagens presentes no norte da Ásia Oriental desde o início do Holoceno, mas haplogrupos mais antigos, como o mitocondrial M16 e o ​​cromossomo Y D-M174, originários de uma profunda linhagem eurasiana, também estão presentes exclusivamente entre os atuais -dia tibetanos10,11,12. A ideia de uma antiga contribuição paleolítica para o pool genético tibetano também foi proposta com base em dados completos da sequência do genoma. Um estudo comparando os genomas tibetanos atuais com os dos antigos siberianos e hominídeos arcaicos inferiu uma contribuição de uma mistura de ancestrais antigos – arcaicos e não arcaicos – entre os hipotéticos povos primitivos do Planalto13. Esta proposta é consistente com a descoberta de um haplótipo no locus EPAS1 (Endothelial PAS Domain Protein 1) que introgrediu de uma população semelhante a Denisovan para o pool genético tibetano atual, conferindo uma vantagem seletiva em ambientes de alta altitude14,15,16 ,17.

+4.4 SEM, standard error measure). The same pattern is also observed for present-day Nepalese Sherpa/Tibetans (>+2.7 SEM), while lowland East Asian populations are symmetrically related to Chokhopani and Lubrak (Supplementary Data 7). Using qpWave, we formally compared the two topologies ((Lubrak, aMMD), Chokhopani) and ((Chokopani, aMMD), Lubrak). We show that Suila, Rhirhi, Mebrak, and Samdzong are cladal to Lubrak (i.e., the former topology holds) within the limits of our resolution (p > 0.192), and Kyang only slightly differentiates from Lubrak (p = 0.027; Supplementary Table 1). In contrast, modeling the aMMD groups as a sister group of Chokhopani uniformly failed and thus the latter of the two topologies can be rejected (p < 1.38 × 10−4). A combination of Lubrak with a minor contribution from a South Asian group (e.g., Pulliyar) adequately fits all four groups, with an estimated South Asian ancestry contribution of only 1.9–5.1% (p > 0.179; Supplementary Table 2). For Chokhopani, neither Lubrak + South Asian nor Lubrak + Naxi/Yi/Naga fits (p < 3.67 × 10−4); however, Suila + Naxi/Yi/Naga fits with a substantial lowlander contribution (31–40%; Supplementary Table 3). We also detect a significant signal of admixture in Chokhopani using DATES, which infers an admixture time in Chokhopani of 46 ± 11 generations before the time of Chokhopani, placing it at ca. 1500-2800 BCE (for mean ± 2 SEM; Supplementary Fig. 6). This implies gene flow must have occurred between Chokhopani and the ancestors of these low/middle altitude populations prior to 800 BCE, and plausibly before 1500 BCE./p>0.1%) on screening for further analysis. Of these, 25 samples (21 individuals) were selected for a custom in-solution capture using oligonucleotide probes matching 50 K manually selected target sites with functional significance (‘50K’, see assay design description below). To ensure sufficient genome-wide coverage of ancestry informative markers for ancestry analysis across the entire sample set, we performed an in-solution capture for ~1.2 million informative nuclear SNPs (‘1240K’)22,60 on all 47 well-preserved samples. However, to improve the library complexity of the 43 samples initially processed at OU, we first generated new double-stranded, double-indexed libraries for these samples at the MPI-SHH using the method described for the Lubrak samples. We applied the 1240K capture to all 47 samples, and sequenced them on an Illumina HiSeq 4000 using 1 × 75 chemistry and Illumina NextSeq 500 using 2 × 75 bp chemistry until we achieved sufficient coverage on the captured SNPs or depleted library complexity (Supplementary Data 1). After removing three samples that failed our quality control criteria (C2 for low coverage, M3490 and U2 for 4% and 9% mitochondrial contamination, respectively), 44/47 samples (33 individuals) were included in our analysis. Finally, 15 samples (13 individuals) were selected for whole genome deep sequencing (WGS). Seven of these samples were sequenced at Macrogen, Inc. using an Illumina HiSeq X10 with 2 × 75 bp chemistry, and 9 (including one sample overlapping with the U of Chicago samples) were sequenced at the MPI-SHH using an Illumina HiSeq4000 with 1 × 75 bp chemistry (Supplementary Data 1); WGS samples sequenced at the MPI-SHH were subjected to UDG-half treatment61. These data were then combined with 7 previously published deeply sequenced aMMD genomes (individuals C1, M63, M344, S10, S35, S40, and S41; excluding M240 for its outlier position in PCA) for subsequent analysis, resulting in a total of 20 individuals with whole genomes sequenced to a depth of 0.1-6.6x. In total, genome-wide (‘1240K’) ancestry data was generated for 33 individuals, functional SNP (‘50K’) data was generated for 21 individuals, and whole genome data was analyzed for a total of 20 individuals, resulting in 38 individuals in the final dataset (which includes individuals from this study and the previous study21)./p> 2, where the scores are calculated by 5 cM block jackknifing. We also prefer topologies with positive internal branch lengths. Note that the procedure above is greedy in that a different order from which these populations were added can lead to a different final topology. We repeated our graph searching procedure by replacing Tianyuan with two Hoabinhian hunter-gatherers in southeast Asia ("McColl_SEA_GR1"; La368 and Ma911; Supplementary Data 5). We then tried adding archaic hominin (Altai Neanderthal and Denisovan) or Ust-Ishim into our five-population skeleton. Lastly, we tried adding a group merged from 2 Eneolithic Botai, Tyumen_HG and Sosonivoy_HG, hoping this group could tease out whether the deep lineage shows more East or West Eurasian affinity./p>