目前, WeGene 祖源成分分析共涉及42个族群,较好的覆盖了与东亚区域,以及世界范围内的其他热点区域。数据来源包括 the 1000 Genome project, the Human
Genome
Diversity Project, HapMap 等。具体的祖源成分族群,如下表所示:
样本取自中国河南,北纬32°,东经114°
样本取自中国福建,北纬25°,东经119°
蒙古语族群(蒙古族,达斡尔族,赫哲族,土族,锡伯族等)
样本取自中国内蒙古,北纬45°,东经111°
通古斯族群(鄂伦春族等)
样本取自中国黑龙江,北纬50°,东经126°
样本取自中国云南,北纬22°,东经101°
样本取自中国西藏,北纬30°,东经91°
样本取自中国新疆,北纬44°,东经81°
苗瑶语族群(苗族,瑶族)
样本取自中国贵州北纬28°,东经108°
纳西/彝族(纳西族,彝族)
样本取自中国四川,北纬28°,东经103°
样本取自中国福建,北纬27°,东经119°
样本取自中国台湾,北纬23°,东经121°
样本取自中国云南,北纬22°,东经100°
Li J Z, Absher D M, Tang H, et al. Worldwide Human Relationships Inferred
Genome-Wide Patterns of Variation[J]. Science, 2008, 319(5866):1100-4.
David R, Kumarasamy T,
Nick P, et
al. Reconstructing Indian Population History[J]. Nature, 2009, 461(7263):489-94.
Patterson N, Moorjani P,
Luo Y,
et al. Ancient admixture in human history[J]. Genetics, 2012, 192(3):1065.
Cann H M, De T C, Cazes
L, et al.
A human genome diversity cell line panel.[J]. Science, 2002, 296(5566):261.
Consortium T 1 G P,
Altshuler D
L, Durbin R M, et al. A map of human genome variation from population-scale sequencing[J].
Nature,
2010, 467(7319):1061-73.
Sudmant P H, Rausch T, Gardner E J, et al. An integrated map of structural
variation
in 2,504 human genomes[J]. Nature, 2015, 526(7571):75-81.
Alexander D H, Novembre J, Lange K. Fast model-based estimation of ancestry
unrelated individuals[J]. Genome Research, 2009, 19(9):1655.
Pritchard J K, Stephens
Donnelly P. Inference of Population Structure Using Multilocus Genotype Data[J]. Molecular
Ecology
Resources, 2007, 7(4):574–578.
基因组信息可以让我们获知自己拥有哪些族群成分,从祖源层面更好地认识自己。然而在我们知道了自己体内所有特定的族群成分之后,或许也想知道每个成分是哪一代祖先遗传给我们的。由此,祖源时间线的功能便应运而生。通过计算,我们可以为您估计每种祖源成分的大致获得时间,了解祖先的足迹如何一步步塑造了独一无二的你。
通常来讲,生殖过程中的同源重组会使得上述计算变得十分困难。为了让计算成为可能,我们引入两个简单的前提假设:
1. 每种祖源成分都只来自于同一单一祖源成分的祖先。
2. 平均每代会有 50% 的遗传物质遗传给下一代。
参考文献:
Gravel, Simon. 2012. Population genetics models of local ancestry. Genetics, 191(2), 607–619.