K在距离今天3万年前最终也进入了东亚。
C的最主要的几个支系为C*、C1、C2、C3、C4、C5。
C1只分布在日本地区的大和族人中(韩国也发现过一例),日本土著民族阿伊努人中主体是D2,少量C3,并无C1。日本人C1大致占5.4%,C3大致占3.1%(Hammer,2006年,259个样本),日本之外没有C1发现。
C2分布在印尼、巴布亚新几内亚等地,在印尼东部马来人中,C2占27.3%(Hammer,2006年,15/55人),新几内亚,86%(4/46),波利尼西亚人63.3%(37/60)。
C4、C5分布在南部印度人、斯里兰卡人和澳大利亚土著人中,超出黄种人的范围,不予以讨论。
C*是指除C1、C2、C3、C4、C5之外的C成分。
C*主要分布华南地区,如Hmamer数据中,瑶族为20%,土家为6.1%(另有C3为18.4%),苗族为1.7%(另C3为3.4%),马来亚为3.1%,印尼东部为5.5%(C2占27.3%),西部印尼为4.0%,维吾尔族为1.5%。C*可能主要分布在华南和东南亚地区,但实质上在华北地区也有很多。如XUE的数据里,如鄂温克为3.8%,赫哲族为6.7%,宁夏**为11.4%,乌鲁木齐维族为3.3%,伊犁维族为2.6%,Bama瑶族为17.2%。可以说C*在东亚分布也是很广的。
对东亚人而言,真正重要的成分是C3。
C3大致产生于距离今天4—3.5万年前的东亚,并扩散到北亚和北美州、南美洲。
在如此广阔的范围内,C3的支系十分众多。
C3*、C3a、C3b、C3c、C3d分布区域各不相同,这种格局可能在3万年前就已经具有了雏形。
C3a只分布在日本和韩国,和D2、C1、O2b,还有母系的M7a一样,都是具有日本韩国特征的特有类型。
C3b分布在北美州西北部地区,是当地土著印第安人的特征,占当地印第安人的9%。
C3c是极其具有阿尔泰语系标志性的类型,在西伯利亚南部达到峰值,并深刻影响了周边的其他阿尔泰语系民族。
在西伯利亚的南部地区,C3c是最重要的成分。如Pakendorf在2006年的数据中,中部埃文人50%,东部埃文人61.3%,中部通古斯人为40%,北部说突厥语的通古斯人为15.1%,
Nyukzha通古斯人53.8%,Lengra通古斯人66.7%,Stony通古斯人70%,Okhotsk通古斯人为62.5%,Yenisey通古斯人为58.1%,可以说,在西伯利亚南部,尤其是通古斯人,C3c是最重要的成分。但在西伯利亚北部,N3则是最重要的成分,如雅库特人,N3占92.2%,而C3c才占1.1%,北部埃文人中,N3占90.9%,而C3c才占4.5,北极地区的爱斯基摩则以Q3和N3为主,没有C3c。在西伯利亚南部,N3的比例一般在20—40%之间,是南部西伯利亚通古斯人另一重要成分。
C3c在蒙古草原也有一定的分布,是蒙古语民族的标示性基因类型之一。如ToruKatoh的数据里,喀尔喀蒙古为15.3%(17/85),乌梁海蒙古为33.3%(20/60),Zakhchin蒙古为30%(18/60),Khoton蒙古为10%(4/40)。而Karafet在2001年的数据,149个外蒙古喀尔喀蒙古人,29个C3c,占18.1%。Xue的数据里内蒙古为8.9%(4/45),Zerjal在2002年的数据外蒙古人C3c为20%(13/65),spencer在2001年的数据里为45.8%(11/24)。Hammer的数据里,布里亚特人为4.9%(4/81),卫拉特人(阿尔泰)为5.1%(5/98),Pakendorf在2006年的数据,图瓦人(我国户籍登记为蒙古族),为9.1%(5/55),spencer在2001年的数据里图瓦人C3c为7.1%(3/42),IvanNasidze在2005年的数据,俄罗斯卡尔梅克人为37.4%(37/99)。综合看,核心的标准蒙古人一般有20%以上的C3c成分,其中内蒙古人最低,喀尔喀蒙古其次低,这两个群体低C3c主要是因为成吉思汗家族一簇的稀释和O3的高比例加入,内蒙蒙古人有最高比例的O3,超过了30%。外蒙古喀尔喀人也出人意外的有高比例O3,超过20%以上,而西部的图瓦人、Khoton人、卫拉特人、卡尔梅克人,O3都非常罕见,低于3%,甚至个别数据里根本没有O3,所以西部蒙古人可能原来本没有O3的,东部蒙古(喀尔喀—科尔沁—喀喇沁)则有高比例的O3,不同地区的蒙古人有不同的起源。
总体上看,突厥语各民族C3c并非主体成分。只有哈萨克族C3c特别高,如spencer在2001年的数据里57.4%(31/54),Zerjal在2002年的数据63.2%(24/38)。同样spencer的数据里,吉尔吉斯人为7.7%(4/52)卡拉卡尔帕克人为2.3%(1/44),7个地区共计326个乌兹别克人里一共4个C3c(只分布在其中2个人群,另5个人群无C3c)。中亚维吾尔人、土库曼人、喀山鞑靼人、克里米亚鞑靼人、阿塞拜疆人里没有C3c。Zerjal的数据里,中亚维吾尔人3.3%(1/33),吉尔吉斯人为12.2%(5/41),其他突厥语民族乌兹别克人、土库曼人、阿塞拜疆人没有C3c,Cengiz的2003年土耳其人数据,523个土耳其人只有5个C3和1个O3,其他都非东方草原血统。总体看,突厥语人中,哈萨克人与其他所有突厥人都明显不同,他们可以说与草原和西伯利亚南部边缘的蒙古人基因上非常接近,所不同的仅仅是他们讲突厥语而非蒙古语,吉尔吉斯人也有非常高比例的东方草原民族血统,尤其接近萨彦岭——阿尔泰山等地的土著游牧狩猎民族。其他突厥民族的主体成分来自中亚农业土著居民,与哈萨克、吉尔吉斯等草原游牧民族差异极其明显,而N3占92.2%的雅库特人与其他突厥语民族基本没有血统相似性,是被同化的地道的北极边缘的土著人。
C3c在我国东北其他阿尔泰语居民中也有一定分布,Hammer数据里,鄂温克为34.1%,鄂伦春为68.1%,辽宁满族没有C3c,Xue的数据里,鄂温克为26.9%、鄂伦春族为41.9%、赫哲族为11.1%、锡伯族为4.9%,岫岩满族为2.8%,达斡尔族为2.6%,ToruKatoh的数据辽宁满族为7.9%。总体上看,东北地区各阿尔泰语系民族父系远祖主体来自华北平原地区的东亚人群,受到西伯利亚居民的影响的主要是鄂伦春和鄂温克人,其他人都和南部西伯利亚边缘的通古斯人关系甚远。
C3c在阿尔泰语周边的汉、韩、日民族并不存在。如2001年spencer的北方汉族、韩国人中,2004年ToruKatoh的辽宁汉族、延边朝鲜人、韩国人、日本人,2006年Hammer数据的华北汉族、华南汉族、台湾汉族、韩国人、日本人、冲绳东亚人类分布人,2006年Xue数据里的哈尔滨汉族、伊犁汉族、兰州汉族、成都汉族、梅县汉族、延边朝鲜人、韩国人、日本人中,都没有发现任何一个C3c,所以可能情况是,C3c主要是随着阿尔泰语系的扩散而扩散的,周边的中、日、韩人里没有受到这种扩散的影响。
C3d是C3各支系中的另一个非常重要的支系,C3d主要分布在汉族、越南等民族中。
C3d在汉族中数量不高,但非常古老。实际上,整个C3家族,也是越向南越古老,STR多样性越高,显示了C3整体上是从华南地区向华北再向北亚扩散的。
C3d(C3*)在今天很多汉藏语民族中都有高比例分布,如Hammer数据中的土家族,为18.4%,如复旦数据的白族,为16.7%,汉藏语人的C3和北亚人的C3并不相同,相反,汉族、越南两族人的C3在STR上十分接近,同时和白族、土家族的C3d十分接近,有相同的起源,可见汉族和南方越民族的关系十分接近,独特的C3d显示了汉族等众多汉藏语民族共同的南方起源性质。
C人群对应的母系为M系(M*、M7、M8、M9、M10、C、D、G、Z)。今天,东亚人母系成分中,M对应了大致60%的成分,北方略多,南方略少。从常染色体角度上可以说,今天大部分东亚人都有一般以上古亚洲人的血统。
部分人尤其是一些网友推测,C人群,尤其是C3人群,外貌上已经完全是现代黄种人外貌。称呼“棕色人种”并不一定准确。是否确实如此,在没有论文数据情况下,我们不好定论。但我们要承认,C人群对现代东亚人基因库genepool的贡献并不逊色于N和O人群,唯独只是在Y染色体上略少一些而已。