[觀點] 現代中國-東南亞的人群(基因)來源 (二)
4. 第二篇論文的常染色體分析
以下為
Genomic Insights Into the Demographic History of the Southern Chinese
https://www.frontiersin.org/articles/10.3389/fevo.2022.853391/full
這篇中國的學術論文的常染色體分析
https://i.imgur.com/K6CEh6x.png
![](https://i.imgur.com/K6CEh6x.jpg)
![](https://i.imgur.com/yfcjKet.jpg)
![](https://i.imgur.com/fROI8LO.jpg)
這篇分析中
橘色可以看成 東北亞/北亞 成分
藍色可以看成 原始南島成分
黃色可以看成 原始苗瑤成分
紫色可以看成 原始南亞語/早期中南半島新石器成分
紅色可以看成 原始漢藏語成分 / 早期黃河中上游成分
綠色可以看成 原始侗台語(Kra-dai) / 主流長江流域成分
------
4.1 黃河流域的古人群與現代漢人
仰韶文化(西元前5000年-西元前3000年) 與
龍山文化(西元前2000~西元前3000年)
是黃河流域 / 中原 的新石器文化
這兩個文化,一般被認為是 中原/夏商周文明的前身
在年代地點 考古遺址 與 Y染色體 常染色體 上都能大致對應
可以看出,此圖的分析中,
新時代中期的仰韶文化遺址的基因
以紅色成分為主,輔以少數綠色成分
而到了新時代晚期,龍山文化遺址的基因
大體繼承了仰韶文化的格局,但綠色的成分增加了
而現代的河南漢人,與龍山文化遺址的基因也十分接近
但多了一些橘色的北亞成分,而綠色的長江成分也變得更多
可以推斷出,中國北方早期的基因成分,是以紅色的成分為主
但隨著石器時代以來,黃河流域人群與長江人域人群的混合
而多出了較多綠色的長江流域成分
這篇的基因分析,與上一篇論文不同
分析出了一種主流的長江流域成分 (綠色的成分)
而將 原始南島 與 原始苗瑤 的基因,單獨分析出來
該篇論文分析出的基因距離:
https://i.imgur.com/aHKWq7I.png
![](https://i.imgur.com/aHKWq7I.jpg)
這張圖中,實心有外框的三角形圓形方形
代表石器文化遺址的基因
其他顏色較淡/空心的三角形圓形方形
代表現代人的基因
https://i.imgur.com/jikic5S.png
![](https://i.imgur.com/jikic5S.jpg)
從以上基因距離的圖,可以看出
現代侗台語人群的基因距離,是與南方漢人比較接近的
而南島與原始苗瑤 偏離程度較高
事實上這張常染色體距離圖中
越往右 基因越南,越往左,基因越北
越往上,基因越偏沿海(東),越往下,基因越偏內陸(西)
可以把南島,看成沿海性質最強的南方人群
苗瑤,看成內陸性質最強的南方人群
由於南島與苗瑤分離出的年代較早,保留了較多極端沿海/內陸人群的基因特性
綠色的成分,則可以看成 沿海成分與內陸成分混合後,
所形成的一種晚期長江流域成分
所以南方漢人的基因成分以綠色的成分為主,藍色與黃色的成分較少
而侗台(壯傣)語人群,有可能是源於年代較晚的長江流域人群
所以基因成分也以綠色的成分為主,變成綠色成分的代表
補充,第一篇論文的常染色體距離:
https://i.imgur.com/cauGMHa.png
![](https://i.imgur.com/cauGMHa.jpg)
確實也能看出,漢人介於日韓人與侗台語人群之間,與南島與南亞的距離較遠
( 因為現代南亞語人群中,有一些混到大量藏緬語人群的基因,導致看起來偏北
原始南亞語人群的基因,應該和南島一樣南甚至更南 )
藏緬語族(西藏-緬甸)是漢藏語系的一個分支,早期的根據地在中國西北方
在距今4000~1000年前,漸漸南下,先進入中國西南方,再進入中南半島
對現今的中南半島人,貢獻了大量黃河流域基因
緬甸的官方語言,就是藏緬語族的語言(緬語)
此外,在印度東北方,尼泊爾等地,也有大量藏緬語人群活動的痕跡
印度有不少藏緬語系的少數民族,
藏緬語族擴張史,可以參考某個外國 youtube頻道做的影片:
https://www.youtube.com/watch?v=ZfWFjhEf74A
跟據一些假說性質比較重的推測,
原始漢藏語起源於黃河流域的仰韶文化 (測出y染色體 O-M117/O-F8)
之後藏緬語人群,從原始漢藏人群分離,
在中國西北的馬家窯文化成形
(馬家窯是仰韶的分支,藏緬人的特色Y染色體是O-F8的下游)
藏緬語族的名人: 古羌(疑似介於漢與藏緬之間),党項人(西夏),彝族,西藏人,
吐蕃(西藏人建立),緬甸主體民族(緬人),緬甸少數民族(克倫族等),古四川土著(存疑)
--------------
4.2 越南人與泰國人的來源
https://i.imgur.com/yfcjKet.png
![](https://i.imgur.com/yfcjKet.jpg)
![](https://i.imgur.com/fROI8LO.jpg)
從常染色體分析可以看出
寮國與越南的新石器遺址,是以紫色的南亞語成分為主的
(這種南亞語成分,可能也吸收了小部分大洋洲/和平文化人群的基因)
但現代的寮國人/泰國人/越南人
卻多出了大量綠色成分(侗台語成分)
這可能源於侗台語人群晚期的南下
推測是在近兩千五百年內
來自廣東廣西的侗台語人群
大舉湧入中南半島,改變了此地人的基因格局
成為越南人泰國人的主流基因來源之一
https://i.imgur.com/QqtyYop.png
![](https://i.imgur.com/QqtyYop.jpg)
從上一篇論文(第一篇論文)的常染色體分析也可見
越南在三千年前,還是以南亞人的基因為主
但在2300~2100年前,卻突然多出大量的侗台語成分
時間點正好是 南越國 與 越南被併入漢朝的前夕
不知道純屬巧合,還是有受到 南越國的影響
導致廣東廣西的土著大舉湧入越南
(廣東廣西越南 曾經同屬於距今 2100~2300年前的南越國
南越國是秦朝征服越南後,秦朝將領趙佗,在秦朝滅亡後,
與當地土著合作,在當地就地建立的政權。 )
有趣的是,現代東南亞國家中
官方語言是 侗台語的國家有: 泰國(泰語) 寮國(寮語)
泰語與寮語都是侗台語系 壯泰語族 泰語支 ,底下的分支
反而是越南語,是南亞語系底下的語言
但越南人的基因,卻是以侗台語成分(綠色為主流),紫色的南亞語成分為輔
反而是泰國人有較高的南亞語成分
這也體現在長相與膚色上
中國的侗台語人群(例如廣西壯族)膚色比較接近東亞人
越南人膚色會接近東亞人的原因,應該便是因為含有大量侗台語基因所致
反而泰國人因為南亞語基因較高,膚色比較深,接近東南亞人
可能是因為侗台語成分,屬於長江流域較晚近才形成的成分
而那個時代,長江流域人群的膚色已比較接近現代東亞人
不知道是否因為不明原因,從廣東廣西湧入的大量侗台語人群
儘管在基因上反客為主,變成越南人的主流基因,
語言上反而被本地的南亞語土著同化掉
南亞語系是中南半島歷史最悠久的現存語言
這體現中南半島,大多數與外界封閉,藏在深山叢林中的少數民族
講的語言都是南亞語系的語言
所以推測南亞語是早期人群帶入的,而不是晚近移民突然帶入的
------
4.3 南島語族與福建
https://i.imgur.com/K6CEh6x.png
![](https://i.imgur.com/K6CEh6x.jpg)
如上圖可見
福建四千年前的新石器遺址,測出了高純度的原始南島語成分
台灣兩千年前的漢本遺址,測出100%藍色成分(推測為原始南島語成分)
但因為不明原因,現代台灣原住民中,多出更多綠色成分(晚近/主流長江流域成分)
而且這種成分在菲律賓人中也有
有可能是因為南島語人群存在基因多樣性,藍色成分無法100%代表所有的南島人成分
所以剩下的南島人群成分,就用綠色的成分替補
雖然福建四千年前的遺址,測出了高純度的原始南島成分
該遺址應該是 福州的曇石山文化遺址
但這似乎沒有體現在現代福建人的基因上
現代福建人的南島成分,沒有明顯高於其他中國南方人
推測可能的原因:
1. 福建的土著不只有一個類型,除了曇石山以外,還有其他類型的土著
2. 距今2500~4000年,其他地區的人群進入福建,稀釋掉或替換掉原本的土著
3. 閩越國本身就是外來的人群建立的,有可能就是越國人南下,或者其他原本在楚國
境內,受楚國文化影響較深的百越族群,在戰國時期流入福建所建立。
現存的閩越國遺址中使用漢字與華夏化建築,確實很有可能是外來人群所帶入
有可能在這個過程中本地的土著被稀釋或替代掉。
4. 漢代與魏晉南北朝時期,進入福建的漢人將本地土著大幅稀釋或替換掉,
入閩的漢人中,有大量原為楚人吳人,
故而福建人的南方基因有可能大多數源自吳楚(湖北江西江蘇浙江)等地
現代吳楚故地人的基因北於福建人,是因為秦漢以後,大量南下的北人,
使今湖北江西浙江人的基因變得更北
也有可能這四個假設,都在不同程度上同時發生
如果未來能測試更多晚近福建考古遺址的基因,應該能做出更多進一步的推論
5. 古南方人群與古北方人群的界定標準
值得注意的一點是,這種常染色體分析,有時候容易具有誤導性
因為古人群的基因,並非一成不變的,而是一直都在流動
舉例來說,七千年前的古北方人群,九千年前的古北方人群,
一萬多年前的古北方人群,可能都不完全是同一個人群
所以這種常染色體分析,只要變化比較的基準,或分析的演算法,
就能分析出不同的成分與比例
所以如果要討論,現代的人群,基因中有多少源自古北方,有多少源自古南方
是很難有準確的定義的,因為古北方與古南方本身就沒有嚴謹的定義
但儘管如此,使用古人群或現代人群,當作古北方與古南方的標竿
來計算現代人古北古南比例的分析,仍然是可以參考的
只要清楚這種比例是一種相對的概念,換一個基準,比例可以隨時變化即可
例如本文引用的第三篇論文
Genomic insights into the formation of human populations in East Asia
https://www.nature.com/articles/s41586-021-03336-2
就是分別選了兩個石器遺址,來當成古北方人群與古南方人群的標竿
以對現代人的基因進行分析
https://i.imgur.com/7suqKZr.png
![](https://i.imgur.com/7suqKZr.jpg)
例如這篇論文,即使用台灣漢本(兩千年前遺址/原始南島)作為古南方人群的標竿
並用陝西的Wuzhuangguoliang新石器晚期遺址作為古北方人群的標竿
所得出對中國各地漢人的分析結果
算出福建一帶漢人的比例是大約 北八南二,再往北是大概北九南一
但值得注意的一點是,台灣漢本的基因,縱使以整個東亞-東南亞的視角
都十分南,比很多現代東南亞人都還要南,而且用漢本當古南方標竿,
未必能含括到南方內陸土著(苗瑤系)的基因
所以算出這個結果
像上一篇論文的分析,該篇分析算出的南方主流成分(綠色)
是比較接近用廣西海南的壯傣民族當標竿的
算出南方漢人的比例就是接近北四南六
北方漢人接近北六南四
但這種分析法的準確度,也是可以被懷疑的,
因為有可能綠色成分本身就包含了部分晚近的古北方基因
所以基本上只要使用不同的樣本,就會算出不同的結果
https://i.imgur.com/C2oAWwA.png
![](https://i.imgur.com/C2oAWwA.jpg)
如果用Y染色體來算,把 O1a O1b1a1(O-PK4) O-M188 O2b O2a1a 算成古南方的基因
其他都算成古北方的基因
(O1a O1b1a1(O-PK4) 是東南亞人的主流基因,
但東南亞人中也有O2a(有一部分是O-M188底下的分支))
用這種方法來算的話
南方漢人大概介於 北六南四 ~ 北七南三 之間
不過這當然也是一種粗暴的算法
應該會有極大的誤差
而且會得出湖北漢人比福建漢人還南,這種與常染色體完全對不上的情形
另外比較遺憾的是,可能由於長江流域地理環境的緣故
當地的石器遺址的古人屍體,包存狀況不佳,增加了提取基因,檢測常染色體的困難性
目前只聽說良渚文化有測過Y染色體(O1a主流,但混有其他類型的Y染色體)
但好像沒有常染色體的測試(可能是因為測試常染色體難度較高,
要求更高的屍體保存狀況)
所以無法直接的比較長江流域人群的常染色體變化
6. 語言
漢語與藏緬語同源,這點是被廣泛接受,比較沒有爭議的
現代漢語與藏緬語差異極大,所以漢語與藏緬語的關係
主要是透過一些記載古漢語的文獻,間接推出得出的結果
而其他關於漢藏語系與其他語言同源的假說,還有不少
但大部分都爭議極大,可靠性是比較低的
至於其他東南亞的語言,還有
南亞語系
南島語系
侗台語系
苗瑤語系
這四個語系
這四個語系再加上藏緬語系,就包含了所有東南亞人使用的語言 (排除新幾內亞土著)
這四個語系中,除了南亞語有爭議性以外,另外三個,都普遍認為最早發源於中國南方
但主流的假說也認為南亞語可能發源自中國南方
(除此之外,還有湄公河假說,印度假說等,印度假說的可能性應該較低,
基因上完全對不上)
而這四個語言,也被一些學者認為互相之間有關連,可能存在互相影響的關係
組成東南亞語言聯盟
這種語言的關聯性,可能是因為這幾種語言,最早都源於長江流域,
所以彼此間具有互相接觸的關係
此外,最新的語言學研究,認為南島語與侗台語之間,可能存在同源關係
因為兩個語言共享較多的同源詞彙
儘管如此,從Y染色體來看,侗台語人群與南島語人群,差異巨大
廣西壯族的主流Y染色體是O1b1a1(O-PK4) 占比約 50%, O1a僅 7%
而台灣原住民主流Y染是 O1a
所以有可能兩種語言同源的年代十分久遠,能追溯到長江流域
才會在基因差異巨大的情況下,語言仍然可能存在同源關係
但也不能排除,有晚近人群之間,在沒有基因替換的情況下傳播語言
--
仰彼朔風。用懷魏都。願騁代馬。倏忽北徂。凱風永至。思彼蠻方。願隨越鳥。翻飛南翔
四氣代謝。懸景運週。別如俯仰。脫若三秋。昔我初遷。朱華未晞。今我旋止。素雪雲飛
俯降千仞。仰登天阻。風飄蓬飛。載離寒暑。千仞易陟。天阻可越。昔我同袍。今永乖別
子好芳草。豈忘爾貽。繁華將茂。秋霜悴之。君不垂眷。豈云其誠。秋蘭可喻。桂樹冬榮
弦歌盪思。誰與銷憂。臨川慕思。何為泛舟。豈無和樂。遊非我鄰。誰忘泛舟。愧無榜人
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.162.12.183 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/historia/M.1676262347.A.D67.html
推
02/13 12:41,
1年前
, 1F
02/13 12:41, 1F
→
02/13 12:41,
1年前
, 2F
02/13 12:41, 2F
→
02/13 12:42,
1年前
, 3F
02/13 12:42, 3F
→
02/13 12:42,
1年前
, 4F
02/13 12:42, 4F
→
02/13 12:43,
1年前
, 5F
02/13 12:43, 5F
→
02/13 12:43,
1年前
, 6F
02/13 12:43, 6F
→
02/13 12:44,
1年前
, 7F
02/13 12:44, 7F
→
02/13 12:54,
1年前
, 8F
02/13 12:54, 8F
→
02/13 12:55,
1年前
, 9F
02/13 12:55, 9F
→
02/13 12:55,
1年前
, 10F
02/13 12:55, 10F
推
02/13 13:01,
1年前
, 11F
02/13 13:01, 11F
→
02/13 13:04,
1年前
, 12F
02/13 13:04, 12F
→
02/13 13:04,
1年前
, 13F
02/13 13:04, 13F
推
02/13 15:41,
1年前
, 14F
02/13 15:41, 14F
→
02/13 15:42,
1年前
, 15F
02/13 15:42, 15F
→
02/13 15:46,
1年前
, 16F
02/13 15:46, 16F
→
02/13 15:47,
1年前
, 17F
02/13 15:47, 17F
台灣原住民內部應該是有明顯的內部差距的:
透過粒線體分析的基因距離:
https://i.imgur.com/qWM40LF.jpg
![](https://i.imgur.com/qWM40LF.jpg)
透過Y染色體分析的基因距離:
https://i.imgur.com/ciVrK7l.jpg
![](https://i.imgur.com/ciVrK7l.jpg)
來源論文
https://www.mdpi.com/2673-8856/2/3/13
但這篇的樣本數很小,誤差可能會很大
推測是因為台灣各原住民部落,傾向保留較多自己的遺傳特色
不像其他地方,同一個地區的人群基因混的比較均勻所致
※ 編輯: a46911a149 (1.162.12.183 臺灣), 02/13/2023 16:41:51
推
02/13 16:57,
1年前
, 18F
02/13 16:57, 18F
推
02/13 18:29,
1年前
, 19F
02/13 18:29, 19F
→
02/13 18:57,
1年前
, 20F
02/13 18:57, 20F
→
02/13 18:57,
1年前
, 21F
02/13 18:57, 21F
→
02/13 18:57,
1年前
, 22F
02/13 18:57, 22F
→
02/13 18:57,
1年前
, 23F
02/13 18:57, 23F
→
02/13 19:31,
1年前
, 24F
02/13 19:31, 24F
→
02/13 19:31,
1年前
, 25F
02/13 19:31, 25F
→
02/13 19:31,
1年前
, 26F
02/13 19:31, 26F
推
02/14 18:53,
1年前
, 27F
02/14 18:53, 27F
→
02/14 18:53,
1年前
, 28F
02/14 18:53, 28F
→
02/14 18:53,
1年前
, 29F
02/14 18:53, 29F
→
02/14 18:54,
1年前
, 30F
02/14 18:54, 30F
→
02/14 18:54,
1年前
, 31F
02/14 18:54, 31F
→
02/14 18:54,
1年前
, 32F
02/14 18:54, 32F
→
02/14 18:54,
1年前
, 33F
02/14 18:54, 33F
→
02/14 18:55,
1年前
, 34F
02/14 18:55, 34F