3月3日,國際頂尖期刊《細胞》以“全基因組測序揭示非洲人群的復雜演化歷程與對環境的適應性進化”為題👩🏼🎤,在線發表了以恒行2平台生命科學學院和人類表型組研究院樊少華青年研究員為第一作者🚤、賓夕法尼亞大學遺傳學系莎拉·蒂什考夫教授為通訊作者的國際科學團隊歷時7年完成的最新研究成果。
現有研究表明,現代人類起源於非洲,相比於其它大陸,現代人類在非洲居住時間最長,並且在遷徙,融合和對環境適應性進化的過程中形成了超過3000個民族和2100種語言。目前非洲人群不僅具有世界上最豐富的遺傳多樣性和表型多樣性🙇🏽♂️,並且現代人類近三分之一的語言都在非洲👪,是全世界語言最為多樣化的地區之一🤞🏿。
然而👮🏻,目前的遺傳學和基因組學的研究中☺️,只有不到3%的樣本來自非洲🤢,存在嚴重的滯後性。研究非洲人群遺傳多樣性不僅將加深我們對於現代人類起源、早期遺傳結構以及適應性進化的理解🥑,並且也能為健康和診斷研究及開發提供豐富的新遺傳信息。
該研究對極具代表性的非洲12個群體的180位個人進行了全基因組測序分析。這些民族地理分布廣泛,以種植農業、打獵收集和遊牧等不同方式為生🕖,並且涵蓋了非洲四個主要的語系。
基於人類參考基因組👵🏼,研究共發現3200萬個單核苷酸多態性位點(single nucleotide polymorphism, SNP),其中大約530萬個位點是在之前沒有發現的。這些新發現的突變廣泛的存在於增強子、啟動子以及轉錄因子結合位點等基因組功能區域。
研究發現12個非洲民族的平均SNP個數和遺傳多態性均具有顯著的差異。以打獵和收集為生的桑人和熱帶雨林小矮人的SNP數量和遺傳多態性最高,而Amhara🤨,Fulani🔃,Chabu以及Hadza等民族的遺傳多態性則最低。而大量非洲外人群的基因滲入(在Amhara和Fulani人群中)以及嚴重的群體瓶頸(在Hadza和Chabu人群中)是造成部分非洲人群體遺傳多態性低的主要原因#️⃣。例如👨🏼🦲,生活在坦桑尼亞的Hadza群體和埃塞俄比亞的Chabu群體的人口數量已經少於1000人。
在研究中🧑🚀,科學家利用鄰近距離法對本研究中的12個民族和來自“千人基因組計劃”的歐洲人群(CEU)🧑🏿⚕️、北方漢族人群(CHB)🧖🏿🚶🏻♂️、托斯卡納人群(TSI),以及來自“西蒙斯基因組多態性研究計劃”中的巴布亞人群(Papuan)進行了系統計劃分析,結果顯示現代桑人的遺傳學祖先是現代人類最早發生分歧的一支,隨後發生分歧的是熱帶雨林小矮人的祖先。現代桑人和小矮人祖先的早期分歧的現象也被主成分分析(PCA)和ADMIXTURE所支持。
研究發現🕌,不同民族在系統進化樹的聚類模式與他們目前所處的地理環境顯著相關,這說明地理環境是製約不同民族間基因交流的重要因素。
當然🔽,由於基因交流和遺傳重組等因素的影響,上述鄰近距離法、主成分分析和ADMIXTURE無法用來構建現代人類早期遺傳結構。而當科學家將這些因素全部納入到復雜模型中進行計算分析時卻進一步發現🥇:現代桑人和小矮人的共同祖先,不是現代桑人的祖先,而是現代人類最早分歧的一支。並且研究推斷現代人類的分歧發生在28萬年前🚣🏿♀️,這與之前的考古和基於古DNA檢測推斷的時間一致☝🏽。
同時,科學家們在本研究中利用PCA和ADMIXTURE分析👩🏻🌾,還在目前坦桑尼亞說Kheosan語言的Hadza和Sandawe的基因組中發現了桑人相關的祖源成分。雖然僅有南部非洲的桑人以及東非坦桑尼亞的Hadza和Sandawe說Khoesan語言♗,但本項研究利用PCA分析🧖🏽♂️,將全球之前已發表的來自不同地區的55個古非洲人樣本投射到現代非洲人樣本中後發現,大量的來自不同地區的古非洲人樣本位於桑人和東非的Hadza與Sandawe人群之間,但是這些地區目前卻沒有講Khoesan語言的民族📹📼。該結果提示🧛🏽♂️,Khoesan語系在非洲的地域分布曾經很廣,遍及整個非洲, 但可能受到班圖大遷徙或其它因素的影響,目前說Koesan語的古非洲人群大都滅絕了。
研究過程中,科學家團隊還結合正選擇分析🍿、功能基因組學以及大規模全基因組關聯分析的結果,對12個非洲民族特異的適應性進化進行研究,全面繪製了一幅非洲人群適應性進化的圖譜。