藏族人對高海拔的適應(yīng)是研究現(xiàn)代人類進化史上適應(yīng)的理想模型,因為其環(huán)境控制的很好。在高海拔地區(qū),高原反應(yīng)(包括急性高山病、肺水腫和腦水腫等)較為常見,但藏族人群的患病率低于漢族人群,以往的研究主要集中在缺氧誘導(dǎo)因子(HIF)途徑上。然而,這種適應(yīng)性在種群規(guī)模上仍然不足。結(jié)構(gòu)變異(SVs)在基因組生物學(xué)功能和人類進化適應(yīng)中扮演重要角色,可以影響遠程基因調(diào)控、基因簇擴增和強效適應(yīng)性變化。然而,但人類基因中SV熱點的分布模式仍不完全清楚。
2023年12月,中國人民解放軍總醫(yī)院何昆侖教授團隊在期刊Nature Communications(IF=16.6)發(fā)表題為《Structural variants involved in high-altitude adaptation detected using single-molecule long-read sequencing》的研究論文,該研究構(gòu)建了一個大規(guī)模的漢族和藏族人口的SV景觀,揭示了SVs藏族人對高海拔適應(yīng)的潛在作用。通過增強子報告基因,細胞敲除,DNA pull-down實驗,研究發(fā)現(xiàn)藏族基因特性的缺失破壞了超級增強子,并下調(diào)了EPAS1的表達,揭示了基因調(diào)控回路重組在人類適應(yīng)中的作用。青蓮百奧為該研究提供了DNA pull-down質(zhì)譜檢測分析服務(wù)。
文章題目:Structural variants involved in high-altitude adaptation detected using single-molecule long-read sequencing
發(fā)表期刊:Nature Communications
影響因子:16.6
發(fā)表時間:2023年12月13日
發(fā)表單位:中國人民解放軍總醫(yī)院
樣本選擇:320例人血液(201例漢族和119例藏族)用于ONT長讀長測序;150例人血液(75例漢族和75例藏族,其中123例既測長讀長又測短讀長)用于短讀長測序。
實驗技術(shù):單分子長讀長測序,短讀長測序,CRISPR/Cas9介導(dǎo)的基因敲除,RT-qPCR,DNA pull-down
這項研究使用了ONT(Oxford Nanopore Technologies)的PromethION平臺對201個漢族和119個藏族個體的基因組進行了長讀長測序,平均覆蓋深度為20.24。每個樣本通過cuteSV,sniffles和nanovar調(diào)用的SVs,并使用dbSVmerge將320個SV調(diào)用合并成最終的漢族和藏族SV調(diào)用集。在漢族人群中檢測到了116,773個SVs,在藏族人群中檢測到了94,312個SVs,總共檢測到了136,257個SVs。這些SVs主要包括71,437個刪除、56,799個插入、7198個復(fù)制和823個反轉(zhuǎn),平均每個樣本包含19,272個SVs(圖1b)。在50%的樣本中,漢族和藏族種群中超過90%的SVs被捕獲,表明,樣本量足以描述漢族和藏族人群的SV景觀。
通過手動驗證、PCR驗證和與其他平臺(如PacBio、HiFi)的結(jié)果進行比較,來驗證SV調(diào)用集的質(zhì)量,結(jié)果顯示,他們的SV調(diào)用集具有高質(zhì)量。結(jié)果還顯示,長讀長測序平臺在處理具有GC偏向性的基因組區(qū)域時也表現(xiàn)良好。與NGS相比,ONT平臺在GC含量較高的區(qū)域中檢測到了更多的SVs。最后,將SV調(diào)用集與其他公共SV集進行了比較,發(fā)現(xiàn)該研究擴展了東亞人群的SV調(diào)用集,增加了約43%的新SVs。此外,該研究還貢獻了42,261個新的全局SVs,其中包括11,137個藏族特有的SVs和20,571個漢族特有的SVs。
總的來說,這項研究為漢族和藏族人群提供了高質(zhì)量的SV調(diào)用集。
圖1:119例藏族樣本和201例漢族樣本中SV的發(fā)現(xiàn)
SVs主要分布在重復(fù)區(qū)域(約67%在重復(fù)區(qū)域),如轉(zhuǎn)座子和衛(wèi)星重復(fù)區(qū)域。這可能是因為重復(fù)區(qū)域更容易發(fā)生非等位同源重組、復(fù)制滑脫和非同源末端連接等過程,導(dǎo)致SVs的產(chǎn)生。在各類重復(fù)元素中,SVs在SINEs、LINEs和LTRs中的分布比例分別為15%、8%和4%,而在衛(wèi)星重復(fù)區(qū)域和簡單重復(fù)中的比例分別為4%和21%(圖2a)。不同類型的SVs在各類重復(fù)和功能元素中的分布存在偏差。例如,刪除、插入和復(fù)制與SINEs和簡單重復(fù)相關(guān),而反轉(zhuǎn)則與LINEs、SINEs、簡單重復(fù)和LTRs相關(guān)。此外,SV的長度分布顯示了兩個明顯的峰值,分別位于約300bp(Alu)和約6kb(LINE)。SVs在基因組中的熱點區(qū)域也被揭示,這些熱點區(qū)域是SVs密度極高的區(qū)域,與其他區(qū)域相比,它們更容易發(fā)生SVs。例如,C7orf50區(qū)域就與大量的SVs相關(guān),表明這個區(qū)域容易發(fā)生DNA斷裂和SVs的形成。SVs與基因表達的調(diào)控密切相關(guān)。由于啟動子和增強子與SINEs相關(guān),因此它們也與SINE相關(guān)的SVs相關(guān)。此外,刪除、復(fù)制、插入和SINE相關(guān)的SVs在調(diào)控基因轉(zhuǎn)錄方面比其他類型的SVs更為重要。
圖2 SV組成、長度頻率和染色質(zhì)分布
結(jié)構(gòu)變異是一種基因組的變異形式,可以作為區(qū)分不同人群的一個重要特征。研究發(fā)現(xiàn),漢族和藏族共同擁有74,828個SVs。通過主成分分析(PCA),漢族和藏族的SVs可以明顯區(qū)分。當將PCA擴展到1KGP數(shù)據(jù)庫中的其他人群(如非洲、美洲、東亞、歐洲和南亞人群)時,發(fā)現(xiàn)漢族和藏族與東亞人群關(guān)系密切,而與其他人群距離較遠。這表明藏族在遺傳上與漢族更接近,與其他人群相比,這兩個人群可能來源于一個共同的祖先(圖3a)。此外,通過混合分析和所有SVs的進化樹分析,發(fā)現(xiàn)漢族和藏族在SVs上存在明顯的分離(圖3b)。層次聚類分析也顯示,漢族和藏族具有民族特異的SVs和共同的SVs。基于也清楚地顯示了漢族和藏族之間的分離(圖3c)。
這些結(jié)果表明,除了單核苷酸多態(tài)性(SNPs)外,SVs也是區(qū)分遺傳上密切相關(guān)人群的一個穩(wěn)健的代表性特征。
圖3 漢族和藏族群體遺傳學(xué)
本文研究了藏族人適應(yīng)高海拔環(huán)境的基因組信號,藏族人適應(yīng)高海拔環(huán)境的基因組信號是由SNPs、InDels和SVs協(xié)同作用所實現(xiàn)的。通過深度短讀長測序和長讀長測序數(shù)據(jù)的綜合分析,在EGLN1和EPAS1等基因區(qū)域中發(fā)現(xiàn)了明顯的進化選擇信號。在藏漢人群的差異研究中,篩選了FST>0.1的SVs,發(fā)現(xiàn)了240個SVs,其中19個是新穎的,169個在藏族人中的頻率高于漢族人(圖4b)。這些SVs可能與高海拔適應(yīng)性相關(guān),特別是EGLN1基因中的一個插入物與先前報道的高海拔相關(guān)性一致。SVs可以通過改變順式調(diào)控電路來實現(xiàn)廣泛的遠端調(diào)控,作者發(fā)現(xiàn)52%的SVs與增強子、沉默子或拓撲關(guān)聯(lián)域(TAD)邊界重疊,進一步表明了SVs在調(diào)控網(wǎng)絡(luò)中的重要性。
深入研究了17個FST>0.2的SVs,包括3個新穎的SVs,這些SVs附近的蛋白編碼基因與缺氧反應(yīng)、炎癥、葡萄糖、脂質(zhì)和能量代謝、胰島素受體信號傳導(dǎo)、血液凝固和角蛋白絲等生物學(xué)特性有關(guān)。特別是dbsv66240 SV破壞了一個超級增強子,下調(diào)了EPAS1的表達,這是藏族人中最強的特異性信號,表明SVs在高海拔適應(yīng)性中的重要作用。這些結(jié)果表明,這個SV與這些SNPs和InDels協(xié)同作用,影響高海拔適應(yīng)性。此外,EPAS1和TMEM247在藏獒中也受到正向選擇,并顯示出不同的關(guān)聯(lián)信號,表明它們都對適應(yīng)性有功能貢獻。
圖4 漢族、藏族種群比較揭示進化適應(yīng)的遺傳景觀
研究了藏族人群體中的兩個特定結(jié)構(gòu)變異(SVs):dbsv66240的刪除和dbsv124029的插入,以及它們對生物學(xué)功能和適應(yīng)性的影響。研究發(fā)現(xiàn):dbsv6620刪除涉及基因調(diào)控增強子和啟動子,可能在腎臟細胞中發(fā)揮順式調(diào)控作用,影響缺氧反應(yīng)相關(guān)基因的表達,如EPAS1。該刪除還通過反式調(diào)控電路影響基因轉(zhuǎn)錄活性,改變了與轉(zhuǎn)錄因子結(jié)合的基因組區(qū)域,從而可能下調(diào)基因表達。通過DNA pull-down實驗,發(fā)現(xiàn)202個結(jié)合蛋白,包括轉(zhuǎn)錄因子、中介復(fù)合物和鋅指蛋白。GO分析顯示,與dbsv66240序列結(jié)合的蛋白質(zhì)主要富集在與轉(zhuǎn)錄共調(diào)節(jié)因子結(jié)合、轉(zhuǎn)錄共激活因子結(jié)合和DNA結(jié)合轉(zhuǎn)錄阻遏活性等分子功能相關(guān)的類別中。另一方面,dbsv124029插入與藏族人的長壽、睡眠質(zhì)量和情緒有關(guān),位于C7of50和ZFAND2A之間,且位于與失眠癥狀和舒張壓相關(guān)的遺傳區(qū)域內(nèi),并可能通過復(fù)雜的順式和反式調(diào)控電路影響相關(guān)基因的表達。這些發(fā)現(xiàn)表明,藏族人中最具特色的SVs通過重塑與高原適應(yīng)相關(guān)的基因表達,對適應(yīng)性表型差異有所貢獻。研究還發(fā)現(xiàn)了與藏族人頭痛發(fā)生率、脂質(zhì)代謝、跟骨密度和出生體重相關(guān)的基因變異。例如,位于TIMD4基因內(nèi)含子中的一個變異可能會影響TIMD4的表達,從而影響頭痛發(fā)生率,同時也與甘油三酯、低密度脂蛋白(LDL)膽固醇和總膽固醇水平有關(guān)。此外,研究還發(fā)現(xiàn)了一些功能不明的基因變異,這些變異可能與學(xué)習(xí)、發(fā)聲行為、突觸前組裝和自閉癥等相關(guān)。
這些發(fā)現(xiàn)揭示了藏族人通過基因變異來適應(yīng)高海拔地區(qū)的環(huán)境壓力,增進了對人類適應(yīng)性進化的理解,也提供了新的視角來研究其他復(fù)雜的人類性狀和疾病。
圖5 藏族高原適應(yīng)基因的進化選擇
該研究通過對320例藏族和漢族樣本進行長讀長測序,破譯結(jié)構(gòu)變異在高海拔適應(yīng)中的作用,發(fā)現(xiàn)基因間缺失通過破壞超級增強子來下調(diào)EPAS1的證據(jù)。
@2024北京青蓮百奧生物科技有限公司 京ICP備17052224號