源起研究|西湖大學團隊繪制出迄今最全的RNA可變剪接遺傳
近日西湖大學研究團隊在國際期刊發表了四篇研究成果。其中,西湖大學施一公團隊《人源IgM B細胞受體的冷凍電鏡結構》“Cryo-EM structure of the human IgM B cell receptor” 的科研成果在Science發表。該成果首次報道了人源IgM同種型B細胞受體(IgM-BCR)的高分辨率三維結構,揭示了膜結合的IgM(mIgM)與Igα和Igβ異源二聚體復合物組裝的分子機制,從而回答了B細胞受體如何組裝這一重要科學問題,同時也為基于B細胞受體的免疫療法提供了關鍵的結構基礎。
另外,楊劍團隊的研究成果也受到業界廣泛關注,該團隊主要繪制出了迄今最全的RNA可變剪接遺傳調控圖譜。
圖 | 相關論文(來源:Nature Genetics)
北京時間2021年11月5日凌晨0時,相關論文以題為“A generalized linear mixed model association tool for biobank-scale data”發表在Nature Genetics,西湖大學副研究員祁婷博士為本文第一作者,西湖大學楊劍教授為本文通訊作者[1]。
圖 | 相關論文(來源:Nature Genetics)
該研究開發出一款高效的RNA可變剪接遺傳調控位點(splicing QTL,簡稱sQTL)定位新方法,繪制出迄今為止最全面的可變剪接遺傳調控圖譜,并據此鑒定出100多個與帕金森病、阿爾茨海默病等腦部疾病相關的新易感基因。
1 在DNA變化和疾病的對應關系中發現了GWAS
科學研究進行到今天,基因、DNA已經成為大眾耳熟能詳的名詞。已知人類的身高、容貌、個性以及對某一類疾病的易感性等,都是由大量的、效應微小的DNA片段的變化造成,這就是遺傳變異。
那為什么有的人對疾病易感,而有的人不易感?答案就藏在每個人的基因組里,因為我們的基因組存在差異;這些差異發生在基因組的哪些位點,又對應了人體的哪些生老病死?西湖大學楊劍實驗室一直致力于用統計學的方法,在浩如煙海的數據中尋找人體遺傳的秘密,進而找到“對癥下藥”的方法。近日,他們又取得了重要進展。
為了尋找這些DNA變化與人類疾病之間的對應關系,一種被廣泛用于檢測遺傳變異與表型之間關聯的實驗設計——全基因組關聯分析(GWAS)應運而生。它利用統計學方法尋找與疾病相關聯的遺傳因素,進而揭示與疾病發生、發展相關的基因組變異位點。
作為這一領域的佼佼者,楊劍團隊此前提出了一系列統計遺傳學分析方法,成為全基因組關聯分析領域的主流方法,并鑒定出大量與精神分裂等疾病易感關聯的基因組變異位點(簡稱“疾病易感位點”)。
但在研究過程中,他們產生了新的困惑。
識別功能基因和其他大腦相關表型變異,可提高基因組風險預測。該研究表明,中度sGene-eGene重疊在前studies6是由于小n的重疊是一個函數,只有大約8%的sGenes。當n = 100時,這一比例增加到64%,n增加到1073人。
然而,即使對于重疊基因,底層sQTL和eQTL causalvariants可以不同。在這項研究中,楊劍團隊估計sQTLand eQTL因果變異共享(PP4 > 0.8)只有大約42%(= 3980/9389)的重疊基因。這42%甚至可能估計過高,因為有限的權力的COLOC PP4統計在區分密切聯系和分享,特別是當n是不夠的。
來源:Nature Genetics
楊劍表示,我們通常認為,基因組變異對疾病易感性的影響是通過調控基因表達量實現的。但我們發現,有很大比例的疾病易感位點不能被這種機制所解釋,有時候一個基因組變異位點不影響任何基因的表達量,卻仍然對疾病易感性有顯著影響。
2“可變剪接”揭示疾病不同的易感性原因
他們進一步研究認為,其中一個重要原因或許是此前大多數研究只關注基因表達的“總量”,而忽略了“成分”,例如可變剪接造成的RNA成分變異。
什么是可變剪接?
生物學中心法則描述了遺傳信息的傳遞過程,即DNA——RNA——蛋白質。DNA先根據堿基互補配對原則合成前體信使RNA(pre-mRNA),再把pre-mRNA中,不編碼蛋白的部分“剪”掉,編碼蛋白的部分“接”到一起,形成“成熟信使RNA”,用于指導蛋白合成,從而完成基因表達。
但這種“剪”與“接”,并不是一成不變的。下面這張圖Pre-mRNA在不同的位置被剪接,會生成不同的形態,有的是三段蛋白編碼區組合在一起,有的是兩段組合在一起,類似我們兒時學過的“排列組合題”,因為不同的組合方式,導致結果不同,這個過程就稱之為“可變剪接”。
圖 | RNA可變剪接的遺傳調控(來源:Nature Genetics)
顧名思義,正是因為這種剪接“可變”,最終導致個體之間剪接產物的差異,進而產生對疾病不同的易感性。
順著這一思路,楊劍團隊經過大量的理論推導與計算模擬,開發出了一款高效的RNA可變剪接遺傳調控位點定位新方法,將其命名為THISTLE。他們將該方法應用于2865個人類腦組織的轉錄組和基因組數據的分析,成功鑒定出約200萬個遺傳變異位點與12794個基因的可變剪接事件關聯,進而繪制出迄今為止樣本量最大、剪接事件最全面的RNA可變剪接遺傳調控圖譜。
隨后,研究團隊將該圖譜映射到抑郁癥、精神分裂、帕金森氏癥、阿爾茲海默癥等大腦相關性狀和疾病的GWAS數據中,找到了100多個新易感基因。新鑒定出的疾病易感基因,不僅可以作為潛在藥物靶點,還可以作為生物標志物預測疾病風險。
圖 | 遺傳變異通過調控DGKZ基因的可變剪接影響精神分裂的易感性(來源:Nature Genetics)
3 為復雜疾病遺傳機制研究提供新方向
這項研究中,在人類大腦中產生了基因變異的綜合目錄與廣泛的可變剪接相關事件,并且展示了受益使用記錄和文件sQTL映射策略結合sQTL檢測。楊劍團隊證實了RNA可變剪接在疾病遺傳調控機制中發揮著獨特的重要作用,揭示了基因組變異通過對可變剪接的遺傳調控來影響疾病發生發展的普遍性,為研究人類復雜疾病的遺傳機制提供了新方向。
回望過去近三年的研究過程,西湖大學副研究員祁婷博士表示,他們遇到的最大挑戰是“方法創新”和“大數據分析”。
譬如,分析近3000個人類腦組織轉錄組和基因組數據是一個什么概念?每個人有上千萬條RNA序列數據、幾千萬個基因組變異位點、十幾萬個轉錄本、幾萬個基因,將這些數據排列組合,精準找到“發布指令”操控剪刀的位點,簡直猶如大海撈針……
而她和團隊開發的sQTL定位方法(THISTLE)和相應的計算機軟件擁有超高的靈敏度和運算速度,可以把這看似不可能的任務變為可能,并且該方法可用于不同物種、組織或細胞類型,未來的應用潛力巨大。
1、Ting Qi, Yang Wu, Hailing Fang, Futao Zhang, Shouye Liu, Jian Zeng & Jian Yang,Genetic control of RNA splicing and its distinct role in complex trait variation
https://www.nature.com/articles/s41588-022-01154-4
免責聲明:本公眾號發布內容部分信息來源網絡,本平臺不對文章信息或資料真實性、有效性、準確性及完整性承擔責任。文章僅供閱讀參考,不作任何投資建議,如有侵權請聯系刪除。