回首頁 > 產業趨勢

 
解開基因調控的「達文西密碼」 GTEx推動資料共享
   
[2017-12-06 ]

圖/基因線上公司授權使用

近代基礎生物科學研究蓬勃發展,從早期的分子生物學到蛋白質體學,已為人類醫療打下穩健的根基。而近幾年,核苷酸定序與分析技術的進步,科學家得以更深入的探究基因體學領域的知識。然而,體內每個細胞都帶有相同的DNA,卻在不同的器官有不一樣的表現,欲探索更深層的基因調控,美國成立了基因型組織表現(Genotype-Tissue Expression, GTEx)聯盟,推動GTEx計畫,期待透過了解基因型對基因表現量及組織特異性之間的關聯,了解疾病遺傳的易感性,本計畫利用表現數量性狀基因座(expression quantitative trait loci, eQTL)分析,建置不同個體的不同組織中,遺傳變異與基因表現之間的關聯性圖譜。利用資料的相互比對、分析,了解基因表現的分子調控機制。

 

基因表現調控複雜,猶如一座龐大的迷宮

人類有23對染色體(chromosome),每對染色體中,一條來自父親、一條來自母親。染色體上帶有的基因序列,是專屬於我們個人的遺傳密碼。人體的每個細胞(精子與卵子除外)都帶有相同的基因序列。然而,並非所有的基因都會被表現,即使帶有同樣的基因序列,在不同的組織器官中,不同的細胞會表現不一樣的基因,造就表現性狀的不同。從表觀遺傳學的角度來看,染色體及組蛋白(histone)上不同的修飾,會改變該段基因被表現的機率。DNA甲基化(methylation)會使染色體纏繞更緊密而失活,去甲基化(demethylation)則會使染色體纏繞鬆散被活化。組蛋白的乙醯化(acetylation)、去乙醯化(deacetylation)以及甲基化、去甲基化等修飾也會改變基因的表現,這是以不改變基因序列的前提下,改變遺傳表現的一種方式。然而,調控基因的表現模式十分複雜,即使到現在,仍有許多待解之謎。

 

修飾位置

修飾方式

 

DNA

甲基化(methylation)/ 去甲基化(demethylation)

 
 

組蛋白(Histone)

甲基化(methylation)/ 去甲基化(demethylation)

 

乙醯化(acetylation)/ 去乙醯化(deacetylation)

 

磷酸化(phosphorylation)

 

泛素化(Ubiquitination)

 
 

GTEx計畫創建線上資料庫  推動資源共享

2015年,GTEx 聯盟嘗試了一項研究,從237名死亡的捐贈者收集來自多個組織的基因表現數據,希望能解答單點基因的變異對基因表現量及組織特異性之間的關聯。目前此計畫共蒐集了來自449個捐贈者的7051個樣本。如此大型的計畫需要克服道德上、法律上及技術上的諸多困難,才能獲得如此大規模驗屍後的檢體。這些樣本應用後的研究結果不僅發表於國際期刊中,GTEx 聯盟還向科學界提供研究人類基因表現、基因調控及其與遺傳變異關係等資源,將資料公開於線上資料庫中,讓更多研究人員可以使用。此外,聯盟也提供最新的人類基因表現定量統計分析方法、建置資料分析中心與實驗室,收集並分析各種人體組織的DNA及RNA。本文精選四篇應用該數據庫的研究報告,一探基因表現調控的謎底。

 

eQTLs大型試驗可用來鑑定疾病與組織特異性調控

自從人類基因體完成定序以來,探討遺傳變異對組織基因表現量的影響一直都是一大挑戰。GTEx 聯盟於近日發表第二階段的研究成果,此次研究採用檢測expression quantitative trait loci (eQTLs)的方法,針對遺傳變異造成不同人體組織中基因表現的影響展開全面調查。

第一篇研究報告應用GTEx建置的資料庫,使用來自449個捐贈者的44個組織的基因型、基因表現、組織學及臨床資料等。研究組織特異性基因表現、以及各組織間基因表現量的遺傳關聯。數據顯示,人類基因組中幾乎所有基因的表現都受到遺傳變異的影響。大多數影響基因表現的變異點(variants),位於受影響基因的幾千個鹼基內,這種近端的影響被稱為順式eQTL(cis-eQTLs)。這些變異點通常位於一些特定的基因區域中,例如啟動子(promoter)、增強子(enhancer)以及抑制子(repressor)等,藉由改變這個基因的調控位點來影響基因表現。另外,研究也辨認出了數百個反式eQTL(trans-eQTLs),這種變異屬於遠端影響,其影響表現的基因位於較遠的區域,甚至在不同的染色體上。這種變異點通常編碼為轉錄因子(transcription factors)或微小RNA(small RNAs),因此能夠影響兩套染色體上的基因表現。

研究也發現,順式eQTLs傾向於改變大多數組織中的基因表現,在收集的44種組織中,皆有發現順式eQTLs的存在。相反的,反式eQTL往往具有組織特異性,僅在其中18種組織中有偵測到它的存在。許多變異的測試在先前被發現與複雜性疾病有關,這次試驗證明了大型eQTL研究對於用來鑑定受疾病相關遺傳變異影響的基因和途徑是可行的,能用來鑑定與人類疾病表型相關的組織特異性調控。

 

Expression quantitative trait loci(eQTLs) 

在生物體的遺傳性狀中,有些是由多個基因同時調控的,這些性狀稱為數量性狀(quantitative trait),而控制數量性狀的基因,則稱作數量性狀基因座(quantitative trait loci, QTL)。將QTL的概念套用在mRNA上,會影響mRNA表現量的基因就稱為, Expression quantitative trait loci(eQTLs)。透過標準QTL定位(standard QTL mapping)方法,使用軟體測試基因表現變化與遺傳多樣性的關聯,即可定位eQTLs。

 

結合全基因分析可辨認罕見變異點對基因表現的影響

第二篇研究,則將分析應用在罕見變異對基因表現的影響。每個人的基因,都有數以萬計的罕見性遺傳變異,科學家預期這些變異與個體的患病風險有關。雖然遺傳關聯研究已經證實常見的遺傳變異與疾病的易感性有關,但這對於罕見變異的了解並無太大幫助。目前已可利用遺傳密碼(genetic code)分辨出蛋白質等位基因中(protein-coding alleles),罕見的致病遺傳變異。然而,對於非編碼區(non-coding region)的罕見變異研究相對較少,且在臨床背景和疾病研究中往往會被忽略,因此確定位於非編碼區的罕見變異是否具有致病性,則是此篇研究的重點。

研究使用GTEx資料庫的v6p版本,結合全基因分析及多組織的RNA序列資料比對,發現58%的低度表現和28%的過度表現異常值,其附近具有保守的罕見變異點,而正常表現的基因只有8%附近出現保守的罕見變異點。另外也發現罕見的結構型變異、偏移的插入或缺失、編碼區的變異以及位於轉錄起始點附近的變異等,對基因表現的改變有最明顯的影響。

作者提出了一種綜合來自同一個體的DNA序列和基因表現數據的統計方法,稱為RIVER(RNA-informed variant effect on regulation),為一種貝葉斯統計模型(Bayesian statistical model),可以合併表現數據,用來預測罕見變異點對基因的調控,比起單獨用基因組模型推算具有更高的精準度。最重要的是,此篇研究確定了這些罕見變異對基因表現的重要性,而這套新開發的統計方法最終可應用在預測個體基因組中,哪些DNA變體會使細胞改變進而導致疾病的產生,提供了研究罕見變異點與疾病易感性之關聯更全面的方法。

 

基因表現情況 附近出現罕見變異點的比例
正常表現 8%
過度表現 28%
低度表現 58%


資料庫結合其他實驗數據,成功應用於X染色體失活及RNA編輯等研究 

GTEx聯盟建置的線上資料庫讓許多研究單位受益不少。後續列舉的兩篇研究報告,皆是使用GTEx的資料庫,再結合其他實驗研究數據進行綜合分析所得的結果。

第三篇研究借助GTEx聯盟釋放的v6p版本,系統性的探討哺乳類動物X染色體失活(X chromosome inactivation, XCI)。XCI是透過沉默雌性哺乳動物細胞中的X染色體之一的轉錄,借以平衡XX雌性和XY雄性之間的基因表現量。然而,X染色體失活在人體中其實是不完全的:高達三分之一的X染色體基因會分別從雌性細胞中的活性和非活性X染色體表現,至於失活不完全的情況,在基因及個體間是有程度上的差異存在的。

本篇研究整合超過來自449個個體29種組織的5500個轉錄組(transcriptomes)、940個單細胞的轉錄組以及基因序列數據,結果發現在人體中發生X染色體失活不完全是十分常見的情形。不完全的X 染色體失活會造成下列影響:

  1. 影響了至少23%的X染色體基因表現。
  2. 會使基因表現產生性別偏差。
  3. 且可能是促使基因表現型多元化的機制之一。

利用大規模的資料庫結合實驗數據分析,能對人體X染色體失活的程度與影響有更多的了解。

 

第四篇研究應用GTEx資料庫中的8,551個人體樣本,配合數百個靈長類和老鼠的樣本,分析腺苷至肌苷的RNA編輯(Adenosine-to-inosine RNA editing, A-to-I), A-to-I RNA編輯是由ADAR酵素調控的轉錄後修飾,通過改變RNA分子中特定核苷酸來使轉錄組多樣化。雖然有多個編輯位點已被發現,但是對於編輯程度最高的基因位點以及編輯作用在不同的生物環境中如何被調控等問題,都尚未完全了解。

此篇研究結果顯示非重複編碼區域中的RNA編輯量多於重複區域中的編輯量,另外也發現RNA編輯的主要差異是來自物種,而不是組織類型。利用GTEx資料數據分析也發現新的動態RNA編輯模式「AIMP2」,其可通過增強ADAR蛋白的降解來減少肌肉組織的RNA編輯量。此篇研究透過數據比對與分析,確立了更精確的A-to-I RNA編輯模式。

 

GTEx計畫的挑戰

隨著GTEx計畫的進展,資料庫日漸龐大,受惠的研究單位也日益增加,但是GTEx計畫仍存在一些困難與挑戰。雖然該聯盟確定了與基因表現差異相關的近100萬種遺傳變異,但大多數並不直接導致基因表現的差異,所以看不出因果關聯。因此除了資料庫本身的數據,勢必要搭配其他研究方法,如使用基因編輯技術CRISPR-Cas9來操縱遺傳變異的能力,並分析後續的基因表現變化等方式,才有機會確立遺傳變異的因果關係。另外,對於部分實驗來說,目前使用的冷凍組織樣本可能不是最佳選擇,未來相關研究也許要考慮使用幹細胞模型或體外培養的分化細胞來彌補冷凍樣本的不足。雖說如此,GTEx計畫仍舊提供研究單位一個十分有價值的資源,也促進了遺傳變異研究的發展。

 

 

參考資料:

  1. Human genomics: Cracking the regulatory code https://www.nature.com/nature/journal/v550/n7675/full/550190a.html
  2. Battle, A., Brown, C. D., Engelhardt, B. E., Montgomery, S. B., & GTEx Consortium. (2017). Genetic effects on gene expression across human tissues. Nature550(7675), 204-213.
  3. Li, X., Kim, Y., Tsang, E. K., Davis, J. R., Damani, F. N., Chiang, C., ... & Li, A. (2017). The impact of rare variation on gene expression across tissues. Nature550(7675), 239-243.
  4. Tukiainen, T., Villani, A. C., Yen, A., Rivas, M. A., Marshall, J. L., Satija, R., ... & Cummings, B. B. (2017). Landscape of X chromosome inactivation across human tissues. Nature550(7675), 244-248.
  5. Tan, M. H., Li, Q., Shanmugam, R., Piskol, R., Kohler, J., Young, A. N., ... & Gupte, A. (2017). Dynamic landscape and regulation of RNA editing in mammals. Nature550(7675), 249-254.

 





相關連結: http://twbiogroup.org