知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > TCGA >

8705例腫瘤樣本可變剪切綜合分析【文獻解讀】

時間:2019-07-29 22:54來源:生信自學網 作者:樂偉 點擊:
Comprehensive Analysis of Alternative Splicing Across Tumors from 8,705 Patients,8705例腫瘤樣本選擇性剪切的綜合分析
Comprehensive Analysis of Alternative Splicing Across Tumors from 8,705 Patients
 入門學習TCGA數據庫可變剪切:
《可變剪切5分文章套路課程》

獲取文獻原文:
關注微信公眾號:biowolf_cn,回復“可變剪切”,即可下載文獻原文。

本文對來自8,705名患者的32個癌癥基因組圖譜的選擇性剪接進行了全面分析,通過重新分析RNA和全外顯子組測序數據來檢測可變剪接事件和腫瘤變異。與正常樣本相比,腫瘤的可變剪接事件多達30%。體細胞變體與可變剪接事件的關聯分析證實了SF3B1和U2AF1中變體的已知的反式關聯,并鑒定了額外的反式作用變體(例如,TADA1,PPP2R1A)。許多腫瘤有數千個在正常樣本中無法檢測到的可變剪接事件;平均而言,我們識別了約930個外顯子-外顯子結合點(“neojunctions”),這些在GTEx中一般是不能被發現的。從臨床蛋白質組腫瘤分析聯盟中的乳腺和卵巢樣本數據,本文驗證了每個腫瘤樣本中約1.7個新結合點和約0.6個單核苷酸變體衍生肽,這些也被用來預測主要的組織相容性復合物-1的結合劑(假定的新抗原)。
 

意義
免疫療法目前是治療癌癥患者的最有希望的方向。但并非所有癌癥都適合這種類型的方法。在免疫治療獲得益處的人群中,為靶向疫苗尋找合適的抗原是一個大的挑戰。腫瘤特異性剪接能夠發現一大類新的剪接相關的潛在新抗原,可能影響免疫反應,可用于免疫治療。
 
引言
對癌癥基因組的分析主要集中在體細胞非同義蛋白質突變的評估以及此類突變對基因表達,蛋白質功能和下游通路的潛在致病影響。TCGA收集的樣本及數據也專門用于支持此類分析。這些已開發的資源為腫瘤轉錄組的變化提供了極好的機會,但所受的關注較少。不過最近對選擇性剪接的分析證明可變剪接對多種癌癥類型具有預后價值,包括非小細胞肺癌,卵巢癌,乳腺癌,葡萄膜黑色素瘤和膠質母細胞瘤。
 
結果
結果1 完整的泛癌分析工作流程
本文設計了一個全面的工作流程去整合分析32種癌癥類型中8,705個供體的腫瘤的RNA和外顯子組測序數據,還包括670個匹配的正常樣品。所開發的方法主要可解決以下問題:
(1)識別腫瘤中導致剪接變異的潛在遺傳改變(右上)。
(2)全面分析腫瘤中可變剪接的定量和定性變化(右中)。
(3)確定剪接變異可用于免疫治療的程度(右下)。
如圖1所示:
 

這篇文獻用到了TCGA聯合GTEx數據庫的分析,如果需要學習GTEx數據庫聯合TCGA數據庫(解決TCGA癌旁少或沒有的問題):
《GETx數據庫聯合TCGA挖掘》

結果2 癌癥中選擇性剪接事件的景觀
 基于最近開發的構建剪接圖譜的方法,本文系統地量化了TCGA中剪接事件的變化。在所有癌癥類型中,作者發現了大量高信度的剪接事件,其通過至少20個reads證實。如下圖所示:

當與匹配的正常組織直接對比時,作者發現腫瘤樣本中的可變剪接事件比正常樣本中更多。這種差異在肺腺癌中尤其明顯,作者觀察到腫瘤樣本中外顯子跳躍事件增加超過30%。如下圖所示:

然后,作者利用標準降維技術可視化整個數據中的剪接差異性。下圖表明選擇性剪接的組織特異性,以及癌癥類型特異性差異。在結腸癌,直腸癌,鱗狀細胞癌,肺鱗狀細胞癌,宮頸鱗狀細胞癌和頭頸部鱗狀細胞癌中,相似特征的癌緊密聚集在一起。

有趣的是,在乳腺癌患者中,可以根據外顯子跳躍剪接特征區分不同的癌癥亞型。Luminal 亞型緊密在一起,Basal亞型清晰的分開。對于腫瘤匹配的正常樣本,在幾乎所有情況下,它們都明顯地與相應的腫瘤分開,但這些觀察結果對基因表達計數不太明顯,如下圖所示:
 
結果3 體細胞反式關聯推動了剪接事件的變化
 然后,作者進行了關聯研究,將體細胞單核苷酸變異(SNV)位置與8255個供體的可變剪接變化聯系起來。作為表型,我們考慮了總共94749個外顯子跳躍,30755個替代5’和48365個替代3’事件。對于泛癌關聯研究,本文使用LIMIX中實施線性混合模型,校正群體,組織和批次效應。trans-sQTL基因包括具有已知剪接作用的SF3B1和U2AF1,但也有幾個候選因子對剪接的影響較小。如下圖所示:

另外,作者觀察到TADA1與SF3B1突變的目標有相似的3'可變剪接。TADA1與SF3B5相互作用,SF3B5本身與其他剪接因子相互作用(包括SF3B1),這可能暗示出一種可能的機制。如下圖所示:
 
結果4 腫瘤特異剪接圖譜
雖然之前已經描述了腫瘤和正常樣品之間的剪接的顯著差異,本文的分析策略能夠在大量不同的腫瘤類型和亞型上繪制出更完整的剪接景觀圖。前面部分中描述的觀察結果表明,大部分已鑒定的事件一般非常罕見,或者在多種癌癥類型中觀察到,但在個體組織中仍然很少見,這使差異分析復雜化。此外,組織特異性剪接使得對癌癥類型的腫瘤和正常樣品之間的顯著差異的評估混淆。
作者在936個基因中發現2570個離群事件,其中56個(6%)包含在COSMIC癌癥基因普查列表中。一個突出的例子是腫瘤抑制因子PTEN,其顯示在多種癌癥類型中第三個外顯子的反復跳躍,與樣本大小無關。盡管之前已經描述了PTEN在癌癥背景中的可選剪接,但迄今為止,外顯子3的跳躍主要與遺傳性疾病的易感性有關。另一個與剪接無關的例子是轉移抑制基因NDRG1。雖然在每種癌癥類型中只有極少數異常樣本存在,但32種癌癥中有14種顯示出至少一個顯著的離群點。如下圖所示:

除了罕見的異常值,本文還對腫瘤和正常腫瘤之間的剪接形式進行差異分析。作者檢查了大量的癌癥基因,這些基因在腫瘤類型中反復差異剪接。如下圖所示:

在最頂端的差異剪接基因中,我們發現癌癥普查基因的顯著富集。此外,我們還觀察到先前與癌癥進展相關的其他因素中的差異剪接??傊?,差異剪接基因的聯合排序為新假設的發展提供了豐富的資源。
 
結果5 癌癥中增加的剪接復雜性
除了剪接形式的差異以外,我們還對腫瘤樣本中外顯子-外顯子連接(EEJ)的識別感興趣,我們將這種特定于腫瘤的外顯子-外顯子連接稱為“neojunctions”。在該研究的所有樣本中,我們確定了251,000個這樣的新結,每個樣本平均為930個。盡管樣本量相似,但LUAD和UCEC通常具有比LUSC或前列腺癌更多的neojunctions。本文發現腫瘤和正常樣本之間的顯著區別,其中正常樣本的剪接水平顯著低于腫瘤樣本。如下圖所示:

為了回答哪些基因最常見于可能被用作診斷或治療標記的neojunctions的問題,作者得出了一個基于neojunctions的排名。其中,作者觀察到neojunctions在超過50%的特定腫瘤類型樣本中顯示RNA-seq支持,但在TCGA或GTEx的正常樣本中幾乎不存在。此外,本文發現癌癥類型的復發程度很高,但也觀察到組織特異性模式。如下圖所示:

癌癥類型之間存在很大差異,BLCA,UCEC,LUAD,BRCA和COAD中neojunctions的數量最多。
 
結果6 Neojunctions將導致潛在的新表位
由于TCGA樣本的蛋白質組學數據有限,本文將這項研究的范圍限制在63名乳腺癌和卵巢癌供體中?;诨颊咛禺愋约艚訄D譜,本文得到了外顯子-外顯子連接產生的所有多肽。這導致每個供體中平均得到539,925個外顯子-外顯子連接多肽。從這些多肽中,我們基于臨床蛋白質組學腫瘤分析聯盟(CPTAC)質譜(MS)數據確認和MHC-I結合親和力預測的流程提取了候選ASN列表,其中包含有關人類白細胞抗原(HLA)類型的信息。如下圖所示:

平均而言,我們發現0.6個SNV衍生的假定neoepitopes??偟膩碚f,我們發現至少有一個SNV衍生的假定neoepitopes,占所有考慮樣本的19/63(30%)。與其他研究相比,這些數字似乎相對較低。對于這兩種癌癥類型,我們發現了比SNV衍生的假定neoepitopes更多的ASN。如下圖所示:

我們使用RNA-seq數據來確定neojunctions的表達,作為neojunctions衍生的9聚體表達。類似地,我們使用基于RNA-seq的表達估計的產物和相應變體等位基因頻率作為SNV衍生的9聚體肽表達。為了比較,本文還提供平均外顯子片段RNA表達作為整體9-mer表達。 neojunctions的表達分布與SNV衍生和整體9-mer表達分布明顯不同。通常,新結合的9聚體顯示出比SNV衍生的9聚體略低的表達,如下圖所示:

SNV通常很少見,本文沒有觀察到任何復發的CPTAC證實的SNV衍生的假定新抗原。然而,作者確實發現研究中15個ASN在相同癌癥類型的幾個樣本中被觀察到,并且在這兩種癌癥類型中復發了5個ASN。

生信自學網精品課程推薦:
《可變剪切5分文章套路基于TCGA數據庫》
《單基因3-5挖掘套路基于TCGA數據庫》
《腫瘤微環境基于TCGA數據庫》
《腫瘤突變負荷TMB分析》



責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(1)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A