來源:測序中國 時間:2022-11-21
多年來,基因融合被認(rèn)為是重要的癌癥驅(qū)動事件,通常在腫瘤發(fā)生和進(jìn)展中發(fā)揮關(guān)鍵作用,也可作為治療靶點(diǎn)。大量的分析工具已經(jīng)開發(fā)并應(yīng)用于短讀長癌癥轉(zhuǎn)錄組測序數(shù)據(jù)進(jìn)行基因融合檢測。但從短reads中識別嵌合reads或不一致reads總是具有挑戰(zhàn)性的。
近年來,長讀長RNA測序技術(shù)的發(fā)展使全長轉(zhuǎn)錄本測序成為可能,在基因融合檢測中顯示出巨大的潛力。目前,用于長讀長基因融合檢測的工具只有JAFFAL和LongGF兩種,在檢測內(nèi)含子區(qū)發(fā)生的基因融合時,其性能受到限制。此外,基因融合的精確序列也仍然未知,限制了對基因融合的進(jìn)一步功能分析。
近日,美國阿拉巴馬大學(xué)伯明翰分校的研究團(tuán)隊(duì),提出了一個基因融合檢測工具FusionSeeker,可以準(zhǔn)確全面地識別長讀長癌癥轉(zhuǎn)錄組測序數(shù)據(jù)中的基因融合事件,并從原始reads中重建準(zhǔn)確的融合轉(zhuǎn)錄本。FusionSeeker是根據(jù)reads數(shù)量檢測基因融合調(diào)并進(jìn)行過濾,以去除由于測序錯誤和reads比對錯誤造成的噪聲信號。經(jīng)驗(yàn)證,FusionSeeker可識別外顯子和內(nèi)含子區(qū)域的基因融合,允許對癌癥轉(zhuǎn)錄組中的基因融合進(jìn)行全面表征。該研究結(jié)果發(fā)表Cancer Research上,文章題為“Gene fusion detection and characterization in long-read cancer transcriptome sequencing data with FusionSeeker”。
研究團(tuán)隊(duì)首先在模擬數(shù)據(jù)集上對FusionSeeker基因融合檢測的準(zhǔn)確性進(jìn)行了基準(zhǔn)測試,共隨機(jī)生成150個基因融合轉(zhuǎn)錄本,并分配到不同的表達(dá)水平。PacBio Iso-Seq-like和Nanopore-like reads用PBSIM和Badread(v0.2.0)模擬,然后對齊到參考基因組。FusionSeeker和長鏈基因融合檢測工具JAFFAL和LongGF用于從模擬reads中檢測基因融合。研究團(tuán)隊(duì)重復(fù)了三次模擬,F(xiàn)usionSeeker識別出的真陽性事件更多。同時,F(xiàn)usionSeeker的高召回率主要得益于其檢測內(nèi)含子區(qū)域基因融合的能力,其中FusionSeeker識別了94.67%的內(nèi)含子事件,JAFFAL和LongGF分別報告了14.67%和54.67%。總的來說,以上三種融合檢測工具在檢測高表達(dá)水平和中表達(dá)水平因融合時可獲得更高的召回率。FusionSeeker丟失的基因融合中,大約67%來自低表達(dá)水平組,丟失的原因是reads覆蓋率低。
圖1.FusionSeeker檢測過程。
為了生成高精度的轉(zhuǎn)錄本序列,F(xiàn)usionSeeker使用包含融合的reads執(zhí)行部分順序比對,為每個基因融合事件計算一致序列。在模擬數(shù)據(jù)集中,FusionSeeker重構(gòu)了超過99.5%的融合事件的全長轉(zhuǎn)錄本,使用Iso-Seq和Nanopore reads的平均序列識別率分別為99.87%和99.14%。表明FusionSeeker可以準(zhǔn)確地識別基因融合,并在模擬數(shù)據(jù)集中報告全長融合轉(zhuǎn)錄本序列。
接下來,研究團(tuán)隊(duì)利用人類基因組結(jié)構(gòu)變異聯(lián)盟(HGSVC)的非癌癥數(shù)據(jù)集評估了三種工具的錯誤發(fā)現(xiàn)率。在所有12個非癌癥樣本中,F(xiàn)usionSeeker報告的基因融合數(shù)量最少,表明在三種基因融合檢測工具中,F(xiàn)usionSeeker的錯誤發(fā)現(xiàn)率最低。研究團(tuán)隊(duì)還將FusionSeeker應(yīng)用于一個急性髓系白血?。ˋML)患者樣本分析,以證明其臨床實(shí)用性。最終FusionSeeker識別出了RUNX1和RUNX1T1之間的一個預(yù)驗(yàn)證基因融合,并報告了該患者樣本中另外7個可信的基因融合事件。
最后,該研究團(tuán)隊(duì)評估了由FusionSeeker生成的轉(zhuǎn)錄本序列。與原始reads相比,在MCF-7細(xì)胞系的Iso-Seq和Nanopore數(shù)據(jù)集中,FusionSeeker轉(zhuǎn)錄本序列與參考基因序列的一致性顯著提高(圖2)。在SKBR3的Iso-Seq數(shù)據(jù)集和HCT-116細(xì)胞系的Nanopore數(shù)據(jù)集中,F(xiàn)usionSeeker報告的轉(zhuǎn)錄本序列比原始reads更準(zhǔn)確。
圖2.FusionSeeker轉(zhuǎn)錄本序列與參考基因序列對比。
綜上所述,F(xiàn)usionSeeker可以檢測到外顯子和內(nèi)含子區(qū)域的基因融合。基于模擬和三個癌細(xì)胞系的數(shù)據(jù),該研究證明了FusionSeeker在檢測基因融合事件方面優(yōu)于現(xiàn)有方法。此外,研究團(tuán)隊(duì)通過正交和實(shí)驗(yàn)驗(yàn)證了許多僅由FusionSeeker檢測到的基因融合事件。這些新的基因融合可能對腫瘤的發(fā)生和進(jìn)展有重要意義,值得進(jìn)一步研究??傮w而言,F(xiàn)usionSeeker將使用戶能夠使用長讀長測序取數(shù)據(jù)準(zhǔn)確地發(fā)現(xiàn)基因融合,促進(jìn)下游功能分析,并改善癌癥的診斷和治療。
參考文獻(xiàn):
Yu Chen, Yiqing Wang, Weisheng Chen,et al. Gene fusion detection and characterization in long-read cancer transcriptome sequencing data with FusionSeeker. Cancer Res CAN-22-1628. 2022. https://doi.org/10.1158/0008-5472.CAN-22-1628
【來源:摘自測序中國】
聲明:轉(zhuǎn)載此文是出于傳遞更多信息之目的。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 郵箱地址:xlg@xhpr.net