文章轉(zhuǎn)載自“安捷倫診斷與基因組學”公眾號
全外顯子組測序的應用場景越來越多,根據(jù)不同應用場景打造更適配的檢測產(chǎn)品,使之成為一種高效、便捷的測序方案。
從 2009 年至今,基于 SureSelect 液相雜交捕獲技術(shù),安捷倫持續(xù)推出更優(yōu)秀的 WES 檢測產(chǎn)品。SureSelect WES V8 即最新上市的產(chǎn)品體系,機器學習驅(qū)動的探針鋪設方式帶來了更優(yōu)異的數(shù)據(jù)表現(xiàn)和極高的設計占比。
區(qū)別于既往 V6/V7,V8 在核心版本之外,還包含 NCV/UTR/CNV Backbone/Mito 等版本,為什么需要這些不同的產(chǎn)品組合以及它們各自適應于什么樣的應用場景,則是本文的重點。
我們將從基因組結(jié)構(gòu)與功能(上篇)、應用案例(下篇)兩個維度進行闡述。
圖 1:安捷倫最新 SureSelect WES V8 產(chǎn)品家族
WES+NCV
NCV: Non-coding Clinical Variants
存在即合理,BUT,存在即有用嗎?
事實上,每個基因中都有編碼區(qū)與非編碼區(qū),非編碼區(qū)在對基因的表達調(diào)控中發(fā)揮重要作用,如啟動子,增強子,終止子等都位于該區(qū)域。所以,非編碼序列并非“垃圾 DNA”。
人類基因組中 98.5% 是非編碼序列,非編碼區(qū)雖然不編碼蛋白質(zhì),但對于遺傳信息表達是不可缺少的。
對遺傳病而言,近 90% 的易感變異位于基因組非編碼區(qū),其下游調(diào)控機制未知,亟需解析其分子調(diào)控機制,才能將基因組學的發(fā)現(xiàn)最終轉(zhuǎn)化為臨床藥物靶標。
人類基因組非編碼區(qū)的注釋和變異致病性的預測,及變異機制的解析,是當前遺傳學領(lǐng)域的研究熱點和難點。
2022 年 7 月,Genome Medicine 雜志發(fā)表了一篇《對基因組非編碼區(qū)發(fā)現(xiàn)的變異的臨床注釋建議》的文章,為改善罕見病的診斷,以及評估其他非編碼變體的致病性提供了更明確的指導。
在腫瘤的研究當中,non-coding somatic mutations 也非常重要,例如肝癌等多種腫瘤中的 TERT 啟動子、T 細胞急性淋巴細胞白血病中 TAL1 基因的增強子,結(jié)直腸腫瘤中 CTCF/cohesin-binding sites 等等。
非編碼基因組具有高突變率和重復性的特點,這就導致了較高的背景突變以及潛在的 mapping errors;因而,對于功能性非編碼區(qū)域的識別與特征分析,相比于編碼區(qū)的驅(qū)動突變,有著獨特的挑戰(zhàn)。
圖 2:基因結(jié)構(gòu)示意圖
相比于其他同類產(chǎn)品,安捷倫 SureSelect WES V8+NCV 產(chǎn)品,更好的覆蓋了 HGMD,ACMG,ClinVar 數(shù)據(jù)庫中的致病和可能致病的遺傳變異,為遺傳學家提供了更有力的研究復雜遺傳疾病的利器。
安捷倫 SureSelect WES V8+NCV 的覆蓋情況
WES+UTR
先來看看什么是 UTR?
UTR: 即 untranslated region,非翻譯區(qū),是 mRNA 分子兩端的非編碼片段。
當從 DNA 轉(zhuǎn)錄為成熟 mRNA 后,會從第一個 AUG (起始密碼子)開始翻譯產(chǎn)生蛋白,這即是我們熟悉的中心法則。
但是請注意,翻譯起始位點并不是從第一個外顯子最前端開始的,而是 5’ 端第一個 AUG,那么,在起始密碼子之前的序列就是 5’UTR exon (untranslated region)(即圖 2 中第三個條的深藍色部分);相應的,在 3’ 端的終止密碼子之后,也有一部分不翻譯的外顯子被稱為 3’UTR exon (即圖 2 中第三個條的后端綠色區(qū)域)。
簡單一個小題目,快速記憶:哪個區(qū)域參與基因組翻譯過程?
A:3’UTR exons
B:5’UTR exons
C:CDS exons
點擊下方空白處查看答案
正確答案:C
5’UTR 與 3’UTR,其長度是多少呢?
真核生物 5′ 非翻譯區(qū)的中位數(shù)長度一般約為 150 核苷酸(nt),但有些可長達數(shù)千堿基。有些病毒和細胞的基因有著非常長和結(jié)構(gòu)性的 5' 非翻譯區(qū),這可能會影響基因表達。平均而言,3′ 非翻譯區(qū)往往是 5′ 非翻譯區(qū)的兩倍長。
舉一個例子:
CDK4 基因,在乳腺癌中是非常重要的藥物靶點。它的第一個外顯子加上第二個外顯子的前半部分,都是 5'UTR Exon,從 exon2 中間位置的 ATG 才開始翻譯(圖 3 中紅色方框)。
圖 3:CDK4 基因的部分結(jié)構(gòu)示意圖
UTR 區(qū)域有許多調(diào)控元件, 例如,uORFs(upstream ORFs)、IRESs(Internal ribosome entry sites,內(nèi)部核糖體進入位點)、poly(A) 信號、miRNA 結(jié)合位點等。
5’UTR 主要功能包括:調(diào)控 mRNA 出細胞核,核糖體招募,調(diào)節(jié)翻譯起始、調(diào)節(jié) mRNA 穩(wěn)定性等等;
3'UTR 主要功能包括:調(diào)節(jié) mRNA 的穩(wěn)定性,調(diào)控 mRNA 的定位表達,調(diào)控 mRNA 的翻譯,通過結(jié)合多個 RNA 綁定蛋白來行使調(diào)控功能等等。
圖 4. 5’ and 3’UTR elements and how they are co-opted in cancer.
引自:Trends Cancer. 2019 April ; 5(4): 245–262. doi:10.1016/j.trecan.2019.02.011.
關(guān)于這些調(diào)控元件的生物學作用,例如在學習與記憶、神經(jīng)退行性疾病、惡性腫瘤等疾病中的作用,依然有很多待回答的科學問題。
對于真核 UTR 的結(jié)構(gòu)和功能開展廣泛和深入的研究,去闡明各類基因翻譯背后的精密調(diào)控機制,為針對更精細翻譯水平的新診療策略研究鋪平道路,是當前研究的重要問題。
安捷倫 SureSelect WES V8+UTR 的覆蓋情況和測序表現(xiàn)
WES+CNV backbone
CNV(Copy number variation,拷貝數(shù)變異)是人類遺傳病的一大重要原因,由基因組發(fā)生重排而導致。
與 CNV 變異相關(guān)的疾病示例
隨著測序技術(shù)的快速發(fā)展,被鑒定發(fā)現(xiàn)的 CNV 數(shù)量越來越多,已有超過數(shù)萬個 CNV 位點被記錄在 DGV 數(shù)據(jù)庫(Database of Genomic Variants)中,這些 CNV(主要為微缺失和微重復)所覆蓋的染色體范圍約占人類全基因組的 20% 以上。
CNV 在全基因組范圍內(nèi)都可能發(fā)生,如果僅針對外顯子區(qū)檢測會導致大量的疾病相關(guān) CNV 的漏檢。為了更全面的檢出 CNV,需專門添加可提高 CNV 檢出準確度的高密度 SNP 骨架。這樣一方面有利于提高檢測分辨率,另一方面可以覆蓋沒有基因編碼區(qū)的致病性區(qū)域。
安捷倫 OneSeq 可在一次經(jīng)濟有效的 NGS 分析中檢索所有的變異類型,快速發(fā)現(xiàn)疾病有關(guān)的新型變異,揭示疾病相關(guān)的生物學通路。安捷倫提供了兩套不同檢測分辨率的 SureSelect OneSeq CNV Backbones,分別可以實現(xiàn) 1 Mb CNV 檢測分辨率 和 300 kb CNV 檢測分辨率。
OneSeq CNV 骨架捕獲探針設計用于靶向具有最佳 GC 含量和可定位的基因組區(qū)域。這樣即可產(chǎn)生高度一致的測序深度分布,并最終獲得可靠的全基因組 CNV 檢測。
而且,OneSeq CNV 骨架捕獲探針可與任意 SureSelect 目錄外顯子組聯(lián)合使用,以進行 SNV、插入和缺失檢測。即使在 CNV 骨架捕獲探針存在的情況下,這些區(qū)域仍然具有極佳的覆蓋率,從而可確保檢測的準確性。
WES+Mito
線粒體是普遍存在于生物體細胞內(nèi)提供能量的細胞器,而且線粒體中含有遺傳信息,是一個獨立的遺傳體系。
線粒體 DNA 示意圖
人類線粒體基因組(Mitochondria DNA,mtDNA)的全長 16.6kb, 是一種雙鏈環(huán)狀 DNA,不具有內(nèi)含子 — 外顯子結(jié)構(gòu),僅含有 37 個基因。線粒體基因組具有獨特的特征,包括結(jié)構(gòu)簡單、編碼區(qū)域高度保守、母系遺傳、重組率低、拷貝數(shù)高、異質(zhì)性等。
部分線粒體疾病示例
每一個細胞中含有數(shù)百至數(shù)千個 mtNDA 拷貝。通常 mtDNA 具有異質(zhì)性,即同時存在突變以及野生型的 mtDNA,并且每個細胞、組織中的 mtDNA 的突變比例及拷貝數(shù)并不一致。
線粒體 DNA(mtDNA)突變,會導致多種線粒體遺傳病和線粒體功能異常,如帕金森綜合征、阿爾茲海默癥、糖尿病、腫瘤等。捕獲完整的線粒體基因組有利于對線粒體基因病的檢測與研究。
以 SureSelect WES V8 為核心,安捷倫提供了以上優(yōu)異的產(chǎn)品組合,并可實現(xiàn)個性化定制,滿足不同應用場景的基因組學研究項目。SureSelect WES 產(chǎn)品深度解析(下篇)將聚焦應用案例,展示 SureSelect 產(chǎn)品的廣泛應用。
以上內(nèi)容僅限研究使用。不可用于診斷目的。
友情提醒 |
本信息真實性未經(jīng)中國工程機械信息網(wǎng)證實,僅供您參考。未經(jīng)許可,請勿轉(zhuǎn)載。已經(jīng)本網(wǎng)授權(quán)使用的,應在授權(quán)范圍內(nèi)使用,并注明“來源:中國工程機械信息網(wǎng)”。 |
特別注意 |
本網(wǎng)部分文章轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。在本網(wǎng)論壇上發(fā)表言論者,文責自負,本網(wǎng)有權(quán)在網(wǎng)站內(nèi)轉(zhuǎn)載或引用,論壇的言論不代表本網(wǎng)觀點。本網(wǎng)所提供的信息,如需使用,請與原作者聯(lián)系,版權(quán)歸原作者所有。如果涉及版權(quán)需要同本網(wǎng)聯(lián)系的,請在15日內(nèi)進行。 |