您的位置 首页 kreess

淺析全外顯子測序文章套路

外顯子(expressed region)是真核生物基因的一部分。它在剪接(Splicing)後會被保存下來,並可在蛋白質生物合成過程中被表達為蛋白質。外顯子是最後出現在成

外顯子(expressed region)是真核生物基因的一部分。它在剪接(Splicing)後會被保存下來,並可在蛋白質生物合成過程中被表達為蛋白質。外顯子是最後出現在成熟RNA中的基因序列,又稱表達序列。近年來,全外顯子測序為進一步探究疾病相關的編碼區的基因組變異提供瞭重要工具。全外顯子組測序WES(Whole Exome Sequencing)是指利用序列捕獲或者靶向技術將全基因組外顯子區域 DNA 富集後再進行高通量測序的基因組分析方法。與全基因組重測序相比,全外顯子組測序隻需針對外顯子區域的基因序列測序,覆蓋度更深、數據準確性更高,更加簡便、經濟、高效。

全外顯子測序的技術路線如下所示:

圖片來源於文章“Agilent’s sureselect target enrichment systems: Bringing cost and process efficieny to next-generaition sequencing”

案例分析:

Using linkage studies combined with whole-exome sequencing to identify novel candidate genes for familial colorectal cancer

使用連鎖研究與全外顯子測序相結合,鑒定傢族性大腸癌的新候選基因

發表期刊:INTERNATIONAL JOURNAL OF CANCER (IF=5.829)

發表時間:2020年3月15日

網址:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7004061/pdf/IJC-146-1568.pdf

實驗材料:

從38個傢庭隊列中選擇18個多重和擴展傢庭,其中至少三個受影響的親戚具有非關聯的強CRC聚集,如圖1所示。

檢測平臺:

HiSeq2000 平臺和SureSelectXT Human All Exon V4 or V5 外顯子富集

研究背景:

結腸直腸癌(CRC)是一種復雜的疾病,大多數潛在的種系易感因素仍未確定。在這裡,我們將全外顯子組測序(WES)和連鎖分析結合在一起,對受CRC影響的多個親屬進行瞭鑒定,以鑒定出具有罕見變異的候選基因,這些變異具有潛在的高穿透力。

結果解讀:

1、 連鎖分析

使用來自18個多重和擴展傢族且無關聯的強CRC聚集的WES衍生基因型數據進行瞭全基因組范圍的非參數連鎖分析(圖1)。

圖1 在我們的研究中檢查瞭18個CRC多重和擴展傢族的譜系結構

另外,如圖2所示,在三個基因座上鑒定出最高的LOD最高得分:染色體1q22–q24.2(在rs10753668或180.122 cM處,LODlinear = 2.11和LODexp = 1.872);染色體7q31.2–q34(在rs2075371或142.05 cM處,LODlinear = 2.023和LODexp = 1.838);和染色體10q21.2–q23.1(在rs1904589或94.855 cM處LODlinear = 1.423和LODexp = 2.118)。

圖2 全基因組連鎖分析的結果

此外,當添加其他標記以精細映射每個區域並減少標記間的間隔時,在1q22–q24.2位點連鎖的證據增加到LODlinear = 2.383(p-value = 4.6E-04)和LODexp = 2.196(p-value = 7.3E-04),其中rs2134095為峰值標記(圖3a)。同樣,在7q31.2-q34位點連鎖的證據增加到LODlinear = 2.197(p = 7.3E−04)和LODexp = 2.149(p = 8.2E−04),其中rs6953296是峰標記(圖3b)。10q21.2–q23.1位點(LODlinear = 1.455,p-值= 0.005; LODexp = 2.195,p-值= 7.3E-03),而rs1904589仍作為峰值標記(圖3c)。

圖3 精細映射12位後,染色體1q22–q24.2(a),7q31.2–q34(b)和10q21.2–q23.1(c)上連鎖間隔和近端和遠端邊界之間的基因含量示意圖其他SNP

2、 基於傢族的關聯分析,分析特定連鎖間隔下的稀有變異

我們探索瞭具有較高外顯率效應的稀有等位基因的可能性,解釋瞭每個位點的連鎖峰。我們在連鎖峰間隔下從271個蛋白質編碼基因中的WES數據中提取瞭530個單核苷酸變異體(圖3)。

然後,我們使用GESE套件對89個稀有變體進行瞭基於傢族的分離測試。等位基因頻率加權分離分析顯示18個基因中有CRC的顯著罕見變體分離(表1)。

3、 CRC的新候選基因

使用蛋白質-蛋白質網絡分析(IPA)對具有CRC罕見病原體變異的傢族分離證據的基因進行進一步檢查,以從遺傳性CRC涉及的連鎖峰中找出最合理的候選基因。我們將來自GESE分析的18個具有分離變體的基因集中在一起,建立瞭遺傳性CRC的基因(38個基因)和癌癥的種系易感性(115個基因),以研究特定的CRC網絡。產生瞭六個網絡,其中兩個包含GESE基因。該程序導致保留瞭表2中列出的五個候選基因,並對其應用瞭進一步的排除標準。排除瞭在結腸組織中表達可忽略的候選基因(CDH23)。僅保留具有與癌癥易感性兼容的功能的基因。由於兩個基因參與瞭與癌癥無關的疾病(LMNA,肌營養不良;VCL,心肌病)或與腫瘤無關的基因功能(WDR91,神經元發育)。

4、 結論

我們使用來自18個多重和擴展傢族的WES衍生基因型數據進行瞭全基因組連鎖分析,這些傢族具有非關聯的強CRC聚合,並在1q22-q24.2、7q31.2-q34和10q21.2-q23染色體上發現瞭提示性風險位點。罕見的變體分離分析和蛋白質網絡分析確定SMO為種系CRC易感性的合理候選者。需要在其他隊列中進行復制(包括對具有遺傳性CRC的大量傢庭的靶向測序)和進一步的功能研究,以確認這種新的潛在的CRC生殖系易感性候選物。本方法可與來自具有幾個測序成員的傢族的NGS數據一起使用,以進一步鑒定涉及種系易感疾病的候選基因。

文案 / 熬過愚庸

整理排版 / 夏蟬

更多的醫學專業知識在公眾號“醫訊匯”等著你

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部