Itegrative Genomics Viewer (IGV)是由Broad研究院的研究人員開發的一款功能強大的綜合性基因組學可視化工具,借助于此工具,從事生物信息的科研工作者就可以輕松的分析查看多種基因組數據。除了直觀的查看序列信息及遺傳密碼中的序列變化或突變外,還可以查看拷貝數變化、染色質沉淀數據和表觀遺傳學修飾等。
云序生物課堂曾經介紹過基于免疫沉淀技術類型的項目(包括 MeRIP 測序、MeDIP 測序、ChIP 測序、ATAC 測序等)如何使用 IGV 軟件對抗體富集峰進行可視化展示。然而,有一些特殊類型的 RNA 或 DNA 修飾測序項目,因為實驗原理上的特殊性,使得在 IGV 軟件當中打開 .bam 文件后,看到的圖像很不一樣。
下面,我們就為大家介紹一下 m5C/5mC(Bis-seq)、2‘-O-甲基化修飾(Nm-seq)、m7G/m3C 修飾(AlkAniline-seq)這三種單堿基分辨率類項目的 IGV 可視化結果的查看方法。
軟件安裝以及需要用到的文件
首先,進入IGV的官方下載地址 ,選擇適合您電腦的版本進行下載和安裝。在云序生物的報告文件壓縮包當中,也包含了一個 Windows 版本的 IGV 軟件,您也可以直接解壓運行。**運行可能需要一段時間初始化IGV,請您耐心等待。
完成安裝并進入 IGV 軟件后,首先我們需要加載參考基因組。對于常見物種,您可以直接使用 IGV 官方自帶的參考基因組(例如下方截圖當中所示的人類基因組版本 hg19),操作如下:選擇菜單-Genomes-Select Hosted Genome。建議您勾選“Download Sequence“,以將基因組下載到本地電腦,方便以后使用。
如果您的測序物種比較特殊(例如,陸地棉 Gossypium hirsutum),或者測序的 RNA 類型比較特殊(例如 tRNA 測序),則會需要您事先下載好 .fa 格式的基因組文件,從本地電腦加載該參考基因組的文件(例如下圖所示的人類 hg19 版本的 tRNA)。操作如下:選擇菜單-Genomes-Load Genome from File。
在完成了參考基因組的加載后,接下來就需要加載測序結果分析所得的 .bam 文件。操作如下:選擇菜單-File-Load from File。您可以一次性選擇多個 .bam 文件打開。
需要注意的是,IGV 軟件所打開的本地文件時,需要同一文件夾下存在同名的 .bai 索引文件。云序生物已經在文件夾中為您提供了同名 .bai 索引文件,請您不要隨意改動名稱或移動位置,以免影響文件的正常打開。
m5C/5mC 修飾(Bis-seq)
RNA 的 m5C Bis-seq 以及DNA 的 5mC WGBS,其原理都是利用了重亞硫酸鹽(Bisulfite)這種化學試劑的特性,可以將未經修飾的胞嘧啶(C)轉變為尿嘧啶(U),進而在后續的測序當中被讀取為胸腺嘧啶(T);而倘若胞嘧啶上發生了 5 號位上的甲基化修飾(m5C/5mC),則重亞硫酸鹽將無法造成堿基改變,進而在后續的測序當中仍被讀取為胞嘧啶(C)。除了重亞硫酸鹽法以外,DNA 的 EM-seq 也使用一系列酶起到了類似的選擇性堿基轉化的作用??傊?,對于這一類 m5C/5mC 單堿基精度測序實驗而言,發生了 m5C/5mC 修飾的位點將在測序結果當中以一定的比例呈現為 C。
例如上面這幅例圖當中,展現了人類 hg19 參考基因組上 19 號染色體 40,873,633-40,873,672 的 m5C Bis-seq 覆蓋度(Coverage)的情況。我們可以看到:
對于大部分參考基因組上的 A、T、G位點,表示其覆蓋度的柱狀圖都是灰色的,表示測序結果與參考基因組上的堿基類型完全一致。例如圖中橙色方框所框住的位點,其參考基因組在此處是 G,而實際測序結果在此處也是 G。
對于大部分參考基因組上的 C 位點,表示其覆蓋度的柱狀圖是紅色的,這表示在該位點上實際測序測得的結果是 T。例如圖中綠色方框所框住的位點,其參考基因組在此處是 C,但因為重亞硫酸鹽的轉化,實際測序結果在此處則是 T。
對于少部分參考基因組上的 C 位點,表示其覆蓋度的柱狀圖是部分紅色+部分藍色的,這表示在該位點上實際測序測得的結果是部分 T + 部分 C,說明該位點上存在一定比例的 m5C 甲基化修飾現象。例如圖中藍色方框所框住的位點,其參考基因組在此處是 C,但因為該位點上實際存在一定比例的 m5C 修飾現象,加之重亞硫酸鹽的轉化,實際測序結果在此處則是 33 次 T(紅色)和 38 次 C(藍色)。
2‘-O-甲基化修飾(Nm-seq)
RNA 核糖上 2 號位上的羥基如果被氧甲基(-O-CH3)取代,就會形成2‘-O-甲基化修飾,又稱 Nm 修飾。在特殊化學試劑條件下,氧化-消除-脫磷酸循環(OED 循環)可以從 RNA 的 3’ 端逐個剪下單個核苷酸(1 nt);而如果 RNA 上的第 N 位存在 2‘-O-甲基化修飾,則 OED 循環反應將會有很大概率在第 N 位的 3’ 端停止下來,從而在后續的測序當中讀取到大量 3’ 端斷裂于第 N 位的測序 reads,呈現“斷崖狀”的特征。
例如上面這幅例圖當中,展現了人類 hg19 參考基因組上 tRNA-Gln-CTG-3-2 上第 55 位 C 的 2‘-O-甲基化修飾情況。該圖包含了同一個樣品的兩種不同處理方法后的測序結果:上方是 Input 樣品,即未經特殊化學試劑處理,直接建庫測序的結果;下方是 OED 化學試劑處理樣品,經過了多輪的 OED 循環后,再進行建庫測序的結果。對于每一種處理類型的樣品,柱狀圖表示該位點處的覆蓋度(Coverage),由于它們都與參考基因組完美匹配(沒有任何突變現象),因此都顯示為灰色的方柱;片段圖則表示了每一個測序 reads 的位置以及方向(用箭頭表示)。
我們可以看到,在上方例圖展示的區域范圍之內,Input 樣品的測序 reads 分布比較隨機,并沒有在某一位點出現集中的現象;而在 OED 樣品中,則在藍色方框所表示的第 55 位 C 的 3’ 端出現了紅色豎線所示的“斷崖式” reads 集中的現象——如果我們進行數量統計,會發現藍色方框中的 C 位點,存在 15 個測序 reads,其中多達 11 個測序 reads 的 3‘ 端就“斷”在此處,比例高達 73.33%,彰顯第 55 位 C 存在很大概率發生了 2‘-O-甲基化修飾。
m7G/m3C 修飾(AlkAniline-seq)
RNA 上的 m7G 或 m3C 修飾,可以通過一系列特殊的化學處理來探明,這種測序方法簡稱為 AlkAniline-seq。在一系列特殊化學試劑條件下,m7G 或 m3C首先會發生脫堿基反應,如果 RNA 上的第 N 位存在 m7G 或 m3C 修飾,隨后有很大概率在第 N+1 位的 5’ 端形成 RNA 鏈的斷裂,從而在后續的測序當中讀取到大量 5’ 端斷裂于第 N+1 位的測序 reads,呈現“斷崖狀”的特征。
例如上面這幅例圖當中,展現了小鼠 mm10 參考基因組上 chr6: 125101938 位 C 的 m3C修飾情況。該圖包含了同一個樣品的兩種不同處理方法后的測序結果:上方是 Input 樣品,即未經特殊化學試劑處理,直接建庫測序的結果;下方是 AlkAniline 化學試劑處理樣品進行建庫測序的結果。對于每一種處理類型的樣品,柱狀圖表示該位點處的覆蓋度(Coverage),由于它們都與參考基因組完美匹配(沒有任何突變現象),因此都顯示為灰色的方柱;片段圖則表示了每一個測序 reads 的位置以及方向(用箭頭表示)。
我們可以看到,在上方例圖展示的區域范圍之內,Input 樣品的測序 reads 分布比較隨機,并沒有在某一位點出現集中的現象;而在 AlkAniline 處理的樣品中,則在藍色方框所表示的chr6: 125101938 位 C的“N+1”位,也就 chr6: 125101939 位的 5’ 端出現了紅色豎線所示的“斷崖式” reads 集中的現象——如果我們進行數量統計,會發現chr6: 125101939 位上存在 15 個測序 reads,其中多達 14 個測序 reads 的 5‘ 端就“斷”在此處,比例高達 93.33%,彰顯其上游 chr6: 125101938 位用藍色方框所表示的 C 存在很大概率發生了 m3C 修飾。
相 關 產 品
m5C RNA甲基化測序
m6A RNA甲基化測序
m6Am RNA甲基化測序
m1A RNA甲基化測序
m7G (m3C)RNA 甲基化測序
2’-O-RNA氧化測序
ac4C乙?;瘻y序
o8G RNA氧化測序
比色法/LC-MS檢測整體m6A甲基化水平
RNA修飾相關酶PCR芯片
ChIP-seq
DNA 5mC 甲基化測序
往期回顧
上海云序生物科技有限公司
地址: 松江區莘磚公路518號18號2樓
網址: http://www.chanelbrand5.com
電話: 021-64878766
郵箱: market@cloud-seq.com.cn