Ⅰ WGCNA分析--提升轉錄組測序文章檔次的利器
現在做轉錄組測序,看看差異基因,做做富集分析,再討論下差異基因功能與自己研究性狀或處理之間的關系,最後加簡單的qPCR驗證,這樣的數據發SCI影響因子越來越低了。必須增加新的分析內容才能有所突破。今天給大家介紹一個能給文章增色的分析內容--基因共表達網路分析(WGCNA),該分析對樣品數有一定要求,建議不少於15個,不過現在測序便宜了,達到這個數量已經不是難事了。下面就給大家介紹兩篇利用WGCNA分析基因共表達網路來提升文章檔次。
文章1:
題目:
Identification of regulatory networks and hub genes controlling soybean seed set and size using RNA sequencing analysis
期刊: Journal of Experimental Botany
IF: 5.3
性狀: 大豆籽粒大小
實驗材料
大豆籽粒的大小是一個非常重要的農藝性狀,直接關繫到大豆產量,找到決定大豆籽粒大小的關鍵調控基因對後續的分子育種具有重要意義,因此作者,選取了兩個大豆品種做轉錄組分析,分別是:大籽粒Wandou 28 (V1),小籽粒Peixian Layanghuang (V2),取樣時期為三個時期:seed set (S1), seed growth (S2), and early seed maturation (S3),其中前兩個時期的取樣部位分別為:Seed pod with whole seed(S1),Whole seed(S2),S3時期取了兩個部位分別為:Seed coat(S3-1),Seed cotyledon(S3-2),兩個品種每個樣品三個生物學重復共24個樣品。下圖為種子發育不同時期照片以及籽粒大小差異統計結果:
轉錄組分析結果:
對轉錄組分析結果中每個基因做表達量分析,計算每個基因的表達量FPKM,如果基因的表達量,也就是FPKM值<0.5,認為基因無表達,去除這部分基因。然後,統計每個時期不同品種基因表達量高低的分布圖,大約一半的基因處於低表達水平0.5<=FPKM<=5(下圖A);pca分析發現樣品按照不同發育時期聚類在一起,而不是按照不同品種聚類,說明發育時期是決定基因表達譜的關鍵因素,而性狀的不同引起的轉錄表達差異較小(下圖B),下圖C展示的為不同品種,不同發育時期之間表達基因的韋恩圖,在不同的發育時期都表達的基因還是占絕大多數:
差異基因分析:
差異基因分析,下圖A按相同發育時期,不同的品種之間差異比較,下圖B為不同發育時期之間的差異比較,紅色數字代表上調差異基因數量,黑色代表下調的差異基因數量:
差異基因功能注釋分析,主要針對決定籽粒大小的差異基因的比較,也就是上圖A中的差異基因進行功能分析,挑出一些代表基因,看一下他的功能和表達量,例如,V1S1 vs V2S1差異比較當中,共找到973個差異基因,其中489個基因上調,484個基因下調,上調的代表基因的功能及表達量表格如下圖所示,其中有轉錄因子,植物荷爾蒙(生長素等),脂肪酸代謝,蛋白激酶活性,類黃酮生物合成等功能相關的基因,總之挑選與種子果實等發育生長相關的基因來展示,其他還有好幾個表格,也是關於上圖A中不同時期的上調下調基因的功能注釋表格,展示類似,我這里就不詳細說明了,感興趣的可以查看原文:
不同發育時期差異比較:
不同的發育時期差異基因比較,分別繪制每個發育時期高表達的基因的熱圖,差異基因很多,作者挑選的都是和發育相關,或者和重要農藝性狀相關的差異基因做熱圖,例如轉錄因子相關的基因,荷爾蒙相關的,脂肪酸代謝,澱粉糖代謝等相關的基因。
WGCNA分析找到調控籽粒大小的關鍵hub基因:
首先對所有樣品所有基因的表達量矩陣進行過濾,刪除表達量低的基因(FPKM<0.05),一共有7359個基因用於基因共表達網路構建,總共分析得到12個共表達基因模塊下圖A(聚類樹每一個枝代表一個基因,下面不同的顏色劃分代表基因所處不同的模塊),其中有4個模塊和種子大小相關下圖B,例如,lightyellow模塊,所有的V1的不同時期的樣品與這個模塊高度相關,再例如green模塊,有793個基因,不管是V1樣品,還是V2樣品,這個模塊都與S1相關等等。
4個關鍵模塊基因共表達網路構建發現hub基因:
導出WGCNA共表達網路分析結果,繪制模塊當中基因的表達量熱圖和網路圖,左邊熱圖從上到下分別代表:green mole(A),darkturquoise mole(C),black mole(E),lightyellow mole(G),右邊網路圖分別對應共表達網路,其中紅顏色標記的為連通性較高的hub基因。通過研究這些hub基因的功能發現:這些網路中的關鍵hub基因,包括MYB家族轉錄因子,荷爾蒙(ABA,CK,BA)響應因子,細胞色素P450,BR信號激酶等等,都可能與籽粒的大小相關。
文章2:
題目:
Global transcriptome and co-expression network analyses reveal cultivar-specific molecular signatures associated with seed development and seed size/weight determination in chickpea analysis
期刊: The Plant Journal
IF: 5.7
性狀: 鷹嘴豆籽粒大小
實驗材料與方法
這篇文章與上一篇文章思路幾乎一致,只是研究的物種變成了鷹嘴豆。同樣的,也是選取了兩個籽粒大小差異明顯的栽培品種:Himchana 1 (small-seeded) and JGK 3 (large-seeded),取樣時期為每個樣品7個時期S1-S7,分別為授粉後5, 9, 12, 19, 25, 30 and 40 天(day after pollination DAP),還測了一下葉片的轉錄組,並取3個生物學重復,共48個樣品。不同發育時期和種子重量差異結果如下:
轉錄組測序結果:
利用轉錄組測序所有基因以及所有樣品的表達矩陣做樣品間的相關性分析和PCA聚類分析,從中可以發現,相同的發育狀態或者組織聚類在一起,說明他們之間具有較強的相關性。
差異基因比較分析:
作者主要比較了相同發育狀態不同品種之間的轉錄組差異比較,差異基因的上下調數量和其中轉錄因子的數量圖a,另外還統計差異基因中不同類型轉錄因子的數量展示圖b,圖c為不同時期差異基因的富集結果,顏色越深說明在該功能上越富集,最後S3時期差異基因在mapman中的Metabolic pathways做了富集分析,可以將差異基因的表達量變化情況展示在通路圖中。
基因共表達網路分析
首先作者將不同的樣品按籽粒大小不同品種分開,分別用WGCNA做共表達網路分析,其中在Himchana 1樣品中共找到27個模塊(a),在JGK 3樣品中找到21個模塊(b)如下圖所示:
模塊與樣品之間相關性分析,從而發現不同發育時期的特有的基因模塊,這部分也是分開做,圖中顏色越紅的方框對應的模塊和樣品具有較高的相關性,左邊一半為Himchana 1中模塊與發育時期相關圖,右邊一半為JGK3模塊與發育時期相關結果,然後得到每個樣品中每個時期對應的最相關的模塊,(如下圖):
結合上一步的分析結果,再來分析兩個品種各自得到的模塊之間的相關性,理論上講,雖然品種不同但是各自品種相同發育時期的對應的特有模塊應該具有較高的相關性,例如,在JGK 3樣品中左下角黑色模塊與S6發育時期相關,通過相關性分析,這個模塊與Himchana 1中的darkorange相關,正好呢darkorange模塊在Himchana 1 中也與S6相關(下圖中紅紫色方框);同樣的道理其他很多模塊都有這樣的相關性(下圖中紅色方框),但是在Himchana 1 中有個orange模塊不與JGK 3中任何一個模塊相關,作者推斷這個特殊的模塊很可能與籽粒大小相關,當然還有其他幾個模塊也有類似的現象。作者進一步研究這些模塊中基因表達情況發現裡面很多基因的表達量(在S3 和 S5時期)在不同的品種中具有相反的表達,之後作者進一步研究這些模塊裡面基因的相關功能等等:
總結:
上述兩篇文章都是植物當中普通的轉錄組文章,由於添加了WGCNA分析從另一個角度分析與性狀相關的基因,文章的檔次提升不少。想得到WGCNA的分析技能嗎,點擊《 WGCNA視頻教學視頻 》即可觀看:手把手教學包你學會。
更多生物信息課程:
1. 文章越來越難發?是你沒發現新思路,基因家族分析發2-4分文章簡單快速,學習鏈接: 基因家族分析實操課程 、 基因家族文獻思路解讀
2. 轉錄組數據理解不深入?圖表看不懂?點擊鏈接學習深入解讀數據結果文件,學習鏈接: 轉錄組(有參)結果解讀 ; 轉錄組(無參)結果解讀
3. 轉錄組數據深入挖掘技能-WGCNA,提升你的文章檔次,學習鏈接: WGCNA-加權基因共表達網路分析
4. 轉錄組數據怎麼挖掘?學習鏈接: 轉錄組標准分析後的數據挖掘 、 轉錄組文獻解讀
5. 微生物16S/ITS/18S分析原理及結果解讀 、 OTU網路圖繪制 、 cytoscape與網路圖繪制課程
6. 生物信息入門到精通必修基礎課,學習鏈接: linux系統使用 、 perl入門到精通 、 perl語言高級 、 R語言畫圖
7. 醫學相關數據挖掘課程,不用做實驗也能發文章,學習鏈接: TCGA-差異基因分析 、 GEO晶元數據挖掘 、 GSEA富集分析課程 、 TCGA臨床數據生存分析 、 TCGA-轉錄因子分析 、 TCGA-ceRNA調控網路分析
8.其他課程鏈接: 二代測序轉錄組數據自主分析 、 NCBI數據上傳 、 二代測序數據解讀 。