知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > ICGC >

差異分析生存分析熱圖繪制基于ICGC數據庫

時間:2019-07-30 11:33來源:生信自學網 作者:樂偉 點擊:
在這里,做差異用到的limma R包,大家對這個包應該非常熟悉了,只是還沒用來做ICGC數據的差異。

得到ICGC表達矩陣之后,我們就可以做后面的差異分析了
在這里,做差異用到的limma R包,大家對這個包應該非常熟悉了,只是還沒用來做ICGC數據的差異。
1、下面我們來看下做差異的代碼:

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("limma", version = "3.8")

library("limma")

setwd("C:\\Users\\lexb4\\Desktop\\ICGCexp\\04.diff")              #設置工作目錄
inputFile="sampleExp.txt"                                         #輸入文件
fdrFilter=0.05                                                    #fdr臨界值
logFCfilter=2                                                     #logFC臨界值
conNum=202                                                        #normal組樣品數目
treatNum=240                                                      #tumor組樣品數目

#讀取輸入文件
outTab=data.frame()
grade=c(rep(1,conNum),rep(2,treatNum))
rt=read.table(inputFile,sep="\t",header=T,check.names=F)
rt=as.matrix(rt)
rownames(rt)=rt[,1]
exp=rt[,2:ncol(rt)]
dimnames=list(rownames(exp),colnames(exp))
data=matrix(as.numeric(as.matrix(exp)),nrow=nrow(exp),dimnames=dimnames)
data=avereps(data)
data=data[rowMeans(data)>0.5,]
更多原創代碼請聯系生信自學網微信:18520221056
關注微信公眾號“biowolf_cn"

然后我們就得到了差異結果,在下面的結果表格中,第一列就是基因名稱,conMean基因在正常組表達量的均值,treatMean基因在癌癥表達了的均值;logFC大家應該非常熟悉,就是log2的腫瘤組比正常組,如果logFC大于零,說明該基因在腫瘤組是上調的;pValue統計檢驗的P值,fdr叫做后的P值。

2、接下來可以繪制一下熱圖,熱圖用到的輸入文件就是我們做差異得到的diffGeneExp.txt,用到的包是pheatmap:

install.packages("pheatmap")

setwd("C:\\Users\\lexb4\\Desktop\\ICGCexp\\05.pheatmap")      #設置工作目錄
rt=read.table("diffGeneExp.txt",sep="\t",header=T,row.names=1,check.names=F)
rt=log2(rt+0.001)
library(pheatmap)
Type=c(rep("con",202),rep("treat",243))    #修改對照和處理組樣品數目
names(Type)=colnames(rt)
Type=as.data.frame(Type)
獲取生信自學網原創代碼,可以直接購買課程


3、生存分析
前面我們提到ICGC數據庫部分癌癥提供臨床數據,那么我們可以用下載的臨床數據,結合做差異得到的表達數據,整合成做生存的文件:

有了這樣一個含有基因表達、生存時間、生存狀態的表格,我們就可以做生存分析,生存分析用到的是survival R包,而且是批量做生存曲線,并且得到了每個基因的生存曲線P值,方便大家分析:

install.packages("survival")

setwd("C:\\Users\\lexb4\\Desktop\\ICGCexp\\07.survival")    #工作目錄(需修改)
library(survival)
pFilter=0.05                                                #由于圖形太多,只對p小于0.05的基因繪圖
rt=read.table("survivalInput.txt",header=T,sep="\t",check.names=F)    #讀取輸入文件
rt$futime=rt$futime/365                                     #如果以月為單位,除以30;以年為單位,除以365
outTab=data.frame()



購買《ICGC數據庫挖掘》課程



責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(2)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A