知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > SEER >

SEER數據庫分析快速發文

時間:2017-08-19 15:27來源:原創 作者:森莘 點擊:
SEER數據庫包含大量的癌癥患者臨床信息,是生存分析,藥物研究的利器,使用好SEER數據庫,可以用最優思路得到一個好的科研報告。
前面的短文我們講解了SEER數據庫,官方提供的SEERStat軟件的下載與安裝,以及TCGA數據庫與SEER數據庫的區別,有了這些知識,接下來就到了大家最關系的問題,如果利用SEER數據庫下載和分析數據,下載的數據可以做哪些分析,現在論文都是怎樣一個分析思路?
帶著這些問題,給大家講解下主要的分析方法。
首先看下SEER數據庫經常用到的一些字段
SEER數據庫字段
當然我們比較關系的字段根據我們的分析是不同的,用的比較集中的包括癌癥發生部位,癌癥分期、分級、TNM分期,是否多原發,生存時間,生存狀態,是否癌癥死亡等等。
有了這些字段我們就可以做很多分析,最基本的生存分析,也就是論文最常出現的KM分析;然后是多因素COX分析,相比KM分析,COX有很多優點,KM沒有矯正其它因素的影響,如果需要確定到底某個因素是不是影響生存的獨立危險因素,就要用到像Cox這種多因素生存分析模型。
KM分析
接下來做的是卡方檢驗,卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。
競爭風險模型分析,可以計算多個終點時間,SEER數據庫是提供是否死于癌癥這個字段,那么死亡就有多個原因,可以分成兩類,一類是癌癥死亡,一類是其他非當前癌癥死亡。
競爭風險模型
多原發癌,這個是現在比較流行的分析,也是SEER數據分析的重頭戲,SEER數據庫可以提取到多原發的信息。
JoinPoint分析,數據庫提供一個軟件專門做數據的JoinPoint分析。

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(2)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A