知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > SEER >

競爭風險模型(Fine & Gray模型)-SEER數據庫生存分

時間:2019-07-31 09:24來源:生信自學網 作者:樂偉 點擊:
存在競爭風險的情況下,Kaplan-Meier的方法是不準確的,因為我們不能假定如果隨訪時間足夠長,受試者將會發生感興趣的事件。累積發生率(CIF)是給定事件發生的子分布,被廣泛應用
存在競爭風險的情況下,Kaplan-Meier的方法是不準確的,因為我們不能假定如果隨訪時間足夠長,受試者將會發生感興趣的事件。累積發生率(CIF)是給定事件發生的子分布,被廣泛應用于競爭風險分析。 Fine和Gray(1999)提出的分布的比例風險模型旨在擬合感興趣事件的累積發生率。關于Fine & Gray 模型,可以參考文獻:“A Proportional Hazards Model for the Subdistribution of a Competing Risk. Jason P. Fine and Robert J. Gray,Journal of the American Statistical AssociationVol. 94, No. 446 (Jun., 1999), pp. 496-509”.
研究治療方案A和白血病復發的關系,如果患者在去醫院復查的路上出車禍意外死亡了,就觀察不到白血病復發了,也就是說“車禍死亡” 和“復發”存在競爭。這樣的現象在醫學研究中,非常常見!
在分析某事件發生時間時,如果該事件被其他事件阻礙,即存在競爭風險。
例如這篇喝咖啡與低死亡風險的研究。Association of Coffee Consumption With Total and Cause-Specific Mortality Among Nonwhite Populations. Ann Intern Med, 2017. SCI IF=17.1

表4的結果表明排前10位的死因有心臟病、癌癥、慢性下呼吸道疾病、卒中等。根據趨勢性檢驗(P for trend)的結果,發現跟喝咖啡反向關系顯著的是心臟病、癌癥、慢性下呼吸道疾病、卒中、糖尿病和腎臟病原因導致的死亡。問題是死亡原因存在競爭關系,因為突發卒中死亡的人不太可能因為自殺再死一回。
本研究的作者在統計方法中寫了:考慮到競爭風險后分析咖啡和不同原因死亡的關系,其中不同的死亡原因被認為是不同的事件。
分析結果表明沒有發現考慮到死因之間的競爭風險影響結果(P=0.92)。相當于敏感性分析:做和不做競爭風險,得出的兩套結果對比一下,如果差異不大表明結果穩定。
如何實現競爭風險模型分析呢?SEER數據庫又如何做競爭風險模型呢?
首選我們需要從SEER數據庫下載癌癥臨床數據,一般可以使用perl提取,或者直接下載SEER*Stat軟件,在進行數據下載,當然下載數據之后,我們需要對數據進行清洗,常見的操作包括刪除數據未知的條目,如果需要也可以把SEER多原發的數據提取出來,發生多原發的條目給刪除。

然后找到我們常見的SEER字段,標注出來

找到死亡原因和生存狀態兩列,通過這兩列數據,我們把死亡原因分為三類——生存,死于癌癥,非癌癥死亡,這樣我們就可以做競爭風險模型。
接下來用R包做曲線繪制:

這樣的話,我們就把SEER數據庫的競爭風險模型構建出來了,如果需要詳細學習相關操作,可以購買生信課堂的課程:
SEER數據庫競爭風險模型
加入微信公眾號,獲取更多資訊

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(5)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A