知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > SEER >

SEER數據庫KM生存分析

時間:2017-08-15 07:25來源:原創 作者:Wolf老師 點擊:
SEER數據庫下載數據需要提交申請,需要簽名承諾書才可以獲取數據。下載數據也有幾種方法,比較常見的是用perl提取,和用SEER*Stat軟件選擇下載。
SEER數據庫使用,需要注冊一個賬號,然后按照數據庫后臺指示,需要對承諾書簽名,掃碼再給后臺發郵件,得到回復就可以獲得用戶名和密碼,有了用戶名和密碼就可下載數據和其他軟件。
seer數據庫
SEER數據庫的數據不想其他數據庫的數據,下載下來就可以直接進行分析,下載的數據需要選擇性處理,才能得到我們需要的數據。
幫助文檔
提取時我們一般用到的是perl腳本,當然在提取之前,需要準備幾個選擇的文件,也就是我們需要選擇的癌癥類型,需要下載數據的字段,比如需要分析黑人的癌癥,選擇性別和生存時間,生存狀態,都是需要選擇對應的字段,當然數據庫后臺會提供一個說明的pdf文件,這個文件很大,包括了seer數據庫所有癌癥類型及所有的字段,這個文件對seer數據庫分析非常有用,在分析過程中會經常用到。
perl腳本
提取到需要的數據文件,我們就可以使用R軟件,用survival包做生存曲線分析,比較簡單的就是離散字段的生存曲線,比如性別,有男性和女性。有些是連續數據的字段,比如說分析生存期與年齡的關系,時間是個連續的,我們就需要分幾個階段,比如<60,60<x<70,70<x<80,大于80,這樣分析也可以得到生存曲線。
生存曲線
連續變量生存曲線
生存曲線


責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(2)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A