知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > GEO >

課程指南系列之GEO數據庫挖掘

時間:2019-08-08 15:38來源:生信自學網 作者:樂偉 點擊:
對于腫瘤分析當道的今天,非腫瘤分析的科研人員,如何做自己的生信分析呢?GEO數據無疑是一個最佳選擇,芯片量大,數據獲取簡單,分析方法成熟便捷,都是GEO持續火熱的理由。
對于腫瘤分析當道的今天,非腫瘤分析的科研人員,如何做自己的生信分析呢?GEO數據無疑是一個最佳選擇,芯片量大,數據獲取簡單,分析方法成熟便捷,都是GEO持續火熱的理由。
一、什么是GEO數據庫
GEO數據庫全稱GENE EXPRESSION OMNIBUS,是由美國國立生物技術信息中心NCBI創建并維護的基因表達數據庫。它創建于2000年,收錄了世界各國研究機構提交的高通量基因表達數據,也就是說只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個數據庫中找到。

二、GEO提供的數據類型
Series: 多個樣本連接成一個完整的研究數據集,并提供了整個研究的描述,包括對數據的描述,總結分析。目前共有96445個研究。
Platforms: 用戶提交給GEO數據中涉及到的芯片/測序平臺,目前GEO上包含了18300種平臺的數據。
Samples:用戶提交給GEO的樣本數據,目前平臺上共有2439709個樣本
DataSets: GEO工作人員根據用戶提交的數據整理后得到的數據集,類似于TCGA的level4數據,目前共有4348個。
Profiles:GEO工作人員根據用戶提交的數據整理后的數據,傾向于某個基因在不同數據集中的表單情況。
三、GEO與TCGA的區別
GEO主要包含各種芯片數據,也有少部分測序數據,與TCGA的差別在于TCGA只包含人的數據,而GEO是多物種的,GEO上有各種平臺的數據,而TCGA只有測序數據,芯片數據的數據量較小,而TCGA的測序數據數據量較大。
四、GEO課程購買導航
接下來,我們來看下如何選擇學習“生信自學網”關于GEO分析的課程
1、無任何基礎,可以先學習《GEO基礎入門課程》

2、希望在零基礎的課程上加深分析
可以學習《GEO基礎入門課程》《多芯片聯合RobustRankAggreg分析》《多芯片聯合Batch分析》
這里需要給大家說明一下兩個多芯片聯合分析的區別:RobustRankAggreg分析是把多個芯片先做差異,再用差異結果做RobustRankAggreg分析;Batch分析,是多個芯片做ID轉換之后,Batch成一個矩陣,再用組合的矩陣做差異分析。一般情況下,學習RobustRankAggreg分析,如果自己研究方向芯片比較少,可以考慮多芯片Batch分析。

3、不管是做基礎分析,還是多芯片聯合分析,都會得到差異基因,得到差異基因之后,我們就大有可為了,可以做GO、KEGG、PPI網絡等分析。這里推薦大家得到差異基因之后學習:
《GO富集分析》
《KEGG富集分析》
《蛋白互作網絡構建》
這三門課程作完,一個基本的分析套路就得到了,當然現在文獻還有做其他一些分析,大家可以根據參考文獻做后續一些分析。
當然如果有需要也可以做GSEA富集分析:《GSEA富集分析》

4、當然,不是所有的學員都是分析基因的,這里我們也給大家準備了其他分析的GEO課程
單細胞測序:《單細胞測序數據挖掘》(非常熱門的分析)
甲基化:《GEO甲基化分析》
LncRNA:《GEO數據庫長非編碼RNA芯片分析》
miRNA:《miRNA芯片數據挖掘文章套路》
環狀RNA:《環狀RNA芯片數據挖掘》
如果是做免疫相關的,還可以學習GEO芯片方面的免疫課程:
《GEO數據庫免疫細胞浸潤模式》
《甲基化免疫細胞浸潤模式》
免疫是當然最熱門的課題,如果做GEO免疫分析,選擇以上兩個課程是非常不錯的選擇

五、還有其他芯片數據庫嗎?
答案是肯定的,ArrayExpress數據庫,ArrayExpress與Geo數據庫類似,里面都存儲這大量芯片表達數據,對于數據庫挖掘的學員來說,ArrayExpress是一個不可或缺的數據庫。生信自學網應學員的要求,錄制了ArrayExpress數據庫挖掘的視頻。視頻主要從以下幾個方面錄制講解ArrayExpress數據庫的挖掘,首先,我們會講解如何從ArrayExpress數據庫下載數據,大家通過網頁和R包下載ArrayExpress數據。

信自學網針對三種不同的數據,采用三種不同的方法進行分析。A,對于下載數據已經包含探針矩陣的,我們利用平臺文件將探針矩陣轉換為基因矩陣。B,對于下載的數據是單個的表達文件,我們先將單個表達文件合并成探針矩陣,然后在轉換為基因矩陣。C,對于下載的數據是原始數據的,我們首先用R包將原始數據轉換為探針矩陣,然后在轉換為基因矩陣。
《ArrayExpress數據庫挖掘》
六、拓展分析
PCA :《PCA主成分分析》
WGCNA:《WGCNA分析》
小分子藥物:《小分子藥物分析》(用得到的上調下調差異基因做藥物分析)
編程:《R繪圖生信應用》
《perl編程生信應用》
以上就是小編個大家整理的GEO數據庫挖掘課程梳理,每個課程鏈接都有課程簡介,和試學視頻,如果大家對購買課程還有什么以為,可以聯系微信客服:18520221056。購買課程之后,提供資料、答疑、發票,請直接聯系微信客服,如果需要加群,加微信時備注“三群”,謝謝。




責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(1)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A