知識的價值不在于占有,而在于使用。

生信自學網-速科生物-生物信息學數據庫挖掘視頻教程

當前位置: 主頁 > GEO >

單細胞測序數據整理PCA TSNE聚類得到marker基因

時間:2019-07-30 07:19來源:生信自學網 作者:樂偉 點擊:
前面我們給大家介紹了如何從GEO數據庫下載單細胞測序(scRNA)的數據,接下來,生信自學網給大家簡單重現一下數據整理以及后續的分析.
前面我們給大家介紹了如何從GEO數據庫下載單細胞測序(scRNA)的數據,接下來,生信自學網給大家簡單重現一下數據整理以及后續的分析:
1、把數據解壓,在excel里面簡單整理,就可以得到行名是基因名,列名是樣品名的矩陣,“PT089_P1_A01“中PT089代表樣品的名稱,P1_A01代表細胞編碼;

如果需要學習整個單細胞測序數據分析過程,可以學習生信自學網給大家準備的課程:
《單細胞測序數據分析視頻課程》
2、得到矩陣之后,我們需要對數據進行質控和數據過濾,在圖形左1里面,橫坐標代表樣品名,縱坐標基因的數目;左2圖橫坐標代表樣品,縱坐標代表測到所有基因的序列數目;左3代表線粒體數目,因為這組數據沒有相關數據,所以都是0。


3、主成分分析,每個點代表一個細胞,不同顏色代表不同的樣本;接下來我們可以做PCA的熱圖,跟每個PC相關的基因表達譜情況。
每根曲線代表一個PC,每一個PC可以理解為一部分基因的集合,前面得到的1500多個基因就得到20個PC,圖形里面每個PC后面有個P值,這里的P值是指實際PC里面的關鍵基因和理論PC可能存在基因的相似程度,P值越小,說明PC實際基因和理論相似程度高。



4、TSNE聚類分析
上一步選好了PC,接下來做TSNE聚類分析,在圖形里面,聚成了15類,也就是15個Cluster,然后可以得到每個樣品的細胞是屬于哪個Cluster。繪制Cluster的聚類熱圖,可以根據熱圖得到每個聚類的marker基因。


5、marker

如果需要學習整個單細胞測序數據分析過程,可以學習生信自學網給大家準備的課程:
《單細胞測序數據分析視頻課程》

責任編輯:樂偉
作者申明:本文版權屬于生信自學網(微信號:18520221056)未經授權,一律禁止轉載!
加生信自學網群
BioWolf二維碼生成器
頂一下
(1)
100%
踩一下
(0)
0%
------分隔線----------------------------
發表評論
請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
評價:
表情:
用戶名: 驗證碼:點擊我更換圖片
TCGA腫瘤微環境
推薦內容
單基因發文套路
m6A