Page cover

🧬bulk RNAseq

By Kaiyi Fu

主要包含RNA测序数据下载与预处理、差异分析、富集分析(GO、KEGG、GSEA)等步骤。

R包加载

library(DESeq2) #差异分析
library(msigdbr) #GSEA
library(clusterProfiler) #GSEA
library(GseaVis) #GSEA
library(limma) #差异分析
library(ggplot2)
library(stringr)
library(tidyverse)
library(immunedeconv) #免疫浸润
library(GSVA) #ssGSEA
library(EnhancedVolcano)#火山图
library(ComplexHeatmap)
library(org.Mm.eg.db)
library(enrichplot)
library(RColorBrewer)
library(ggrepel)

一、测序数据的获取与预处理

GEO数据库的下载与处理

数据读入+基因去重

人鼠同源基因转换

二、数据清理

删除低表达基因

标准化

如后续使用DESeq2进行差异分析,可以跳过此步,用limma差异分析则需要此步log标化

去批次

三、PCA

四、差异分析

DESeq2差异分析(适用于rawcount)

获取差异基因

获取标化后的表达矩阵

limma差异分析

特殊情况:配对样本差异分析

五、差异基因展示

火山图

热图1:pheatmap

热图2:ComplexHeatmap

六、富集分析

KEGG富集分析

GO富集分析

GSEA富集分析

读懂GSEA富集曲线:

https://mp.weixin.qq.com/s/_zoBcLUQ3NKKfSKHld9HVA

GSEA需要两个文件,一个是基因列表(包括基因名及其logFC),另一个是基因通路gmt文件

GO_BP数据库

KEGG_BP数据库

HALLMARK数据库或自建基因集

GSEA画图

七、基因集打分

GSVA

IOBR包

八、免疫浸润分析

Last updated