🎨bulk RNAseq可视化

By Kaiyi

图表可以从分布、联系、比较、构成4个方面对图表进行分类和选择。

1、展示样本分布与关联

PCA

https://mp.weixin.qq.com/s/KmRdIBEFH6Tw-Gm7CMXZ_Q

相关性热图

甜甜圈图

2、展示差异基因分布

火山图

Fig4F. Multi-omic profiling reveals age-related immune dynamics in healthy adults

MA plot

MA-plot,即M-versus-A plot,也称为 Bland-Altman plot,主要应用在数据分布情况的可视化,比如突出显示差异表达基因和/或其他基因类别,例如管家基因、高可变基因。该图将数据转换为M(对数比)和A(平均值),然后绘制这些值来可视化两个样本中测量值之间的差异。M常对应差异表达分析获得的差异对比组之间基因表达变化log2FC。A对应实验组与对照组的平均标化表达量(mean normalized count),可以利用差异对比组的CPM、TPM、FPKM进行计算。当一个点的X轴数值很大,Y轴绝对值也很大的时候,就说明它是平均表达量高,组间差别还很大的基因。由于大部分Y轴绝对值大的点其实会集中在X轴数值居中的部位,所以大部分MA plot是沿X轴流线型或三角形的。

此外,MA plot可以直观展示数据测序质量。比如,如果大部分点的X轴数值都接近于0,说明基因表达量普遍偏低,可能测序深度不够,或者文库质量不好。另一方面,在RNA-seq数据的分析中,不仅需要进行标准化,还需要通过算法对数据进行降噪校正,去掉干扰信号。校正后的数据,其组间差异总体上应该较为平均地分布在Y=0两侧,也就是说,所有的点整体上看起来水平悬浮。但是,如果结果显示出这些点整体跑偏,中线严重偏离了Y=0,甚至形成了弧形,则说明校正方法可能不太适宜。

De novo gene synthesis by an antiviral reverse transcriptase. Fig1B

瀑布图(Waterfall plot / Rank plot)

METTL17 is an Fe-S cluster checkpoint for mitochondrial translation. Fig1B/D

散点图

3、展示单个或多个基因表达变化

热图(标记差异基因+行列注释)

The local microenvironment drives activation of neutrophils in human brain tumors. Fig3G

配对热图(展示基因或富集分数)

分组数据格式如上图。表达矩阵列为样本名,行为基因/细胞/通路名。

无监督聚类热图+各cluster富集分析

Fig3. Enteric bacterial infection stimulates remodelling of bile metabolites to promote intestinal homeostasis

基因表达趋势图

Identification of markers correlating with mitochondrial function in myocardial infarction by bioinformatics

箱线图/配对连线图

dumbbell chart

https://mp.weixin.qq.com/s/ps_3DhoCEtBOZyT6vGH8Ww

分组雷达图

雷达图(Radar Chart),又称蛛网图蜘蛛图,是一种图形化工具,用于显示多变量数据的对比。每个变量以等角度放射线(从中心向外延伸)表示,数据点在各变量轴上的位置表示各自的数值,最终形成一个闭合的多边形。其定义和特点如下:

1. 变量展示

各变量沿圆周均匀分布,通常从中心向外延伸,每个放射线代表一个维度或指标。放射线的数量和多边形的边数相同,数量取决于变量的多少。

2. 数值表示

每个数据点在其相应变量轴上的位置代表其数值大小,距离中心越远通常表示该变量的值越大(根据具体情况可调)。

3. 多维数据比较

雷达图适合用于比较不同组别的数据在多维度上的表现,例如同类产品在不同指标上的性能对比。通过将多个多边形重叠,可以直观展示不同组别在各维度上的差异。

4. 易于识别优势和劣势

图形中各边的长短及形状变化直观地展示了数据的强弱特点。图形的对称性和各变量轴上的延伸程度可以帮助快速识别数据的优势和劣势区域。

4、展示交集基因

韦恩图

成比例韦恩图

The local microenvironment drives activation of neutrophils in human brain tumors. Fig2B

花瓣图

散点图(多组学或多对样本)

The local microenvironment drives activation of neutrophils in human brain tumors. Fig2H

热图

5、ORA通路富集可视化

柱状图/条形图

流星图/彗星图

气泡图/多组气泡图

双向柱状图

棒棒糖图/火柴杆图

和弦图

富集环图

聚类热图+词云图

Small extracellular vesicles from young plasma reverse age-related functional declines by improving mitochondrial energy metabolism. Fig3D

6、GSEA通路富集可视化

GSEA图

峰峦图+气泡图

火柴杆图

分组柱状图

气泡图

Obesity reshapes regulatory T cells in the visceral adipose tissue by disrupting cellular cholesterol homeostasis. Fig1A

雷达图

用于展示不同分组/亚群的不同得分

热图

7、免疫浸润

1、箱线图

Y chromosome loss in cancer drives growth by evasion of adaptive immunity. Fig4A

使用MCP counter计算TCGA样本的免疫浸润分数,并进行统计检验。

Last updated