相关文章推荐
案例数据: > dat     ko_id                                Kegg_pathway Rich_factor       Pvalue DEGs1  ko00195               ...

Pathway富集结果常用气泡图来显示,其基本代码如下:

案例数据:

dat
     ko_id                                Kegg_pathway Rich_factor       Pvalue DEGs
1  ko00195                              Photosynthesis    3.543363 1.000000e-15    5
2  ko00196           Photosynthesis - antenna proteins    5.575221 1.500000e-10    6
3  ko03008           Ribosome biogenesis in eukaryotes    2.464696 4.920000e-06    7
4  ko00710 Carbon fixation in photosynthetic organisms    2.567654 4.510000e-05    9
5  ko01200                           Carbon metabolism    1.738592 7.350000e-05   11
6  ko03030                             DNA replication    2.453097 1.772599e-03   14
7  ko00030                   Pentose phosphate pathway    2.397575 1.772599e-03   12
8  ko00860        Porphyrin and chlorophyll metabolism    2.574238 1.772599e-03   14
9  ko00062                       Fatty acid elongation    2.857551 2.316650e-03   18
10 ko00630     Glyoxylate and dicarboxylate metabolism    2.129425 5.299956e-03   19
11 ko00230                           Purine metabolism    1.671398 5.299956e-03    4

绘图常利用geom_point几何对象函数实现气泡图绘制过程,同时实现坐标轴翻转

注意显著性大小-log10(Pvalue)映射到的点颜色上、差异基因数映射到点大小上。

kegg_point=ggplot(dat,aes(x=Kegg_pathway,y=Rich_factor))+
  geom_point(aes(color=-log10(Pvalue),size=DEGs),alpha=0.8)+
  coord_flip()+
  scale_color_gradient(low = "green",high = "red")
kegg_point


attachments-2018-09-cdsLNzoX5ba4968809525.jpg 不过需要注意的是在部分情况下,对应的DEGs数量较小,自动匹配的点的大小较小,在图片上难以显示明显,可以利用scale_size_continuous(range)参数控制,

kegg_point=kegg_point+scale_size_continuous(range=c(4,10))
kegg_point

size对应的range参数可以有效控制点大小的范围。

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接: 基因家族分析实操课程 基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接: 转录组(有参)结果解读 转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接: WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接: 转录组标准分析后的数据挖掘 转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读 OTU网络图绘制 cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课: linux系统使用 perl入门到精通 perl语言高级 R语言入门 R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章: TCGA-差异基因分析 GEO芯片数据挖掘 GEO芯片数据标准化 GSEA富集分析课程 TCGA临床数据生存分析 TCGA-转录因子分析 TCGA-ceRNA调控网络分析

8.其他, 二代测序转录组数据自主分析 NCBI数据上传 二代测序数据解读

 
推荐文章