生信论文的套路
ONCOMINE从全景、亚型两个维度做表达差异分析;
临床标本从蛋白水平确认(或HPA数据库),很重要;
Kaplan-Meier Plotter从临床意义的角度阐明其重要性;
cBio-portal数据库做基因组学的分析(机制一);
STRING互作和GO/KEGG分析探讨可能的信号通路(机制二);
TISIDB/TIMER分析肿瘤免疫特征(机制三)。
KM plotter数据库是进行生存分析最权威的网站,数据最全,尤其在乳腺癌、卵巢癌、肺癌和胃癌,包括肝癌的研究中,具有极大的优势。尽管,象GEPIA数据库和UALCAN数据库也可以对生存率做分析,但是资料的全面性和权威性上,还稍差一些。在已发表的论文中,生存分析的数据多来自KM Plotter数据库。
我们分享如何通过KM plotter数据库,直接获得生存曲线。我们以FTH1基因为例,分析FTH1对肾癌存活率的影响。
首先选择Pan-cancer RNA-seq;在gene symbol位置输入基因名称,FTH1;survival有OS和RFS,随访时间最长是240个月;数据库中只有两种肾癌的亚型,KIRC和KIRP;亚型分析包括,病理阶段stage,性别gender,种族race,分级grade,突变负担Mutation burden;细胞类型包括各种免疫细胞,可以先选择all。
然后,点击画图,draw Kaplan-Meier Plotter即可。
得出基因表达与KIRC的关系。
基因表达与KIRP的关系。
同样的道理,分析基因表达对肾癌亚型RFS的影响。根据结果,截图后在PPT中进行编辑,即获得用于论文发表的数据。
此外,km plotter数据库还可用于相关性的分析。
基因表达相关性分析和与肿瘤分期之间的相关性,是GEPIA数据库的特色,而km plotter数据库也提供了全面的相关性分析,主要是肿瘤类型、临床特征与生存率的相关性。肿瘤类型包括肿瘤分期、病理类型、分化等,临床特征包括性别、胃肠穿孔(perforation)有无(疾病专有特征)、治疗方式和HER2状态等。
依次选择,即可获得相应p值,病例数等信息,用三线表的形式在PPT中编辑,即可获得用于发表的图片。如性别gender处,female和male,可以查看基因差异表达在男性和女性肿瘤患者中,生存率是否有明显不同。其余分析,可以类推。
愿与果友一起学习,共同成长。
本文分享自微信公众号 - 芒果先生聊生信(from2019to2020)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。