pathway 建立在ko 数据库的基础上,基于我们对生命活动中的分子相互作用和化学物质的反应的认识,构建了复杂的调控网络,采用通路图的形式,进行展示。
通路图中融合了ko, module, compound, reaction,disease, drug 等 数据库中的信息,所以必须先理解了上面的几个数据库,才能对pathway 有一个更直观的认识。
在pathway 数据库中,每条pathway 的标识符由2-4个字母的前缀加上5个数字构成,共有5种不同的前缀:
map
ko
ec
rn
org
5种前缀其实都是同一张通路图,只不过高亮显示的内容不同。
比如00020
, 代表TCA 循环的通路
map 代表reference pathway,map00020 如下
ko 是在reference pathway 的基础上,将所有的ko用蓝色高亮显示
ec 是在reference pathway 的基础上,将酶编号高亮显示
rn 是在reference pathway 的基础上,将reaction 高亮显示
在kegg 中,ko/ec/rn 是相互关联的概念,所有3者都采用了同样的高亮方式,用蓝色进行高亮
org 代表的是organisam 数据库中物种的代码,比如human 对应的是hsa ,
hsa00020
对应的通路图如下
由于KO是跨物种的概念,所以每个pathway 会对应有多个物种。
从human的通路图中,我们也可以看出来,只有部分方框用绿色高亮显示。这部分绿色高亮像是的其实就是在该物种的基因对应的ko;
其实在每条记录的页面有下拉菜单,可以方面的查看同一张通路在map , ko, ec, rn , org 的不同版本
http://www.kegg.jp/kegg-bin/show\_pathway?org\_name=obr&mapno=00020&mapscale=&show\_description=show
pathway 通路图包含了非常多的信息,我们想要看懂一张通路图,必须理解图中的元素都代表什么东西。在通路图中,官方提供的图例如下:
结合hsa00020
来理解一下,在一张通路图中,有三种基本对象:
矩形代表KO
圆角矩形代表的是另外的通路图
圆形代表的是化学物质
箭头代表他们之间的相互作用关系,对于蛋白互作,基因表达模式的关联,酶的相互作用,在箭头上又有不同的修饰符来表示不同的类型。
通路图中主要包含了以下两种关系:
基因之间的相互作用关系,现在有一种分析叫做通路图重构,其实就是从中提取出基因的相互作用网络,会重构通路图,然后基于该互作网络进一步挖掘信息;
通路之间的相互关系,对应的有分析通路间的相互关系网络,从而筛选出核心的通路;
pathway的分类信息在brite 数据库种的链接为
从图中可以看到,pathway 数据库种包含了7大类别,我们常说的代谢通路只是我们用的最多,最大的一类。
总结
pathway 数据库中的每条记录有 map, ko, ec, rn,
5种前缀,map 是reference pathway , ko/ec/rn 分别将 ko , ec, rn 在 reference pathway 中用蓝色高亮显示; 代表不同的物种,在reference pathway 中,将该物种的基因对应的ko 进行了绿色的高亮显示。
在一张通路图中,矩形代表ko,圆角矩形代表两外一张通路;我们可以从pathway 中,挖掘出基因的相互作用网络和pathway的相互作用网络。
本文分享自微信公众号 - 生信修炼手册(shengxinxiulian)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。