KEGG pathway 数据库

Stella981
• 阅读 667

pathway 建立在ko 数据库的基础上,基于我们对生命活动中的分子相互作用和化学物质的反应的认识,构建了复杂的调控网络,采用通路图的形式,进行展示。

通路图中融合了ko, module, compound, reaction,disease, drug 等 数据库中的信息,所以必须先理解了上面的几个数据库,才能对pathway 有一个更直观的认识。

在pathway 数据库中,每条pathway 的标识符由2-4个字母的前缀加上5个数字构成,共有5种不同的前缀:

  1. map

  2. ko

  3. ec

  4. rn

  5. org

5种前缀其实都是同一张通路图,只不过高亮显示的内容不同。
比如00020, 代表TCA 循环的通路

map 代表reference pathway,map00020 如下

KEGG pathway 数据库

ko 是在reference pathway 的基础上,将所有的ko用蓝色高亮显示
ec 是在reference pathway 的基础上,将酶编号高亮显示
rn 是在reference pathway 的基础上,将reaction 高亮显示
在kegg 中,ko/ec/rn 是相互关联的概念,所有3者都采用了同样的高亮方式,用蓝色进行高亮

KEGG pathway 数据库

org 代表的是organisam 数据库中物种的代码,比如human 对应的是hsa , hsa00020 对应的通路图如下

KEGG pathway 数据库

由于KO是跨物种的概念,所以每个pathway 会对应有多个物种。

从human的通路图中,我们也可以看出来,只有部分方框用绿色高亮显示。这部分绿色高亮像是的其实就是在该物种的基因对应的ko;

其实在每条记录的页面有下拉菜单,可以方面的查看同一张通路在map , ko, ec, rn , org 的不同版本

http://www.kegg.jp/kegg-bin/show\_pathway?org\_name=obr&mapno=00020&mapscale=&show\_description=show
KEGG pathway 数据库

pathway 通路图包含了非常多的信息,我们想要看懂一张通路图,必须理解图中的元素都代表什么东西。在通路图中,官方提供的图例如下:

KEGG pathway 数据库
结合hsa00020 来理解一下,在一张通路图中,有三种基本对象:

  1. 矩形代表KO

  2. 圆角矩形代表的是另外的通路图

  3. 圆形代表的是化学物质

箭头代表他们之间的相互作用关系,对于蛋白互作,基因表达模式的关联,酶的相互作用,在箭头上又有不同的修饰符来表示不同的类型。

通路图中主要包含了以下两种关系:

  1. 基因之间的相互作用关系,现在有一种分析叫做通路图重构,其实就是从中提取出基因的相互作用网络,会重构通路图,然后基于该互作网络进一步挖掘信息;

  2. 通路之间的相互关系,对应的有分析通路间的相互关系网络,从而筛选出核心的通路;

pathway的分类信息在brite 数据库种的链接为

http://www.kegg.jp/kegg-bin/get\_htext?br08901.keg

KEGG pathway 数据库

从图中可以看到,pathway 数据库种包含了7大类别,我们常说的代谢通路只是我们用的最多,最大的一类。

总结

  1. pathway 数据库中的每条记录有 map, ko, ec, rn,

    5种前缀,map 是reference pathway , ko/ec/rn 分别将 ko , ec, rn 在 reference pathway 中用蓝色高亮显示; 代表不同的物种,在reference pathway 中,将该物种的基因对应的ko 进行了绿色的高亮显示。

  2. 在一张通路图中,矩形代表ko,圆角矩形代表两外一张通路;我们可以从pathway 中,挖掘出基因的相互作用网络和pathway的相互作用网络。

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
6个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
Python3:sqlalchemy对mysql数据库操作,非sql语句
Python3:sqlalchemy对mysql数据库操作,非sql语句python3authorlizmdatetime2018020110:00:00coding:utf8'''
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这