VCF和GVCF格式说明

Wesley13
• 阅读 746

注意:本文的内容主要来自于GATK官网的讲解,所以vcf也是GATK产生的,用其他caller,比如varscan2产生的vcf文件的内容注释可能不一致。

参考:https://gatkforums.broadinstitute.org/gatk/discussion/1268/what-is-a-vcf-and-how-should-i-interpret-it 

VCF:由HEADER和RECORDS组成。

VCF和GVCF格式说明

RECORDS的FORMAT内容详解:

QUAL:指的是caller正确的识别该变异位点的可能性,属于phred-scale quality score的一个应用。

GT,GQ,PL三者的关系:

GT是指该位点最有可能的基因型。

GQ是该位点第二有可能的基因型的PL值。

PL是不同基因型对应的标准化的可能性。

对于二倍体生物来说,PL有三个值,分别对应0/0,0/1,1/1。最有可能的基因型的PL值为0,第二小的是第二个可能。GQ反映的是第二个小的基因型的PL值,如果该值超过99,则定位99,因为超过了99,其几乎不能威胁第一个可能的地位。

计算方法:

PL(0/1) = 0 (the normalized value that corresponds to a likelihood of 1.0) as is always the case for the assigned allele,

but the next PL is PL(1/1) = 26 (which corresponds to 10^(-2.6), or 0.0025).

QUAL和GQ的区别:

VCF和GVCF格式说明

VCF和GVCF格式说明

GVCF和VCF的最大区别是在于GVCF文件会记录所有的点,包括哪些没有突变的点。

在GVCF模式下,那些没有变异的点会形成一个未变异块,non-var block record。

GVCF的好处:能更方便把一群样本的GVCF联合起来,以便进行下一步分析,提高分析效率。而且GVCF的records还会提供一个

The records in a gVCF include an accurate estimation of how confident we are in the determination that the sites are homozygous-reference or not. This estimation is generated by the HaplotypeCaller's built-in reference model

点赞
收藏
评论区
推荐文章
Python进阶者 Python进阶者
2年前
手把手教会你JavaScript引擎如何执行JavaScript代码
JavaScript在运行过程中与其他语言有所不一样,如果不理解JavaScript的词法环境、执行上下文等内容,很容易会在开发过程中产生Bug,比如this指向和预期不一致、某个变量不知道为什么被改了,等等。所以今天我们就来聊一聊JavaScript代码的运行过程。大家都知道,JavaScript代码是需要在JavaScript引擎中运行
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
DevOpSec DevOpSec
1年前
限制linux用户访问特定目录-centos沙箱环境
背景研发需求:1.研发想查看线上服务日志2.研发要看线上部署代码是否正确3.研发想看业务运行时产生数据是否正确运维需求:1.运维不想让研发有太多权限2.只有产看某些特定目录的权限和产看日志问题:研发具有太多权限后,对线上风险影响较大,比如研发误操作删文件跑
Stella981 Stella981
3年前
FinaShell工具 xshell替代的ssh工具
FinaShell介绍主要特性:FinaShell介绍FinalShell是一体化的的服务器,网络管理软件,不仅是ssh客户端,还是功能强大的开发,运维工具,充分满足开发,运维需求.官网http://www.hostbuf.com/(https://www.oschina.net/ac
Stella981 Stella981
3年前
Django之Django模板
1、问:html页面从数据库中读出DateTimeField字段时,显示的时间格式和数据库中存放的格式不一致,比如数据库字段内容为2012082616:00:00,但是页面显示的却是Aug.26,2012,4p.m.答:为了页面和数据库中显示一致,需要在页面格式化时间,需要添加<td{{dayrecord.p\_time|date:
Easter79 Easter79
3年前
SpringCloud(第 049 篇)Netflix Eureka 源码深入剖析(上)
SpringCloud(第049篇)NetflixEureka源码深入剖析(上)一、大致介绍1、鉴于一些朋友的提问并提议讲解下eureka的源码分析,由此应运而产生的本章节的内容;2、所以我站在自我的理解角度试着整理了这篇
Stella981 Stella981
3年前
Android蓝牙连接汽车OBD设备
//设备连接public class BluetoothConnect implements Runnable {    private static final UUID CONNECT_UUID  UUID.fromString("0000110100001000800000805F9B34FB");
Wesley13 Wesley13
3年前
MySql的基操勿六
2018/12/6星期四19:34:07authotbydabaine数据库注释;这就是注释/...../这也是注释创建库;createdatabseifnotexistsdabainecharact
初识DevOps
基本概念和延伸的思考DevOps,是Development(开发)和Operations(运维)组成的复合词,一般译为“开发运维一体化”。看到这个概念,首先会产生几个问题:开发是什么,哪些环节是开发?运维是什么,哪些环节是运维?开发人员写好代码在本地调试,环境出问题了自己来调整,这是开发工作还是运维工作?系统故障后,运维人员发现是配置文件内容出错了就改成了正
侃网络 侃网络
3个月前
OSPF产生的LSA格式(三)
OSPF产生的LSA格式