首页 > 其他分享 >Phred质量分数

Phred质量分数

时间:2023-05-10 16:14:48浏览次数:31  
标签:Phred 分数 错误率 碱基 测序 质量

Phred质量分数是DNA测序数据中,用来评估碱基质量的一种标准化表示方法。它最初是由美国华盛顿大学的高通量测序专家Phred J.在1997年发表的论文中提出的。

Phred质量分数使用logarithmic scale(即对数刻度)来表示碱基质量值。一般取值范围为0-40之间,其中0表示最差的质量,40表示最好的质量。

具体而言,Phred质量分数Q的计算公式如下:Q = -10 * log10(P),其中P为当该碱基未被错误识别时,在该位置上读取到的碱基含量百分比。例如,假设一个碱基出现在100个reads中,其中有3个reads将其识别错误,那么P=97/100=0.97,Q=-10*log10(0.97)=0.177 ~ 18(向下取整)。

基于这样的计算方法,Phred质量分数越高表示错误率越低,也就是说,Q40的碱基错误率约为1/10,000,非常可靠;而Q20的碱基错误率已经达到了1%,甚至无法满足某些研究的精度要求。因此,在进行DNA测序分析时,可以利用Phred质量分数来筛选出高质量的碱基,以保证数据的可靠性。

 

标签:Phred,分数,错误率,碱基,测序,质量
From: https://www.cnblogs.com/wzbzk/p/17388275.html

相关文章

  • 万字长文详解如何使用Swift提高代码质量
    前言京喜APP最早在2019年引入了Swift,使用Swift完成了第一个订单模块的开发。之后一年多我们持续在团队/公司内部推广和普及Swift,目前Swift已经支撑了70%+以上的业务。通过使用Swift提高了团队内同学的开发效率,同时也带来了质量的提升,目前来自Swift的Crash的占比不到1%。在这过程......
  • 列出真分数序列
    列出真分数序列:按递增顺序依次列出所有分母为40.分子小于40的最简分数。解题思路:利用for循环遍历所有分子的可能,在for循环中利用辗转相除法求出最大公约数,若最大公约数为1则输出,否则继续循环。代码:#include<iostream>#include<iomanip>usingnamespacestd;intmain(){......
  • Power Quality Disturbance:基于MATLAB/Simulink的各种电能质量扰动仿真模型,包括配电线
    PowerQualityDisturbance:基于MATLAB/Simulink的各种电能质量扰动仿真模型,包括配电线路故障、感应电机启动、变压器励磁、单相/三相非线性负载等模型,可用于模拟各种电能质量扰动和分析研究。附带一份详细的说明文档对各模型进行说明,便于理解。仿真条件:MATLAB/SimulinkR2015bID:9......
  • 1211. 查询结果的质量和占比
    【题目】查询表Queries:+-------------+---------+|ColumnName|Type   |+-------------+---------+|query_name |varchar||result     |varchar||position   |int    ||rating     |int    |+-------------+---------+此表没有主......
  • Java保留有效小数与百分数
    Java保留有效小数与百分数1.有效小数/***保留有效小数*@paramtargetForm目标形式*@paramoriginNum初始数字*@return有效小数*/publicStringgetSignificantDecimal(StringtargetForm,StringoriginNum)......
  • 带分数(递归)//每日打卡 1
     #include<cstring>#include<cstdio>#include<iostream>#include<algorithm>usingnamespacestd;constintN=30;intsum,m;intnum[N];boolused[N];intcnt;intcalc(intl,intr)//分成三段每一段的值a,b,c分别算出{intres=0;for(int......
  • 放大招:三步搞定ChatGPT提示词,轻松写出高质量提问,最新经验分享
    在撰写ChatGPT提示语的时候,有一个基本的三层结构,经过在工作和生活上的实践,有助于解决大多数不同类型的任务。 尤其在你的问题有点复杂,想不清楚要怎么问比较好的时候,通过三层结构,让我们有结构的提出问题,并获得ChatGPT相对更有效的回答。 这三层结构的基础是: 目的优先输......
  • kaggle:Tweet Sentiment Extraction,提升分数的几种主要方法
    1.背景这次分享的是kaggle比赛TweetSentimentExtraction的第13名次的方法,作者主要用针对数据集进行前置处理或者是后置处理,具体原文:https://www.kaggle.com/c/tweet-sentiment-extraction/discussion/1595052.主要方法2.1RobertaModel这次比赛,大部分都是用了Roberta模型,其基础......
  • AcWing 1209. 带分数
    1-暴力解法思考1:暴力列举出1~9的全排列,之后再将这些数字按照一定规则相加,最后将结果与n比较。全排列好写,但相加的规则不好写,而且太暴力了,估计会超时。/*AcWing1209.带分数00.最暴力的写法1.枚举全排列2.枚举位数(枚举a和b,可算出c)3.直接算出n,判断等......
  • 代码大全-如何建立一个高质量的子程序
    不积硅步,无以至千里;不积小流,无以成江海。大型的项目是由一个个小模块构建而成。每一个小模块里面又包含着许多子程序。如果每一个子程序都能做到高质量,那么整个项目代码的质量必然很高。......