高通量测序样本量要求(高通量测序什么是FASTQ格式)

什么是FASTQ格式


FASTQ格式是一种文本形式的格式,主要用于保存核酸序列和测序质量。序列和质量都用ASCII编码来表示,是目前的高通量测序结果的标准。


FASTQ格式一般有四行:


  1. 序列编号和描述信息,用@开头

  2. 序列,包括ATGC和N

  3. 以加号开头,是序列标示和描述

  4. 质量信息,与第二行的序列对应

什么是质量评分:


质量评分是一个碱基错误概率的对数值,质量得分和错误概率关系在下列表中:


Phred 质量分数

碱基错误概率

序列准确性

10

1 in 10

90 %

20

1 in 100

99 %

30

1 in 1000

99.9 %

40

1 in 10000

99.99 %


比如我们常说的Q30,就是指的质量分数在30分以上,就是序列准确性在99.9%以上的碱基在测序数据中的比例。

之前我们分享了SAM格式,回顾:生信必会的SAM格式,该怎么看?如果文章对你有所帮助,请转发给你身边需要的人噢!
你可能还想看:

如何用Pathview画出高大上的基因与代谢通路热图?

高通量测序样本量要求(高通量测序什么是FASTQ格式)(1)

使用PAML计算选择压力

高通量测序样本量要求(高通量测序什么是FASTQ格式)(2)

测序数据到手后,如何高效的进行质量统计?

高通量测序样本量要求(高通量测序什么是FASTQ格式)(3)

用DOGMA对叶绿体或线粒体基因组进行注释

高通量测序样本量要求(高通量测序什么是FASTQ格式)(4)

对物种祖先形态进行重建,专业级的Mesquite也太好用了

高通量测序样本量要求(高通量测序什么是FASTQ格式)(5)

如何使用CAMERA对代谢物加和峰进行注释

高通量测序样本量要求(高通量测序什么是FASTQ格式)(6)

关注我Get更多科研小工具!!!
,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页