测序

时间:2024-03-26 11:55:22编辑:奇事君

一些测序的基本概念

基础不牢地动山摇~ 趁着放假整理一些常看常忘的知识点 正义链 :DNA上携带有编码蛋白质氨基酸信息的核苷酸序列的链称为正义链; 反义链 :mRNA转录时结合的那条链称之为模板链,即碱基互补配对的那条链。 非模板链 = 编码链(coding strand)= 正义链(sense strand) 模板链 = 非编码链(noncoding strand) = 反义链(nonsense strand) 对于一个参考基因组,一条链被指定为 正链 forward ,那么另一条就是 负链 reverse 。这种定义是十分硬核的,并没有什么生物学意义。 RNA 包括: ①反转录合成cDNA:磁珠富集mRNA(具有polyA尾巴)→mRNA随机打断→以mRMA为模板合成第一条cDNA链和第二条cDNA链 形成油包水液滴(Gel Beads、单个细胞、酶的混合物) 简单来说就是通过poly-dT与随机引物与mRNA 3‘端的poly(A)尾结合,反转录生成cDNA。合成的cDNA的3‘端通过ccc结合Barcode,与普通转录组基本一致。

测序的一些基本小知识

PE :两端测序(Pair-end sequencing),对于Paried-end reads,一般是不会测通的(就是说不会有重合的部 分),比如300bp的插入片段(insert size),两端各测100bp,中间的100bp没有被测到,也就是说对于这个 300bp的插入片段,测序得到的一对reads只有200bp信息,中间的100bp是gap。 Unigene :对转录组进行组装,得到尽可能长的非冗余的序列。我们把最终序列称之为Unigene,每一个Unigene代表一段转录组序列。对组装后的Unigene的数量、长度、GC含量等进行统计,这些统计量反映了组装的质量。Unigene长度通常是反映组装质量的指标之一。对样本的每个Unigene预测ORF(open reading frame),如果一个Unigene预测有多个ORF,则取最长的ORF。把每个Unigene的可读框翻译成氨基酸序列,并且统计读框中每个片段的起始位点,终止位点,长度和GC含。 de novo 测序(从头测序) :是指在没有任何参考基因组序列时对植物基因组进行测序和组装。 全基因组重测序 :全基因组重测序是对基因组序列已知物种的个体进行基因组测序,并在个体或群体水平进行差异性分析的方法。基于全基因组重测序技术,我们能够快速的进行种子资源普查筛选,寻找到大量基因变异,并实现遗传进化分析及重要性状候选基因预测。而随着测序成本降低和已知基因组序列的物种增多,重测序已成为动植物育种研究中最为迅速有效的方法之一。 1M reads指100万条reads。

测序小知识之名词解释

1、Read depth Read深度:一个样本测序得到的reads数;容易和基因组测序的覆盖度 (多少基因组区域被测到了)和测序深度混淆 (单个核苷酸被测到的次数或所有核苷酸被测到的平均深度)。

2、Short-read 短读长:测序得到的长度最大是500 bp的reads,常见的测序片段长度为100-300 bp;本文中的短读长测序片段代表测到的mRNA片段和降解了的mRNA。

3、Long-read 长读长:测序得到的超过1000 bp的reads,本文中代表全长或近乎全长的mRNA。

4、Direct RNA sequencing (dRNA-seq): 直接测序RNA而非cDNA的测序技术,通常用于测序全长或近全长的mRNA 。

5、Multi-mapped reads 多重比对的reads:从转录组同源区域测序得到的reads,不能精确确认其转录本或基因组的来源。

6、Synthetic long reads 合成long reads:通过组装多个短读长得到长读长的方法。

7、唯一分子标识符(UMIs):在扩增前,构建RNA-seq文库的时候加入的短序列或barcodes,理想情况下每条转录本结合一个唯一的标识符,含有此标识符的reads都来源于此转录本,定量时只计算一次。可以用来降低RNA-seq的定量偏好性,在RNA起始量低的单细胞实验中尤为适用。

8、Read length 读长:单个测序reads的长度,short-read RNA测序得到的长度通常是50-150 bp。

9、Sensitivity 敏感性:样本中多大比例的转录本会被测到,敏感性越高,这一比例越高。它受样本处理、文库制备、测序和计算偏好性的影响。

10、Specificity 特异性:度量差异表达转录本被正确鉴定出的比例的方法,它受样本处理,文库制备,测序和计算偏好性的影响。

11、Duplication rates 重复Reads比率:比对到转录组相同位置的的测序reads的比例。在RNA-seq文库中,一些转录本可能有高的重复率,因为它们在样本中表达水平高。高表达的基因的重复率很高,而低表达基因的或许有着最小的重复率。由此RNA-seq面临着一个挑战,该技术中大部分重复可能是高表达转录本带来的真实信号,而另一些则是由于扩增和测序偏好性造成的。

12、Single-end sequencing 单端测序 (SE):只测序cDNA片段的一端,因其费用低,常用于只关注差异基因表达的项目中。(NGS基础 - 高通量测序原理)

13、Paired-end sequencing 双端测序 (PE):cDNA片段两端分别测序,可以测序到cDNA的更多碱基,更好的识别剪接位点,常于差异基因表达分析项目。

14、生物学重复:对生物来源不同的样本的多次检测,比如来自三个个体的组织,用于捕获生物个体自身的变化;这个变化要么是待研究的对象,要么是噪音。相较之下,技术重复是对同样的样本做重复的操作—比如,对一个组织做三次处理。

15、Expression matrix 表达矩阵:差异表达RNA-seq项目的核心数据文件。每一行代表一个RNA,比如基因或者转录本。每一列是一个测序的样本。矩阵中的数值是每个RNA的reads数。这些可能是对转录异构体的计数估计,并通常在后续的分析前先进行标准化转化。

16、Spike-in control 内参:按特定浓度添加到样品中的外源核酸库。它们通常是预先合成的不同浓度的RNA,用于监测反应效率和技术方法的偏差和假阴性结果。

17、Spatialomics 空间转录组学:能保留给定样本(通常是组织切片)中每个转录本的空间信息的转录组分析方法。

18、Nascent RNA 新生RNA:刚刚转录出来的RNA,与已经加工并运输到细胞质的RNA相对应。

19、Translatome 翻译组:细胞、组织或生物体中正在翻译成蛋白质的mRNA集合。

20、Structurome 结构组:细胞、组织或生物体中RNA的二级和三级结构集合。

21、Interactome 互作组:细胞、组织和生物体中分子相互作用的集合,包括有RNA-RNA或者RNA-蛋白质的相互作用。

22、Differential gene expression (DGE) 差异基因:两个实验组中表达显著变化的基因


二代测序名词解释

二代测序(NGS),又称为高通量测序,是低成本、高准确度、一次可对多个样本的几十万甚至几百万条DNA分子同时进行快速测序分析的新一代测序技术,虽然已被广泛运用于临床,但尚无科学协会对其在肿瘤学实践中的应用提出建议。

早在2018年,欧洲肿瘤内科学会(ESMO)发布了分子靶点临床可行性量表(ESCAT),根据对患者管理的影响将分子靶点分为6个等级,针对导致全球死亡最多的8种癌症中所发生的基因组改变,ESCAT量表评估了其证据等级和临床意义。


一代测序原理及步骤

一代测序仪利用Sanger测序——双脱氧末端终止法的原理,将被荧光标记的ddNTP掺入到dNTP中,由于ddNTP随机掺入,PCR产物从引物之后的第一个碱基开始,每一个位置都有可能是ddNTP。由于ddNTP缺乏链延伸所需要的3'-OH,链的延伸就选择性地在G、A、T或C处终止。这样的PCR产物与普通PCR不一样,不能形成一条电泳带,而是一组长度相差一个碱基的成百上千种片段。1. 应用范围:① De Novo测序② 重测序: 如突变检测、SNPs、插入、缺失、克隆产物验证、比较基因组③ 分型: 如微生物和真菌鉴定、HLA分型、病毒分型④ 其它: 如甲基化分析(重亚硫酸盐测序)和SAGE(基因表达串联分析)方法2. 临床应用肿瘤突变基因的检测和肿瘤个体化治疗

一代测序和二代测序的区别是什么?

一、含义不同:第一代测序:指双脱氧末端终止法,扩增后通过毛细管电泳读取序列,每次获取数据量少。第二代测序:为高通量测序,采用微珠或高密度芯片边合成边测序,代表有454,solexa,solid,高通量,可一次获得数G数据,相对与第三代,都仍然需要扩增的方法放大信号,扩增后再检测。二、作用不同:Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。普通的二代测序,全基因组或外显子组测序是将DNA分成小片段,然后对各个片段多次读取(一般是三十次)。然而,如果突变只发生在15-20%的细胞中,三十次读取还不足以可靠地捕捉到它们,尤其是当突变只影响一个基因拷贝时。测序程序在4只试管中加入适当的引物、模板、4种dNTP(包括放射性标记的dNTP,例如32PdNTP和DNA聚合酶(如以RNA为模板,则用反转录酶),再在上述4只管中分别加入一种一定浓度的ddNTP(双脱氧核苷酸)。与单链模板(如以双链作模板,要作变性处理)结合的引物,在DNA聚合酶作用下从5’端向3’端进行延伸反应,32P随着引物延长掺入到新合成链中。当ddNTP掺入时,由于它在3’位置没有羟基,故不与下一个dNTP结合,从而使链延伸终止。ddNTP在不同位置掺入,因而产生一系列不同长度的新的DNA链。以上内容参考:百度百科-双脱氧链终止法

上一篇:非诚勿扰2下载

下一篇:不确定性原理