公司博客
Home / 概述 / NGS应用的概述

NGS应用的概述

0

NGS数据处理并不是说有一个固定的流程该怎么做,关键还是看测这个数据的目的是什么。就我的理解,我简单讲讲,希望对你有帮助。

NGS是第二代测序技术,是sanger测序的延续,因为通量高和价格便宜才如此普遍。不管怎样都是测序技术。虽然测的是DNA,但是RNA逆转录一下也可以用来测,所以也可以应用在RNA测序上面。甲基化通过免疫共沉淀或者亚硫酸盐处理一下,也可以在DNA上区分出来。所以我分三块来讲:DNA、RNA和表观。

DNA:
一、全基因组Denovo测序:
就是说之前没有这个基因组的序列信息,通过测序来得到全基因组的序列。因为一条染色体对应一条DNA,DNA的长度是比较长的,测序得到的片段不够长,所以需要组装来重建基因组。一般是通过序列之间的overlap信息或者双末端之间的距离。软件很多,出了你提到的velvet,还有SOAPDenovo、ALLPATH-LG、ABySS,Newbler等。这样还不能到染色体的水平,还需要借助于遗传图谱。接下来就是注释了,就是搞清楚基因组上分别是什么区域,比如基因、重复序列、转录因子之类的。一般是通过结构特征或者已有数据库的同源预测。基因注释的软件有Augustus、Gilmmer、SNAP、GeneScan等,重复序列注释的有RepeatMasker、RepeatScout、RepeatModeler、LTR_finder等。对应基因的话,还需要做功能注释,这个就要依赖GO、KEGG、COG等数据库了。注释完了之后就一般会做一些进化分析,基因家族聚类、进化树之类的。这个找一篇基因组的文献仔细的啃一啃就可以了解了,我在这就不多说了。

二、重测序:
每个个体之间都存在差异,一部分是由表观遗传学控制了,大部分还是在于遗传物质的差异。通过全基因组Denovo我们得到的只是一个个体的基因组序列,这第一个全基因组的序列往往会被用来做为Reference,那么为了了解DNA层面的差异就需要找到测的个体和Reference之间的差异,或者以参考序列为媒介,测序的个体之间的差异。所以重测序的重点就是变异检测,主要就是SNP、indel、SV、CNV之类的。对应的软件有bwa+samtools、GATK、soap+soapsnp、Dindel、Pindel等等。
重测序这块还有一个就是群体重测序,可以是家系群体或者自然群体。家系群体可以用来做遗传图谱,可以用在组装上面,如果有表型数据可以做QTL定位。自然群体,根据选择的样品可以做驯化分析或者GWAS分析,GWAS在复杂疾病当中用得比较多一些。
重测序也不一定要测整个基因组,可以通过酶切的方法测一部分,比如GBS和RAD;也可以先用芯片捕获再测序,比如外显子。
重测序最核心的还是变异检测这块。

RNA:
聊完DNA,我们来聊RNA。前面已经讲了,RNA测序其实是测得DNA逆转录之后的产物。主要测得是mRNA和一些small RNA,RNA的一个特点是时空特异性,不同的组织不同的时期,表达量都会有变化,所以这些是研究的重点。
一、mRNA
测序得到的片段是比较短的,前面讲DNA的时候提到了基因组组装和注释,所以要分析,还是要将这些短的片段比对到基因组上去,才能获得更详细的信息:这个RNA是属于什么元件的,比对上去的数目则反映了其表达量。比对的软件有tophat,soap等,分析表达量的有cuffdiff,DAVID,DEGseq等。可以参考Nature Protocal上的《Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks》。
对于没有参考序列的呢,跟DNA一样,就得组装了。因为和DNA之间的差异,所以使用的组装软件也有差别。RNA组装的软件主要有Trinity、Trans-ABySS(和ABySS对应)、Oases(和Velevt对应)SOAPDenovo-Trans(和SOAPDenovo对应)。接下来也会涉及到注释的问题,这个就主要是基于数据库和近缘物种了,想和GO、KEGG等比较做注释的时候,也可以得到基因的功能。表达差异也可以分析下的。
跟DNA可以酶切测简化基因组一样,RNA也可以先酶切再测序,这个就是通常说的DGE了。
有个网站可以推荐下:www.rnablog.com
二、miRNA
miRNA长度在18-22nt,所以它的测序是直接从total RNA中通过电泳跑胶得到长度在这个范围的RNA。然后通过MiRBase数据来鉴定。对miRNA而言,再一个就是它起作用的靶基因预测,软件有miRecords、TargetScan等。miRNA往往和mRNA的表达一起分析。

联系我们