基于短读长测序平台的转录组由于读长的限制(PE100/PE150),在转录本组装的过程中存在较多的嵌合体,并且不能准确的得到完整转录本的信息,从而对后面的表达量分析、可变剪接、基因融合等分析造成了较大的影响。基于PacBio的单分子实时测序技术,目前平均读长可达到80Kb,其长度已经超过一般转录组中典型的基因的长度,所以利用长读长测序平台进行转录组的研究,可以直接得到全长转录本信息,而无需组装,从而更大限度的保证了转录组测序结果的准确性。
全长转录组基于PacBio的单分子实时测序技术,可以直接得到全长转录本信息,无需组装,更大限度的保证了转录组测序结果的准确性,补充已注释基因组的基因注释结果,发现新的基因和转录本,鉴定可变剪接、基因融合现象、APA位点(Alternative polyadenylation,选择性多聚腺苷化位点)等,并改善基因表达定量。
对于无参考序列的物种,全长转录组测序可以构建高质量的基因集,为后续物种的功能研究奠定基础。
对于有参考序列的物种,可发现新的转录本,完善参考基因集;并鉴定可变剪接、基因融合等结构变异。
此外在基因组研究中,全长转录组还可以用于辅助基因组基因注释
1.策略多样,可根据需求增建5-10K大片段文库,满足客户对长转录本的研究需求。
2.通量大,测序成本低,周期短。
3.信息分析内容全面,实时跟进科学研究前沿,不断升级信息分析内容。
4.个性化分析,具有丰富个性化分析经验,可根据项目需要选择更适宜的分析软件,只为保障更精准结果。
Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms. (Plant Journal,2015)
1.采用HiSeq2500 数据对PacBio RSII平台所产生的subreads进行了校正,最后得到了16,241个高质量非冗余isoforms。
2.基于HiSeq2500产生的mRNA数据的差异表达分析,发现了在根部周皮部特异表达与者高表达丹参酮合成相关基因,SmCPS1、SmKSL1、GGPS、IPI、CYP等;
3.最后研究者使用得到的16,241个高质量的Isoforms进行了可变剪接分析,发现了大约有40%检测基因位点发生了可变剪接现象,其中有些基因参与了萜类化合物代谢及类异戊二烯代谢。