基于EST序列分析识别杨树候选SNP位点开题报告

 2021-08-08 10:43:55

1. 研究目的与意义

目的:本课题利用GenBank数据库中大量的杨树EST序列数据,通过聚类拼接和多重比对等生物信息学分析手段识别新的杨树候选SNP位点。

意义:单核苷酸多态性(singlenucleotidepolymorphisms,SNP)是生物基因组中最常见的遗传变异,作为一种遗传多态,SNP具有位点分布广泛、数量众多、遗传代表性、稳定性高、易于批量检测并实现自动化分析等优点,在遗传学研究的许多方面具有重要作用,它的搜寻正受到国际生物界的广泛关注。目前在生物基因组中搜寻SNP最常用的方法是基于生物信息学对已定位的表达序列标签(expressdsequencetag,EST)进行再测序。基于EST发展起来的单核苷酸多态性分子标记(ESTSNP)在遗传图谱构建、重要性状基因定位、比较遗传作图、遗传多样性分析和品种鉴别、分子标记辅助选择育种等方面发挥了重要作用。目前在人类基因组中现已发现了多达百万个SNP,这些SNP被广泛地应用于全基因组疾病关联分析。林木基因组中也存在着大量的SNP位点,但是到目前为止只有少量的SNP被发现,如何利用现有的数据资源快速有效地识别大量的林木SNP,以便进行林木全基因组与数量性状的关联分析有着及其重要的意义。杨树是重要的造林绿化树种,也是主要的工业用材树种,还是高大林木的模式树种。进行杨树SNP候选位点的分析和识别,进一步进行功能基因的挖掘、克隆和功能的研究,是当前杨树基因组学的首要任务之一,不仅可为杨树品种改良和基因资源的有效利用奠定基础,而且对探讨林木的生理及遗传特性分子机制也具有重要的理论意义。

2. 国内外研究现状分析

随着人类基因组计划和各种模式生物的基因组计划陆续开展,ncbi、ebi、ddbj3大数据库中存储的dna序列数量飞速增长。这一不断增大的数据库资源可以成为寻找snp的重要宝藏,采用先进的生物信息学软件,利用计算机自动识别已经成为一种简单、有效、廉价的发展snp的新策略。目前国际上的许多实验室采用这种策略开发出了许多各自的snp候选位点筛查方法。

在动物基因组的研究中,中国水产科学研究院以现有的鲤鱼est序列资源为基础,运用生物信息学工具,对鲤鱼生长相关的snp进行开发和注释,探讨运用生物信息学方法发掘鲤鱼生长相关候选snp位点的可行性;海洋生物学研究生通过对长牡蛎(crassostreagigas)已有的est序列数据库检索,经过序列聚类和拼接得到est簇4548个,含有不少于4条est序列的簇共1079个,经过进一步设置筛选条件,整理出可供利用的est簇313个,得到候选snp位点共计1140个。这些研究为正在进行的海洋动物遗传连锁图谱的构建及基于候选基因关联分析进行动物生长相关优异等位基因的发掘提供了新的可供选择的标记。

snp在人类基因组的研究中应用较为广泛,在植物中展开snp广泛研究的种类则较少,近年仅在玉米、大麦、小麦、番茄、水稻等农作物上开展了此项工作。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的基本内容与计划

内容:从ncbi数据库中下载已知的杨树est序列,在linux操作系统下利用est-snp分析软件对est序列进行预处理、聚类拼接,得到完整基因序列。利用snp分析软件进行分析,识别est-snp位点。

计划:第1步:登录ncbi网站,下载杨树已知est序列。

第2步:在linux操作系统下,利用crossmatch工具进行est序列预处理,除去ncbi数据库中载体序列和一些过长重复序列片段。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

利用生物信息学分析软件,对数据库中的冗余序列进行自动识别并进行SNP标记位点的发掘利用已经成为一种简单有效且廉价的SNP位点开发的新策略,且可减少工作的盲目性,省去许多重复测序工作,实现高效和低成本。SNP在人类基因组的研究中应用较为广泛,在植物中展开SNP广泛研究的种类较少,在林木以及杨树方面的研究应用则甚少。杨树生长周期短,离体操作容易,基因组相对较小,被喻为林木的拟南芥,因此,挖掘和识别杨树SNP位点不仅是利用基因工程技术进行杨树品种改良、有效利用基因资源的基础,同时也对研究林木的生理及遗传特性分子机制具有重要的理论意义。随着三大数据库的日益成为寻找SNP新的重要平台,丰富的杨树EST数据资源和生物信息学软件的强大,使得杨树EST-SNP位点识别成为可能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。