全文总字数:7037字
1. 研究目的与意义
目的:本课题在美洲黑杨和小叶杨一个f1代杂交群体中,使用gmrad和stacks两种软件包,采用不同的参数组合识别snp基因型数据,确定最佳参数以获取高质量的snp数据用于遗传作图,从而提高林木遗传图谱的准确性。
意义: snp,是指基因组核苷酸序列中由于单个核苷酸水平上的变异引起的基因序列多态性,由单碱基的转换、颠换及插入和缺失等现象引起的,主要出现的形式有两种,一种是转换,即以一种嘧啶置换另一个嘧啶或者一种嘌呤置换另一个嘌呤;另一种是颠换,即嘌呤与嘧啶互换。
snp 广泛分布在基因组上,数目多且较稳定。
2. 国内外研究现状分析
基于基因组简化(rad)测序获取群体中成千上万个snp标记用于林木遗传作图是目前最重要的技术手段,但是这是一个大数据分析领域,在snp基因型获取方面存在着诸如等位基因覆盖度、基因型缺失率和分离比检验的p值阈值等参数选取问题,这些问题直接影响到群体中snp基因型质量,关系到构建的遗传图谱准确性。
目前国际上的许多实验室采用这种策略,越来越多物种的snp标记通过这种方法开发出来。
2011 年, 英国作物遗传学家barchi 等将 rad-seq 应用于茄子(solanum melongena)的 snp 标记开发。
3. 研究的基本内容与计划
内容:下载美洲黑杨和小叶杨基因组数据,使用gmrad和stacks两种软件包,采用不同的参数组合识别snp基因型数据,确定最佳参数以获取高质量的snp数据用于遗传作图。
计划:1. 下载美洲黑杨和小叶杨基因组数据,认清序列条数和碱基总数;2. 在gmrad目录下下载并安装软件locas,samtools,bcftools,bwa3. 使用gmrad软件将美洲黑杨和小叶杨每个亲本的reads进行聚类,构建双亲模板,生成亲本snp目录,在所有个体调用snp基因型,通过分离率和缺失数据来过滤用于遗传连锁作图的基因型数据4. 使用stacks软件将经过3步骤处理过的基因型数据建立索引数据库。
5. 调整比对工具处理序列相似性的参数,用stacks软件先抽取步骤3中所获的一个小样本基因型数据进行参数调优,用samtools stats和samtools flagstat查看比对质量,根据3个指标:(1)实际使用的alignment数,(2)因soft-clipping剔除的alignment数,(3)每个位点的平均覆盖度确定最优参数。
4. 研究创新点
目前,rad测序方法已在分子标记开发、遗传图谱构建、基因定位、基因组结构分析、系统发生学与种群遗传学分析等方面得到应用。
对于无参考基因组且没有明确基因组结构的物种,运用rad测序技术可起到明显效果,不仅可以获得大量基因组序列,还可以筛选海量的snp位点。
在生物基因组中,snp含量极为丰富,在整个基因组中分布均匀,且与大部分复杂的性状遗传机制有关,突变率较低,遗传稳定性高,此外基于snp的基因分型方法也简单可靠。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。