1. 研究目的与意义
1.1研究的背景
自从人类基因组计划从1990年启动以来,人们对功能基因组学的研究认识也逐渐加深,其中生物信息学和蛋白质组学快速发展,因此对蛋白质的研究也更加深入。在生物信息学中一个非常重要的领域就是蛋白质组学,其中膜蛋白在各种重要的生命活动中充当着重要的角色,执行着各种各样的生物学功能,比如信号的传导、生物膜内外离子浓度的维护、配体的结合和细胞之间的粘合,它对生物的进化过程产生非常大的影响。因此,对膜蛋白功能的研究十分重要。由于不同种类的膜蛋白执行不同的功能,因此只要知道了膜蛋白的类型,就能了解其功能 。
根据蛋白分离的难易及在膜中分布的位置,膜蛋白基本可分为三大类:外在膜蛋白或称外周膜蛋白、内在膜蛋白或称整合膜蛋白和脂锚定蛋白。膜蛋白包括糖蛋白,载体蛋白和酶等。通常在膜蛋白外会连接着一些糖类,这些糖相当于会通过糖本身分子结构变化将信号传到细胞内。
2. 研究内容和预期目标
2.1研究内容
本课题主要研究的内容涉及到膜蛋白序列数据集的选择,分类算法的选择,训练集的构造,模型训练与预测等。
(1)数据集的选择
3. 研究的方法与步骤
3.1研究方法
本课题选择公共蛋白质序列数据库swiss-prot(版本35.0)作为研究数据来源,利用渗透法对蛋白质序列进行特征提取,然后使用向量机(svm)、k近邻算法、神经网络算法、朴素贝叶斯、逻辑回归、决策树等方法进行模型构建后预测,并且将这些方法得到的结果进行对比,最后根据预测出正确率的实际情况判断算法适用的条件。
4. 参考文献
[1] 张振慧.蛋白质分类问题的特征提取算法研究[d].国防科技大学,2006
[2] 李家林.基于特征工程的蛋白质分类算法研究[d].哈尔滨工业大学,2020
[3] 邢泽铭.基于机器学习的膜蛋白胞外域脱落预测方法研究[d].吉林大学,2020.
5. 计划与进度安排
(1)2022.1.5 ---- 2022. 2.28 查阅资料, 撰写开题报告
(2)2022.3.1 ---- 2022.3.15 需求分析,熟悉开发工具
(3)2022.3.15---- 2022.3.20 概要设计
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。