1. 研究目的与意义(文献综述)
1.1研究目的及意义
随着数字信息时代的发展,人们采集和存储数据的能力逐步提高,数据规模不断壮大。数据库中蕴含着大量对人类有用的信息,可以用来帮助人们做出明智的决策。与此同时,面对复杂的、信息丰富的大数据集,人们分析和处理大规模数据的能力急需提高。从海量数据中获取有用信息,即数据挖掘,已经成为数据库和信息决策的热点之一。其中,分类是数据挖掘的一项重要任务,它的目标是构造一个分类模型,将实空间中的实例映射到间的某些类标签中[1]。由于分类问题与现实应用紧密相关,因此,针对分类问题的研究具有重要的理论价值和应用价值。
主成分分析法(principalcomponentanalysis,pca),是一种多元统计分析方法。该方法利用降维的思想,把多因素转化为少数几个不相关的综合因素。通过构造原变量的一系列线性组合形成新变量,使这些新变量在彼此互不相关的前提下尽可能多地反映原变量的信息,且彼此间不相关,以达到简化数据的目的[3]。它可把多个数学形态特征变量转化为较少的彼此不相关的综合变量,以消除网络输入间的相关性及减少网络输入数,减少不同状态下样本之间的干扰,同时使得集成神经网络结构得到优化[2]。
2. 研究的基本内容与方案
本文的基本内容为选取食品检测领域,生物信息领域中的多个不同类型的应用数据集作为分析的对象。首先进行主成分分析将多维数据进行压缩,从而构成相应的可以表征原始信息的特征向量,然后将特征向量作为bp神经网络的输入,构造非线性分类器。
本文目的在于完成基于matlab实现主成分分析-人工神经网络分类器,对选取的多个应用数据集进行分析,完成数据与算法结果的可图形化显示。
主成分分析法是一种数据压缩和特征提取的多变量统计分析技术,它能够将多个相关变量转化为少数几个不相关的综合变量,且这些不相关的综合变量包含了原变量提供的大部分信息[8]]。因此,本文采用主成分分析法,对目标数据进行特征提取,获得几个综合指标,使得新的输入变量维数低、分量间相关性小。在此基础上,再应用bp神经网络建立数学模型。从而实现分类识别和准确检测。相比于单独使用神经网络技术,此方法既提高了分类精度,又简化了网络结构。
3. 研究计划与安排
第1-3周:完成题目调研,查阅参考资料,设计大致框架,完成开题报告;
第4-6周:学习有关算法的相关知识;
第7-8周:确定算法结构,完成各部分的程序设计;
4. 参考文献(12篇以上)
[1]张秀方.基于贝叶斯网络的多维数据分类研究[d].西安电子科技大学,2014.
[2]周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风电功率预测[j].电网技术,2011,35(9):128-132.
[3]刘天桢.基于多维数据分析的神经网络与分布式计算研究[d].武汉理工大学,2008.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。