1. 研究目的与意义、国内外研究现状(文献综述)
课题的意义:
大数据时代人类的数据生产能力达到空前,如何从庞大的数据中提取有用的信息,并有效运用是最需要解决的。数据挖掘由此产生,在没有明确假设的前提下,利用多种方法,从海量的数据中提取有价值的、潜在的信息,发现知识。数据挖掘所得到的信息应是具有先知性的,有效的和可实用的。主成分分析在数据挖掘时的作用是至关重要的,在进行数据分析前,影响结果的影响因子数量众多,且各因素之间有一定的相关性,因此影响因子对结果的影响有信息重叠,这些使得数据挖掘的预测、分类结果准确率降低。这时就需要主成分分析将众多的影响因子转化为少数几个不相关的主成分,再采用数据挖掘算法来对数据进行分析,从而提高预测精度和准确率,基础的算法存在一定的局限性,为弥补其缺陷,需要在基础算法的基础上优化和再创造,使模型结果更为精准有效,并且更好的解决问题,得到“最优”模型。
国内外研究进展:
2. 研究的基本内容和问题
研究目标:
1.学会对数据做好预处理
2.熟练运用基础算法对所寻找的合适、有研究意义的数据进行分析,建立模型,得出结论。
3. 研究的方法与方案
研究方法:
运用文献分析法、文本细读法、综合分析法、比较法、理论和实际相结合等方法进行研究。
技术路线:
4. 研究创新点
1.选题富有挑战性。本选题基于信息化大发展,从庞大的数据中提取有用的信息,并有效运用。
2. 对主成分分析方法进行改进优化。在准确率、相关性及分类率等方面比pca算法更优。
3. 对数据挖掘算法进行改进优化。使在模型预测方面的准确率得到提升。
5. 研究计划与进展
2020年1月10日-2月20日 确定选题,收集相关资料。
2020年2月21日-2月29日 撰写开题报告与开题。
2020年3月1日-3月31日 深入研究,形成论文初稿。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。