1. 研究目的与意义
背景:成分分析也称主分量分析,是由hotelling于1933年首先提出的。由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,……,直到所提取的信息与原指标相差不多时为止。这就是主成分分析的思想。一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。
目的:主成分分析法是希望用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分,并用以解释资料的综合性指标。因此,主成分分析实际上是通过降维的方法,便于进一步研究计算。
意义:人们在对某个单位或某个系统进行综合评价时都会遇到如何选择评价指标体系和如何对这些指标进行综合的困难,而主成分分析能从选定的指标体系中归纳出大部分信息,根据主成分提供的信息进行综合评价,所以其不失为一个可行的选择。多元数据的主成分分析方法是根据指标间的相对重要性进行客观加权,可以避免综合评价者的主观影响,在实际应用中越来越受到人们的重视。
2. 研究内容和预期目标
研究内容:
1主成分分析的思想方法
1.1 什么是主成分分析
3. 研究的方法与步骤
研究方法:主成分分析法
研究步骤:
(1)将原始数据标准化;
4. 参考文献
[1]薛毅,陈立萍.统计建模与R软件[M],清华大学出版社,2007.[2] 李东风. 统计软件教程:SAS系统与S语言[M]. 北京: 人民邮电出版社, 2006.[3] 郭志刚.社会统计方法-SPSS软件应用[M].北京:中国人民大学出版社,1999.[4] 刘则毅.科学计算技术与Matlab[M] .北京:科学出版社,2001. [5] 董麓.数据分析方法[M]. 大连:东北财经大学出版社,2001.[6] 何晓群.现代统计分析方法与应用[M]. 北京:中国人民大学出版社,1998.[7]任若恩,王惠文.多元统计数据分析—理论、方法、实例[M],国防工业出版社,1997.
5. 计划与进度安排
(1)2022年3月1日—3月12日完成开题报告并提交开题报告等材料(开题报告、外文翻译等)。(2)2022年3月15日—6月4日毕业论文写作,按开题报告撰写论文。(3)2022年4月19日—4月30日中期检查,汇报课题进展情况,回答教师提问。(4)2022年5月10日—5月21日完成论文初稿,指导教师批阅论文初稿,根据导师提出修改意见对论文进行修改。(5)2022年5月24日—6月4日论文定稿,经指导老师批阅,达到质量要求后定稿。(6)2022年5月31日—6月11日完成论文答辩。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。