1. 研究目的与意义
【背景】将认识对象进行分类是人类认识世界的一种重要方法,比如在生物学中,为了研究生物的演变,会根据各种生物的特征,将它们归属于不同的界、门、纲、目、科、属、种之中。将事物进行分类研究,同一类事物会具有更多的近似特性,这远比在一个混杂多变的集合中更清晰、明了和细致。多元聚类分析,是数据挖掘领域最重要的研究分支之一,也是最为常见和最有潜力的发展方向之一。通常,人们可以凭经验和专业知识来实现分类。而聚类分析作为一种定量方法,将从数据分析的角度,给出一个更准确、细致的分类工具。聚类分析是根据事物自身的特性对被聚类对象进行类别划分的统计分析方法,它的目的是根据某种相似度度量对数据集进行划分。聚类既可以作为一个单独的工具以发现数据样本中一些隐含的、深层的信息,也可以作为其他数据挖掘分析方法的一个预处理步骤。聚类分析是数据挖掘重要的工具,且已经被广泛地应用于各学科领域。
【目的】这次的课题着重研究多元聚类分析的方法与应用,旨在根据某种相似度度量对数据集进行划分,将没有类别的数据样本划分成若干个不同的子集。
【意义】理论与实践应用相结合,从而描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
2. 研究内容和预期目标
【研究内容】
1聚类的根据
1.1 观测数据矩阵
3. 研究的方法与步骤
【研究方法】通过系统聚类法与逐步聚类法进行实例分析。
系统聚类法:
以n个样本的聚类分析为例,系统聚类法的步骤如下:
4. 参考文献
[1]薛毅,陈立萍.统计建模与R软件[M],清华大学出版社,2007.[2] 李东风. 统计软件教程:SAS系统与S语言[M]. 北京: 人民邮电出版社, 2006.[3] 郭志刚.社会统计方法-SPSS软件应用[M].北京:中国人民大学出版社,1999.[4] 刘则毅.科学计算技术与Matlab[M] .北京:科学出版社,2001. [5] 董麓.数据分析方法[M]. 大连:东北财经大学出版社,2001.[6] 何晓群.现代统计分析方法与应用[M]. 北京:中国人民大学出版社,1998.
5. 计划与进度安排
1.2022年3月1日-3月5日(第1周)了解所选论题的状况和要求,查阅相关资料;2.2022年3月1日-3月12日(第1—2周)完成开题报告,提交开题报告等材料(开题报告、外文翻译等),通过指导教师开题报告等材料的审核;3.2022年3月15日-6月4日(第3—14周)毕业论文写作,按开题报告撰写论文。4.2022年4月19日-4月30日(第8—9周)中期检查,汇报课题进展情况,回答教师提问。5.2022年5月10日-5月21日(第11-12周)完成论文初稿,交由指导教师批阅论文初稿,并且修改自己查重。6.2022年5月24日6月4日(第13—14周)论文定稿,经指导老师批阅,达到质量要求后定稿,再次自己查重。7.2022年5月31日-6月11日(第14—15周)准备论文答辩。8.2022年6月12日-6月25日结束工作整理材料,做好总结。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。