大数据挖掘中的聚类分析开题报告

 2021-08-14 03:00:36

1. 研究目的与意义(文献综述)

互联网时代,产生的数据量日益增大,巨量的原始数据必然蕴含很大的价值,如何挖掘这些巨量数据的信息,己经成为人类面临的一大挑战。由此数据挖掘技术应运而生并得以迅猛发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。

数据挖掘(datamining),又称为数据库中的知识发现(简称kdd),是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的处理过程。数据挖掘是一门新兴的技术,它以数据库技术作为基础,把逻辑学、统计学、机器学习、模糊学、可视化计算等多门学科的成果综合在一起,进行如何从数据库中得到有用信息的研究。数据挖掘技术得到了人们的普遍关注,广泛应用于银行金融、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。

聚类分析是数据挖掘中的一个重要研究领域。所谓聚类,就是把没有类别标记的样本集按某种准则划分成若干类,使类内样本的相似性尽可能大,而类间样本的相似性尽量小,是一种无监督的学习方法。聚类分析通常是在没有先验知识支持的前提下进行的,它所要解决的就是在这种前提下,实现满足要求的类的聚合。聚类分析的研究主要集中在聚类算法上,产生性能好而且实用的聚类算法是其终极目的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基本内容:

本文研究的课题是大数据挖掘中的聚类分析。论文包括以下几个方面的内容:

(1)通过查阅文献和搜集相关资料,介绍大数据聚类分析的几种基本方法及原理,并完成有关毕业设计相关的外文文献翻译。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1周 毕业设计开始;

第2周 查阅设计题目的相关资料;

第3周 撰写开题报告;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1][1] 维克托-迈尔-舍恩伯格、肯尼思-库克耶著,周涛等译大数据时代.,2012.

[2] [2j.p.marquesdesa著,吴逸飞译模式识别--原理方法及应用,2002.

[3][3jjiaweihan,michelinekamber著,范明、孟小峰译数据挖掘概念与技术,2007.\

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。