1. 研究目的与意义(文献综述)
1.1研究目的及意义
随着计算机科学与技术的深入发展,人类社会已经进入了数据膨胀的年代,个人计算机已经远远满足不了数据处理要求。在这种情况下,云计算技术应用而生。云计算是在网格计算的基础上发展而来的,能够给用户提供可靠的、自定义的、最大化资源利用的服务,是一种崭新的分布式计算模式。
与此同时,互联网上面的信息呈现爆炸式的增加,这些信息的出现大大丰富了互联网上面的内容;但同时也为想要寻找到自己需要信息的用户造成了一些麻烦,如何在网络上面快速便捷的找到需要的信息已经成为困扰网络用户的难题[8~10]。因此,为了能够快速、准确、便捷的让用户得到需要的信息,网络信息的分类与自动摘要系统应运而生。目前网络分类主要是指网络搜索引擎的分类,因此除了研究网络信息分类体系的编制原理、基本原理,还应从网络信息分类体系的特点、传统分类法在网络信息分类中的应用角度对网络分类的现状进行研究[1-2]。
2. 研究的基本内容与方案
2.1研究目标
本论文主要研究如何在虚拟云环境下建立一个互联网的信息分类的处理系统。通过云环境平台这个有利的工具,以及目前已有的关于信息处理的算法和理论,实现互联网中的信息分类与摘要系统。本次采用朴素贝叶斯(naivebayesianmodel,nbm)算法,针对海量的互联网信息,改进计算特征值权重方法和nbm模型,使其成为信息分类的高效率算法。
2.2研究内容
3. 研究计划与安排
第一阶段(第1周—第3周):查阅相关文献资料,明确研究内容,了解研究所需知识与各项技能。确定方案,完成开题报告,书写摘要并完成相关英文文献翻译。
第二阶段(第4周—第9周):前期的可行性研究,需求分析,进行系统的初步设计。
第三阶段(第10周—第13周):统具体实现,主要完成代码的编写,调试以及功能的实现。
4. 参考文献(12篇以上)
[1]calheirosrn,ranjanr,beloglazova,etal.cloudsim:atoolkitformodelingandsimulationofcloudcomputingenvironmentsandevaluationofresourceprovisioningalgorithms[j].software:practiceandexperience,2011,41(1):23-50.
[2]刘丽珍.文本分类中的特征选取[j]计算机工程.2004.4
[3]柴春梅.互联网短文本信息分类关键技术研究[d].上海:上海交通大学.2009
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。