1. 研究目的与意义
随着互联网的蓬勃发展,建立在互联网上的各种应用也层出不穷,其中最为成功的摸过于万维网(www)。
万维网的发展也彻底改变了人们的思维、习惯与生活。
一方面,它使网络用户更容易获取各种各样的信息,而另一方面,要想在数十亿网页的网络信息中精确地找到自己需要的信息简直就如#8220;大海捞针#8221;一般。
2. 研究内容和预期目标
本文主要对搜索引擎的原理、结构、工作流程及搜索引擎中用到的主要数据结构做了详细的分析与研究,同时利用java技术对搜索引擎的主要功能做了实现:
1.研究搜索引擎的基本组成,工作流程;同时对搜索引擎中的主要存储结构,索引结构做了详细谈讨。
2.介绍搜索引擎中重要部分页面抓取技术,对用到的相关协议、抓取方法及应考虑的一些问题做了阐述。
3. 国内外研究现状
1.理论的渊源及演进过程
搜索引擎技术伴随着www的发展是引人注目的。搜索引擎大约经历了三代的更新发展:
第一代搜索引擎出现于1994年。这类搜索引擎一般都索引少于1,000,000个网页,极少重新搜集网页并去刷新索引。而且其检索速度非常慢,一般都要等待10秒甚至更长的时间。在实现技术上也基本沿用较为成熟的ir(information retrieval)、网络、数据库等技术,相当于利用一些已有技术实现的一个www上的应用。在1994年3月到4月,网络爬虫world web worm (wwww)平均每天承受大约1500次查询。
4. 计划与进度安排
1、查找相关资料,设计好基本的大框架(研究方向),撰写设计。
2、进行各个细节环节的设计,取最优的方案。
3、对设计的进程调试,修改程序中不合理的设计以及未考虑完全的方面。
5. 参考文献
[1] 苏云.搜索引擎google检索技巧研究[j].甘肃科技,2005,(02)
[2]印鉴,陈忆群,张钢.搜索引擎技术研究与发展[j].
[3] 刘壁松.策略可拓展的搜索引擎研究和实现[j].清华大学,2005.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。