1. 研究目的与意义
目前,随着高校网络环境的改善,图书馆自动化条件的不断优化,很多高校图书馆都已经着手特色数据库的建设工作,其中,学生论文库的建设也是图书馆的一项重要工作,学生论文一般都非常注重专业特色以及地方特色的结合,同时作为一种历史数据资源和资料,它还能为教师以及学生以后的毕业设计工作提供重要的借鉴和参考作用。
特色数据库的建设必须依赖一定的软件平台,对大多数图书馆来说这种软件平台需要通过购买软件来实现,但这种软件一旦选定一般不能轻易更改,因此对于一个图书馆来说,能够开发一个独立稳定,配置灵活且符合图书馆工作需要的论文检索系统是非常重要的一项工作。
2. 国内外研究现状分析
全文信息检索是网络检索的发展方向之一,它以全文数据库的存储为基础。
全文检索可以多各类数据(文字,声音,图像等)按其内容而不是外在的特征来实现信息的检索。
全文检索技术最早于1959年出现在美国匹兹堡大学建立的法律情报检索中,全文检索为人们获取文献原文而非文献线索信息(即书目信息)提供了极大的便利,因此收到了信息检索界的普遍重视。
3. 研究的基本内容与计划
本系统的总体设计目标是是在计算机网络,数据库和先进的开发平台上,利用全文搜索引擎工具包lucene来构建一个适合高校的毕业论文库全文检索系统。
本论文的主要内容有以下几个方面: (1)第一章绪论,介绍了本论文的研究背景及意义,本论文的主要研究内容和论文结构。
(2)第二章介绍了全文检索的基本功能,主要技术(倒排索引,中文分词,文档相关度排序算法),建立索引和进行索引的流程,还对开源工具lucene的来源、优点进行了简单的介绍,对他的系统结构及工作原理进行了详细的分析。
4. 研究创新点
(1)剖析了全文检索工具包lucene的组织结构与源码,分析了lucene索引文件的结构、搜索排序算法、倒排索引技术、中文分词方法,以及lucene文档得分算法。
(2)使用lucene框架设计并实现了高校学生论文库的全文检索系统。
实现了论文上传,论文全文检索,等功能,提高了简历学生论文库的效率。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。