查询反馈系统设计与实现开题报告

 2022-01-12 20:40:07

全文总字数:3140字

1. 研究目的与意义(文献综述)

随着互联网技术快速发展,信息的产生和传播的速度达到空前的水平,每天都有海量数据产生,但是问题也随之而来:面对海量的数据,挑选出自己想要的信息,往往需要付出大量的时间和精力。在这一背景下,快速准确的信息检索服务显然已经成为人们的急迫需求。

在传统的基于关键字的信息检索方法中,往往不能准确地描述用户的查询需要,并且关键词本身也可能会有歧义。除此之外,对于不同的用户,由于文化背景、生活环境等因素的不同,也会导致查询结果的不匹配问题。为了解决上述问题,人们提出了相关反馈技术。相关反馈技术的思路是,获取用户反馈的以及系统自动生成的反馈信息,从而更加准确地把握用户的查询意图,并对初次查询的结果进行再一次排序,从而优化检索结果,很大程度地提高查询准确率。布尔模型是最早出现的一种信息检索模型,也是之后提出的其它检索模型的依据和基础。根据检索条件,它将文档分为相关文档和不相关文档,而无法得到近似或者部分匹配的文档,也无法对检索结果进行相关性排序。为了解决以上问题,人们提出了向量空间模型vsm。vsm将文档与用户查询转换为由特征项构成的空间向量概念,通过计算向量间的相似度,得到文档与用户查询之间的相关性大小,从而可以实现对查询结果的排序。但是,它要求特征项之间相互独立、没有影响,这不符合自然语言中的词语关系。为了解决这个问题,人们提出了概率模型。在概率模型中,特征项之间可以通过转换概率形成联系。

以上三种模型都是通过估计文档与用户查询的相关性得到检索结果的,但是,不同的用户之间存在个体差异,用户选取的关键词不准确,这些因素都会导致检索结果不符合用户的期望。此时就需要引入相关反馈技术来获取用户的真实查询意图。相关反馈方法分为显式反馈、隐式反馈和盲式反馈。显式反馈方法最早由rocchio提出,它要求用户显式地参与,根据查询得到的文档进行相关性判断,然后反馈给检索系统。这种方法的优点在于,用户只需要判断文档的相关性,而不需要了解查询反馈的技术细节,同时极大地减少了系统的计算量。不过,它也存在明显的限制,即十分依赖于用户和系统的交互。隐式反馈则不需要用户的直接参与,它是通过研究用户的行为,比如点击数据、浏览记录等,判断文档的相关性,继而对查询结果进行优化。由于隐式反馈需要在一定程度上监控用户的行为,涉及到用户的隐私,故较难得到用户的支持。盲式反馈又称伪相关反馈,它提供了一种自动局部分析方法,不需要用户的参与。它假设返回结果中的前n个文档都是相关的,在这个假设条件下进行相关反馈。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1设计的基本内容

研究的主要内容为基于深度学习的查询反馈系统,总体上又可分为两个子系统:检索核心系统和人机交互界面。

检索核心系统是整个系统的核心,将参考先前的模型设计,根据用户输入的关键词,在数据库中所有的文档集合中进行检索,并使用相关反馈技术对结果进行排序优化。

人机交互界面是用户与检索核心系统交互的接口,它主要负责接收用户查询请求,并将查询结果显示出来。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

周次

时间(周)

内容

1

1

充分查阅相关文献,

2~3

2

需求分析及系统概要设计

4~5

2

完成功能模块设计、数据库逻辑设计和表结构设计

6~9

4

完成系统的编码开发

10~11

2

对系统进行测试

12~13

2

完成论文初稿

14

1

根据导师意见,修改论文并完成第二次论文草稿

15

1

集中解决论文漏洞和问题,修改论文并定稿

16

1

提交论文,准备参加答辩

4. 参考文献(不低于12篇)

[1]中国互联网络信息中心,第43次中国互联网络发展状况统计报告[[eb/ol]. http://www.cnnic.net.cn, 2019.

[2]李亚楠, 王斌等. 搜索引擎查询推荐技术综述. 中文信息学报, 2010, 24(6)

[3]王娟琴.三种检索模型的比较分析研究:布尔,概率,向量空间模型[[j].情报科学,1998, 16(3):225-230.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。