全文总字数:3878字
1. 研究目的与意义(文献综述)
1.1目的和意义
随着我国经济的平稳发展,越来越多的人愿意在闲暇时外出旅游放松,伴随着人工智能、互联网技术的飞速发展,互联网已经成为我们获取知识、信息的最大平台,因此传统行业领域,如旅游业,也加快了和互联网的创新结合,旅游业迎来了创新发展的新高潮。然而,随着互联网的广泛普及,信息的传播越来越方便,信息的形式越来越多样,我们可以通过多种方式发布、获取信息,随之而来数据量的增大导致我们对数据进行分析的难度也相应提高。传统的通过搜索引擎来获取旅游信息的方式,搜索引擎返回的是包含关键词、关键句出现最多的网页链接,同时还包含有大量冗余的无效信息,并不能直接给出用户所想要的结果,用户想要得到自己想要的信息,就必须从众多网页链接中进行筛选,最终才能得到有效信息。传统的基于搜索引擎获取信息的方式难以满足用户在海量信息中高效准确获取信息的需求,为了获得更加有效的精确信息,我们需要更加准确的描述信息之间的关系,知识图谱应用而生。
知识图谱是由google公司在2012年提出来的一个概念,知识图谱本质上是语义网络,是一种基于图的数据结构,由节点和边组成。从实际应用的角度出发可以简单地把知识图谱理解成多关系图,多关系图一般包含多种类型的节点和多种类型的边。在知识图谱里,我们通常用“实体”来表达图里的节点、用“关系”来表达图里的“边”。实体指的是现实世界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱主要有两种存储方式:一种是基于rdf的存储;另一种是基于图数据库的存储。rdf一个重要的设计原则是数据的易发布以及共享,图数据库则把重点放在了高效的图查询和搜索上。其次,rdf以三元组的方式来存储数据而且不包含属性信息,但图数据库一般以属性图为基本的表示形式,所以实体和关系可以包含属性,这就意味着更容易表达现实的业务场景。
构建好的知识图谱,我们可以把它认为是一个知识库。当我们执行搜索的时候,就可以通过关键词提取以及知识库上的匹配直接获得最终的答案。这种搜索方式跟传统的搜索引擎是不一样的,一个传统的搜索引擎它返回的是网页、而不是最终的答案,所以就多了一层用户自己筛选并过滤信息的过程。google最早提出知识图谱就是用来优化现有的搜索引擎,更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。
2. 研究的基本内容与方案
2.1基本内容及目标
设计并实现一个旅游服务自动问答系统,能对数据库中的数据进行新增、修改、删除、查询等操作。以可信度高的旅游服务平台的数据作为数据来源,以问答论坛的问题答案作为补充数据,采取多策略的方式实现旅游服务自动问答系统,方便用户在旅途中获取旅游相关信息,提高用户的旅途体验。
2.2技术方案及措施
本课题开发以Python作为编程语言,首先通过网络爬虫爬取可信度高的旅游服务平台的数据作为数据源,如去哪儿、携程等网站的旅游景点数据。图数据库是一种适合知识图谱的存储结构,图数据库把重点放在了高效的图查询和搜索上,一般以属性图为基本的表示形式,实体和关系可以包含属性,这就意味着更容易表达现实的业务场景,所以可以利用图数据库neo4j构建旅游知识图谱。然后对用户的问题进行自然语言处理,运用jieba分词、词性标注等方法对用户问题预处理,抽取关键信息,对用户的问题进行分类,获取对应问题模板,从而明白用户的意图,通过neo4j的查询语言Cypher语句查询图数据库,返回得到答案。最后再进行前端设计,便于用户进行交互式体验。
3. 研究计划与安排
第1-3周:完成题目调研,查阅参考资料,设计大致框架,撰写开题报告。
第4-5周:论文开题、外文翻译。
第6-7周:学习python语言、数据库以及自然语言处理相关知识。
4. 参考文献(12篇以上)
[1] yan j, wang c, cheng w, et al. a retrospective of knowledge graphs[j]. frontiers of computer science in china, 2018, 12(1): 55-74.
[2] shi l, li s, yang x, et al. semantic health knowledge graph: semantic integration of heterogeneous medical knowledge and services[j]. biomed research international, 2017: 1-12.
[3] 张元博. 医疗知识图谱构建与应用[d].哈尔滨工业大学,2018.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。