一种基于NLP的检定规程信息抽取系统设计开题报告

 2021-12-17 23:20:14

全文总字数:10890字

1. 研究目的与意义(文献综述)

随着社会经济的不断进步,使得国家诸多行业对计量器具的精准度要求越来越高。检定规程作为计量检定工作的技术依据,为计量器具的准确度提供保障[1],其重要作用也越发显现。为便民利企,满足社会各界便捷查阅国家计量技术规范文本的迫切需求,国家计量技术规范全文公开系统对现行有效的国家计量检定系统表、国家计量检定规程、国家计量器具型式评价大纲全文全部上线,用户可免费查阅和下载[2]

目前,国家计量技术规范全文公开系统共有988份检定规程,每一份检定规程文档动辄数十余页,从繁杂的内容中快速找到需要的信息并不容易。针对这样的问题,设计一种检定规程信息抽取系统,过滤掉无用的信息,对检定规程的关键信息,包括适用范围、检定项目、检定条件、检定方法、检定周期等信息进行提取。检定规程信息抽取系统主要利用了自然语言处理中的信息抽取(ie)技术,从自然语言形式的文档中抽取感兴趣的信息,并将其转变为结构化信息,以便用户查询和使用。

1.2 国内外研究现状

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1 需求说明和基本内容

基于nlp技术,开发一种检定规程信息抽取系统。根据用户送入的文字版pdf文档,对检定规程的主要信息,包括“使用范围”、“检定项目”、“检定周期”等信息进行提取。需完成以下功能:完成与用户交互的gui界面设计;设计实现pdf文档信息提取;通过nlp技术与深度学习技术对提取出的文本中的感兴趣信息进行抽取。

2.2 研究目标

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1-3周:查阅相关文献资料,明确研究内容,了解课题所需解决的问题。确定总体方案,完成开题报告。

第4-5周:完成英文翻译。第6-8周:pdf文档信息提取功能实现。

第9-13周:nlp信息抽取功能实现。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]曹媛媛.计量检定规程管理标准化的问题与应对措施[j].中国标准化,2019(10):175-176.

[2].国家计量技术规范全文公开系统上线试运行[j].中国计量,2018(07):7.

[3]赵京胜,宋梦雪,高祥.自然语言处理发展及应用综述[j].信息技术与信息化,2019(07):142-145.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。