1. 研究目的与意义、国内外研究现状(文献综述)
意义:实体的命名实体识别能够将有关于食品安全的相关事件进行统计和分析,食品安全事件实体的标注命名实体,其作用自然是方便国家、政府、社会对食品安全进行严厉的考察,具体说来就是告诉监管者和消费者食品安全的突发事件具体在什么时候、在哪些地区、哪些机构、哪些食品容易出现问题,消费者可以减少去该地方或者减少那些食品的购买。监察者可以去相关容易发生此类事件的地方加强监管。国内外研究现状:对于命名实体标注的研究已经进行了很长时间,在各种方法上都有人不断尝试并且取得了一些成果。早在60年代,外国的学者已经开始研究英语文本部分的自动此类标注问题,提出了一些消除兼类此意的方法,建立了一些自动命名实体标注系统。目前命名实体标注的方法主要有以下三种:基于规则的方法、基于统计的方法、混合方法。从最近的研究及标注效果来看,主流方法依然是基于统计的方法。
应用前景:食品安全对社会的稳定、和谐、发展具有重要意义。我国目前正处于社会转型期,各类食品突发事件层出不穷,直接影响着社会的稳定和发展。面向网络,随着资源的积累,食品安全突发事件案例知识库会不断完善。这对未来突发事件的预测、突发事件解决预案的提供有积极的参考价值,在一定程度上可以帮助决策者了解过去、把握现在、决策未来。
参考文献:
2. 研究的基本内容和问题
研究目标:第一,根据对食品安全突发事件内涵和外延的界定以及对突发事件特征的分析,确定抽取的知识类别和所建立模型的主要内容。第二,基于文本挖掘的相应算法和机器学习模型,结合突发事件的特征,从中抽取相应的突发事件知识并完成突发事件案例知识库的构建,同时建立分类模型。
研究内容:1、借助相关的网络信息抓取工具,在公共管理、新闻传播专家学者的人工内省知识基础上,构建以食品安全突发事件案例主旨、突发事件的扩展信息、突发事件的分类信息、突发事件的分级信息、突发事件的分期信息、突发事件信息源、突发事件时间序列等字段为主的突发事件案例信息库,为突发事件的初步分析、知识库的构建和分类模型的建立奠定基础。 2、为了实现对食品安全突发事件的有效组织和分析,基于突发事件案例信息库,从突发事件中抽取了人名、地名、组织机构名、时间信息、数字信息、人物属性等突发事件的实体知识,构建突发事件案例知识库。 3、基于突发事件案例信息库和突发事件知识库,以食品安全突发事件的食品类型,借助支持向量机工具,建立突发事件分类模型。
解决的关键问题:(1)面向网络机器获取与人工筛选的结合问题。(2)食品安全突发事件的特征抽取是关键问题。(3)如何基于食品类型选取特征进行类别模型的构建也是一个问题。
3. 研究的方法与方案
研究方法:在食品安全突发事件的获取中主要使用了机器和人工内省结合的方法;而在构建分类模型的过程中使用了文本挖掘的方法。
技术路线:面向网络,主要是面向人民网舆情监测室的检测案例和中国舆情网舆情监测平台和掷出窗外这三个网站,并辅以其他门户网站,通过机器和人工结合的方法,获取食品安全突发事件;通过程序,抽取突发事件的特征知识,构建食品安全突发事件知识库;在构建的知识库基础上,借助支持向量机,以食品为主要依据,构建食品安全突发事件分类模型。
实验方案:获取食品安全突发事件;抽取事件特征;构建分类模型
4. 研究创新点
特色:现如今食品安全突发事件是一个十分敏感而且大家都十分关注的一个问题。
食品安全对社会的稳定、和谐、发展具有重要意义。
将食品安全突发事件的新闻进行命名实体识别,为以后的工作弄一个十分文山的语料库,方便以后查找。
5. 研究计划与进展
研究计划:第一阶段:研究准备阶段:文献调研和食品安全突发事件分布调研第二阶段:语料预处理阶段:将文献进行词性标注第三阶段:分析命名实体阶段:将命名实体的内部特征、外部特征进行分析第四阶段:纂写论文
预期进展:将语料进行命名实体识别并且分析标注词的内部特征和外部特征。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。