基于CRF算法的商品实体命名识别研究开题报告

 2021-08-14 02:09:14

1. 研究目的与意义(文献综述)

1.1研究目的及意义

近年来,随着互联网和信息产业的迅猛发展,大量的社交网站和论坛(新浪微博、豆瓣、百度贴吧等)依托于互联网的开放环境也得到了快速发展。人们通常会在这些网站和论坛上参与新闻、体育、娱乐和电子产品等主题的讨论。同时,他们也喜欢评论自己使用过的一些产品并分享自己的使用体验。

正是由于这些特点,许多产品公司在社交网站和论坛上推广它们的产品和服务,并且希望通过监控公众对于它们产品的评论,尤其是负面评论,来掌握公司的市场口碑。这些用户的意见和讨论也能够使产品供应商更好地了解消费者的要求或顾虑,进一步提高他们的产品质量和营销战略。对于广告公司,它们可以了解到消费者的喜好,具有针对性地向他们推荐产品,以优化他们的广告系统。然而,由于信息的爆炸性增长,人工寻找定位信息的可能己经相当有限,运用计算机技术成为必然趋势。自然语言处理作为信息定位的前提被提出以后,如何利用这项技术快速准确地找到有用的信息已经成为现在亟待解决的问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1研究的基本内容和目标

了解学习自然语言处理、特征提取、机器学习的基本原理和方法,学习编写网络爬虫程序搜集包含智能手机信息的语料,构建一个高质量的智能手机实体识别语料库。学习文本挖掘中的商品命名实体识别算法,研究表示智能手机相关实体的语法、语义等特征,对训练的例句进行标签并利用机器学习算法训练识别器。最后,使用基于crf算法的识别器,对输入的每一句包含商品实体信息的句子,实现一个能够抽取出该句子所表达的商品品牌名、系列名的简易演示程序。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1周—第5周:查阅相关文献资料,明确研究内容,了解研究所需。确定方案,完成开题报告。

第6周—第9周:搜集包含智能手机信息的语料,研究表示智能手机相关实体的语法、语义等特征,提出一种基于crf算法的机器学习模型训练识别器。

第10周—第13周:对商品实体命名识别器体系结构及相关数据进行试验研究、性能评价、模型完善。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]史海峰.基于crf的中文命名实体识别研究[d].苏州大学,2010.

[2]梅丰.产品名实体识别及规范化研究[d].哈尔滨工业大学,2011.

[3]杨献祥.面向中文微博的产品名实体识别与规范化算法设计与实现[d].北京理工大学,2015.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。