全文总字数:4666字
1. 研究目的与意义(文献综述)
1.1研究目的
在互联网大数据时代,文本信息的数量已经远远超出了人工处理的极限,自动摘要技术的研究显得越发迫切和重要。自动摘要技术可应用在广泛的领域内,如推荐系统、新闻行业;别是在信息安全领域,舆情监控系统直接处理社交平台的评论信息会给系统带来极大的压力,如果在保持原有主要信息不变的情况下,经过信息压缩后再交给监控系统,就能适当地减轻监控系统的计算负担。
自动摘要旨在帮助减少内容,从而保留关键信息并过滤文本的不相关部分。自动摘要问题按照实现方式可以分为抽取式和生成式。抽取式是将原文中已存在的重要句子抽取出来拼凑在一起作为摘要;生成式则是要通过语义理解技术理解文章主旨,再使用自然语言技术生成新的句子作为摘要。可见,抽取式摘要的特点是实现难度低、摘要句的生成过程简单,但摘要句可能出现上下文不匹配的问题;生成式摘要虽然实现难度高,但其生成摘要句的过程更加拟人化,生成的摘要自然、质量高、语句通顺。
2. 研究的基本内容与方案
2.1 研究目标
设计一个面向新闻领域的基于深度学习的单文档自动摘要算法,即从一篇新闻中总结出全面、准确的反映原文信息的句子作为其摘要。
2.2 研究内容
3. 研究计划与安排
(1)2020/1/13—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2020/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2020/5/1—2019/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1]刘家益,邹益民.近70年文本自动摘要研究综述[j].情报科学,2017,35(07):154-161.
[2]n. nazari, m. a. mahdavi. a survey onautomatic text summarization[j]. journal of ai and data mining,2019,7(1):121-135
[3]柳斌. 基于深度学习的中文自动摘要生成[d].南京邮电大学,2019.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。