1. 研究目的与意义、国内外研究现状(文献综述)
古文命名实体识别意义
作为古汉语信息处理的重要研究内容,实体的识别能够帮助了解古汉语中的重要人物和人物所经历的历史事件,通过对人名、地名和时间的识别帮助确定了历史人物所经历的历史事件是不可多得的历史资料。另一方面,通过对古文信息的命名实体识别可以帮助比较古代汉语和现代汉语之间的相同点和不同点,促进了古文信息实体的实际作用的研究。
古文命名实体识别相关研究
2. 研究的基本内容和问题
bert在现代汉语的识别任务中有很好的效果,但是在古文识别方面,因为古文与现代汉语的差异性对bert在古文识别上的效果持保留态度,在俞敬松等人[6]的研究中显示了bert在古文自然语言处理中的良好表现,所以判断本次实验使用bert作为基本模型具有可行性。
研究目标
本研究中使用bert对古文进行命名实体识别,在基于现代汉语的bert模型的基础上预计bert模型对古文能否进行很好的命名实体识别效果。
3. 研究的方法与方案
研究方法
google开源的bert模型实现了古汉语文字向量的构造。bert彻底改变了预训练产生词向量和下游具体nlp任务的关系。bert在nlp领域的多个方向大幅提高了自然语言处理水平,基于这种技术对古文信息进行命名实体识别大大提升了实验中的f值。
4. 研究创新点
本文使用的BERT模型时2018年google提出的一种用于自然语言处理领域的模型,本研究是基于BERT模型的微调,实验的创新之处在于将古文文本的实体识别和BERT模型结合。
5. 研究计划与进展
在2019年11月到12月之间完成实验,实验完成后于2019年12月到2020年4月之间准备毕业论文。预计在2020年1月中旬完成论文整体框架编写,2020年3月中旬完成论文的详细内容,4月中旬根据指导老师意见完成论文。目前论文基本内容和结构已经确定,已经根据指导老师意见进行论文的一次修改。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。