全文总字数:7406字
1. 研究目的与意义(文献综述)
1.1设计目的及意义
随着电力大数据的发展,智能电网建设的展开,文本数据在其中起着重要的组成作用,有效的挖掘文本数据是智能电网深入且全面发展的的需要。电网企业经营理念的变化,电力数据增长迅速,呈现爆发性增长趋势。在这些数据中,目前只有少部分被利用,还有大多数的数据可以挖掘。这些数据中包含着电网安全运行的信息,如果可以被充分挖掘,那对电网安全运行有着重大的意义。电网的安全运行关乎着民生,所以其安全稳定的运行尤为重要。
在电网大数据中,缺陷文本这种蕴含着大量设备的历史缺陷信息的文本数据,具有极高的价值密度,和电器设备的安全运行息息相关。对于缺陷文本中的设备类型、缺陷级别、缺陷情况等关键信息进行自动分类、自动提取,还包括对于相应故障原因对应的检修方式和故障诊断,这些都是对于电网大数据处理的方向。
2. 研究的基本内容与方案
2.1研究的基本内容
本毕业设计(论文)以电力设备缺陷文本为研究对象,主要任务有:
(1)对缺陷文本数据进行数据预处理,如分词、去停用词、标注等;
3. 研究计划与安排
第一至第二周:查阅设计题目的相关资料;
第三至第四周:撰写并提交开题报告,翻译英文资料;
第五至第六周:掌握python自然语言处理的使用方法;
4. 参考文献(12篇以上)
[1]杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[j].自动化学报,2014,40(08):1537-1562
[2]王慧芳,曹靖,罗麟.电力文本数据挖掘现状及挑战[j].浙江电力,2019,38(03):1-7.
[3]邵冠宇,王慧芳,何奔腾.电网设备缺陷文本的质量评价与提升方法[j].电网技术,2019,43(04):1472-1479.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。