基于社交媒体文本的隐式情感分类研究开题报告

 2022-01-13 20:36:22

全文总字数:3245字

1. 研究目的与意义(文献综述)

现今互联网发展迅速,在各个网络平台上,用户发表大量的言论。针对海量的文本数据,通过对其的分析进而能挖掘出更多价值。文字是情感的载体之一,通过对文本分析可以挖掘出用户隐藏在文字中的情感。人们在网络平台中,语言表达大多简短且并不规范。透过简短的文字,所表达的情感却十分丰富,在对种种修辞形式描述过的文本就是用户最初的情感进行加工包装的成品。如果可以对海量的用户评论信息进行研究,寻找出人们对于各种人物、事件、产品等等的情感倾向,诸如褒义、贬义之类的情感,通过数据的整理统计,就可以直观清晰的了解舆论对于具体事物的看法和观点。如果对用户进行分类还可以了解到具体的用户群体对于某一事物的看法。这一研究对舆情的采集和控制,商品的推广改进等等都有着重要的意义。

随着互联网各大平台的飞速发展,平台用户越来越多,随之产生的海量数据如果全部采用人工方式进行鉴别其表达的情感,其需要的人力,时间是极其巨大的,因其巨大的成本开销人工鉴别显然是一项不可能完成的任务,其借助于计算机是必然的选择。对于文本的情感分析,即对含情感色彩的主观性文本进行分析、处理、归纳和推理。最初的情感分析是对带有情感色彩的词语的分析,利用简单的情感词进行分类,如褒义词,贬义词。现如今针对海量的文本数据,情感分析的研究更加深入,按照处理文本粒度不同展开不同层次的研究。然而中文作为一种表意体系的文字,其表意性使汉字成为世界上单位字符信息量最大的文字。中文是典型的分析语言,人工阅读时其文字容易辨识,利于联想。但其组合灵活多变,理解上具有多意性并且修辞丰富多样,这些对于机器进行中文文本的情感分析来带了诸多困难。特别是表达层面上的隐式情感的分析,相较于取得不少成果的显示情感分析,隐式情感因为其表达更加隐晦和含蓄,在自然语言处理中已是难题之一。

进行情感分析研究中,技术不断变化。传统的情感分析方法一是基于规则和基于统计的方法从语言学角度编写情感词典或模板,一是基于统计方法利用机器学进行特征提取并构建模型进行判断。随着深度学习的发展,基于神经网络的自特征抽取的词向量表示法也应用在情感分析中。对于采用不同技术的隐式情感分类模型进行研究和评判对于其进一步的研究有着重要现实意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基本内容:

一、以第八届全国社会媒体处理大会(smp2019)"拓尔思杯"中文隐式情感分析评测公布的数据集为研究基础,对中文隐式情感分类任务进行调研,采用python语言完成训练集、验证集和测试集的划分。

二、采用word2vec技术训练中文词预训练模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

2020/1/13-2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告

2020/3/1-2020/4/30:系统架构、程序设计与开发、系统测试与完善

2020/5/1-2020/5/25:撰写及修改毕业论文

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 廖健. 基于表示学习的事实型隐式情感分析研究[d].山西大学,2018.

[2] mikolovt , chen k , corrado g , et al. efficient estimation of word representations invector space[j]. computer science(cs), 2013.

[3] wawres v, deshmukh s n. sentiment classification using machine learningtechniques[j]. international journal of science and research (ijsr), 2016,5(4): 819-821.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。