基于Twitter情感分析的美国总统大选预测分析开题报告

 2022-08-15 09:16:40

1. 研究目的与意义

最近几年,社交媒体在现实政治中的作用日益凸显。社交媒体可以被用来组织和动员大规模的政治运动,社交媒体上甚至还形成了一些全新政治党派。当然,社交媒体对于政治最大的作用还是在于民意的表达上,而这为研究者提供了观测民意、观测重大政治事件走向的机会。传统的预测大选支持率以及投票结果的方法是民调。进入大数据时代以后,研究者们希望通过更多样的数据来源来补充传统民调的结论,于是社交媒体就进入了他们的视野。利用社交媒体上的数据来观测大选结果有许多优势,比如低成本、高效率以及能够进行实时动态观测。以往利用社交媒体进行选举预测的方法还比较简单,很多研究者仅仅是通过统计社交媒体中某一候选人被提到的次数、有关推文的数量、粉丝的数量或者点赞数量来预测不同候选人的支持率。在有些情况下,这种预测也是有效的,但这种方法无法考虑到日常对话中各种复杂的语境,比如讽刺、双关、幽默,还极易受到无关信息的误导,因此在大部分时候其对选举的预测结果尚不够准确。在如今政治格局变化迅速的格局下,加上全球新冠疫情的影响,通过社交媒体观察并预测政治影响的重要性更加突出。

本选题通过对推特文本进行情感分析,结合COVID疫情趋势分析美国大选,并预测其结果不仅对文本情感分析技术有重要实践意义,而且丰富了社交媒体对政治影响的现实考察意义。

2. 研究内容和预期目标

研究内容:基于推特文本情感分析和COVID趋势预测美国大选

拟解决的关键问题:1)对推特文本进行数据清洗、分词、关键词提取和文本情感分析2)利用COVID疫情发展趋势以及严重程度建模,分析各地区选民对候选者的支持态度3)如何训练模型并预测分析

写作提纲:1)选题背景2)技术算法分析3)数据预处理4)构建训练模型5)预测分析结果6)总结

3. 国内外研究现状

文本情感分析研究资源建设:目前人工构建情感词典主要收集褒贬情感词语,在英文方面,哈佛大学gi情感词典。在中文方面,大连理工大学的情感词汇本体将情感分为7个基本大类和21个小类收录情感词语27466条。

国内外研究现状:国内的徐琳宏、林鸿飞通过手工和自动生成的方式构建出情感词典本体库,提取了影响句子情感的9个语义特征,对情感分析研究做了初步的探测。李钝、曹付元等基于语言学的角度,根据中心词对短语的情感倾向的影响效果,提出了以中心词为基础的情感倾向计算方法。近年来,闻彬等提出基于文本语义的文本情感分类,分析了文本情感倾向是否受到程度副词等出现规律的影响,进而提高了有效判走情感倾向算法的性能。随着研究的深入,学者在对情感分析算法进行改进的同时,也将其应用到不同的行业中进行了实践,如赵妍妍等、王素格等,都取得了不错的成果。他们分别通过自动获取句法路径来描述评价对象和评价词语之间的关系的方法和基于情感词粗糙隶属度的文本分类方法将情感倾向分析应用到了电商评价和汽车评价预测上。

国外turney等使用点互信息的方法扩展了正负面情感词典,在分析文本情感时使用了极性语义算法,处理通用的语料数据时达到了74%。在近些年的研究中,miao等以之前的研究为基础,实现了一个基于特征级别的分析,阐述了一个对产品评论的四元组抽取概念narayanan等结合各种特征及其相关联信息,提出了一个基于分句、结果句和整句的分类方案,获得了很好的效果。pang等用机器学习的方法以积极情感和消极情感为文度,对电影评论进行了情感分类。他分别采用了支持向量机、最大熵、朴素贝叶斯算法进行分类实验。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

2022-01-01至2022-02-01:完成初步设计

2022-02-01至2022-03-01:完成项目设计以及完整的代码开发

2022-04-01:完成论文初稿

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1]胡翔宇. 在线社交网络的用户倾向挖掘[d].电子科技大学,2018.

[2]鹿鹏.文本情感分析的研究现状与展望[j].广东科技,2017,26(06):88-90 87.

[3]拥措,史晓东,尼玛扎西.短文本情感分析的研究现状——从社交媒体到资源稀缺语言[j].计算机科学,2018,45(s1):46-49 68.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。