基于数据挖掘技术的电影推荐可视化系统设计与实现开题报告

 2022-08-04 09:36:53

1. 研究目的与意义

随着我国互联网产业的不断发展和移动互联网的迅速普及,每天都有大量的文字、图片、视频等内容被上传到互联网上。

泛滥的资源在满足我们信息需要的同时也让我们陷入信息过载的困境。

与此同时,我国的电影行业也获得了跨越式的发展,无论是观影人次还是电影产出数量都有了很大的提高。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

研究内容:使用爬虫爬取影评网站上的电影信息并分类存入数据库,依次爬取每部电影评分、简介、所有影评、影评作者信息等数据,存入数据库。

对爬取的影评数据进行数据清洗,通过情感分析算法判断影评的情感倾向。

使用k-means聚类算法模型对电影归类,用于相似电影推荐。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

数据获取方面,无论是国内还是国外,获取网站数据都有两种方法:利用网站提供的api(应用程序编程接口)获取;利用爬虫获取。

如果我们仅仅需要影评数据可以通过申请api的方法完成,但是由于我们需要影评来源用户的个人简介等网站不提供的信息,并且通过api获取信息受限制较多,所以大部分研究者都采取网络爬虫来获取数据。

在可视化技术方面,在国外,可视化技术研究相当成熟,比如wanner等设计了可视化系统foravis。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

2022-11-16至2022-11-24:与导师交流并确定选题,根据选题查找相关书籍、期刊等,完成综述的撰写。

2022-11-25至2022-12-31:论文方面,系统整理与毕业论文有关的所有资料,形成论文思路,撰写毕业论文开题报告,并完成论文的结构和框架;系统设计方面,进行系统需求分析,做好基础的数据准备及技术准备工作,构思系统的功能模块及整体框架。

2022-01-01至2022-02-28:在导师的指导下,完成系统基础模块及论文初稿,并通过导师检验。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1]姜强,赵蔚,李勇帆,李松.基于大数据的学习分析仪表盘研究[J].中国电化教育,2017(01):112-120.[2]付长军,乔宏章.大数据可视化技术探析[J].无线电通信技术,2017,43(05):1-5.[3]严婷,文欣秀,赵嘉豪,王家辉,杜傲,白瑞杰.基于Python的可视化数据分析平台设计与实现[J].计算机时代,2017(12):54-56.[4]周君,贾昆霖,蓝机满,宋艳.基于Django框架的智能图书推荐系统[J].电子科技,2018,31(12):78-80 85.[5]王婧雅. 微博数据挖掘可视化系统的设计与实现[D].吉林大学,2017.[6]吕博庆. 基于爬虫与数据挖掘的电商页面信息分析[D].兰州大学,2018.[7]徐欣威.基于ECharts的科技统计数据可视化设计与实现[J].天津科技,2019,46(03):66-70.[8]Blonder Niksa,Orsburn Benjamin C,Blonder Josip,Gonzalez Carlos A. Visual mass-spec share (vMS-Share): a new public web-based mass spectrometry visualization and data mining repository.[J]. Journal of proteomics amp;amp; bioinformatics,2019,12.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。