1. 研究目的与意义
中国经济的迅速发展使人们的需求由吃饱穿暖转向更高的生活质量。
互联网逐渐变成大家生活中不可或缺的部分,无聊时看一部电影便是人们的消遣方式之一。
然而网络上的数据井喷似的增长,使得许多人在想看电影放松一下时又对数不胜数的选择犯了难。
2. 课题关键问题和重难点
本课题的难点在于,首先要能熟悉掌握并运用python语言,而python作为一门相对较新的语言,能收集到的资料较少且权威性、正确性难以得到充分保证。
其次对于爬虫技术,相对大学课程来说,则更是一项新鲜但不简单的技术。
若想完成大量数据的整合、处理、分析,那么爬虫技术便是首选,而python语言则是实现爬虫技术的最佳选择。
3. 国内外研究现状(文献综述)
根据《中国互联网络发展状况统计报告》, 到2019年6月为止,网民规模达8.54亿,较2018年底增长2598万,普及率为61.2%,较2018年底提升1.6个百分点。
互联网的普及使得网上的信息资源呈现爆炸式增长,大数据时代的到来,对如何在短时间内从网页中找到用户需要的信息提出了挑战,在这样的需求之下,网络爬虫技术应运而生。
而基于python爬虫技术的电影论坛数据分析,可以针对用户需求,爬取大量电影相关数据,并产生细化的搜索结果。
4. 研究方案
设计方案:1.查阅相关文献深入了解课题主旨以及设计的思路;2.学习、掌握Python语言,完成Pycharm及Python爬虫框架工具的安装、配置;3.完成程序的需求分析,用以确定各个类的基本功能,建立项目规划完成结构设计;4.设计程序类,完成相关类的代码编写;5.进行程序测试,检查错误并修改以完善程序;6.将各个类的分析设计结合下来,整理成文档。
5. 工作计划
本课题主要研究基于python的电影论坛数据分析,在整个过程中主要完成以下工作:1.了解目前电影资源网站的发展现状和趋势,研究分析程序的目标定位。
2.深入探索研究本课题所涉及的相关技术和理论知识,采用软件工程的指导思想,分析程序的实际需求,并以此进行程序的总体设计。
3.根据需求分析与总体设计,实现基于python的电影论坛数据分析程序的开发,运用pycharm工具开发程序。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。