1. 研究目的与意义(文献综述)
随着网络的快速发展和广泛应用,大数据时代的到来,网络就像一个巨大的数据宝库,如何快速获取其中的数据资源成为亟待完成的新需求。然而网络上的信息资源大多是无组织并且动态变化的,光靠管理员手工去管理,很难将这些庞大,繁杂的数据进行有效的保存和利用,这就促使了网络爬虫技术的兴起。
不管是从前还是现在,商品都是我们生活中不可缺少的东西,无论是衣食住行,还是娱乐文化,我们都需要消费很多。现在网络消费的日益增多,我们接触各类商品信息不可能和以前一样,通过现实的状况了解,而这时在网上对商品的相关评价就是我们参考的重要依据,因此合适的利用网络爬虫和语义分析等技术对网络上的相关内容进行分析,对一些特定商品信息的分析对我们实际的生活很重要。
目前国际上的著名商城如亚马逊、梅西等都已经广泛的使用商品评价系统。国内的淘宝商城也提供了消费者对所购商品的评论系统,但是该系统更偏向于消费者的评论或者购物感受,因此并不能真实反映每一个商品对消费者的客观价值,对消费者的参考意义受到了比较大的局限。所以一个好的商品信息评价系统,必须要涵盖多方面的考量,才能为公众提供正确的信息。结合国际上的发展趋势,中国国内的商家不管是c2c,b2c还是b2b必将越来越多的转向与专业的商品评价系统提供商进行合作,从而为消费者提供科学的评价体系。
2. 研究的基本内容与方案
2.1 基本内容以及目标
(1)基于python语言的多线程爬虫程序,主要作用是对指定的信息进行高效的抓取。
(2)基于python和mysql的数据库后台,主要作用是存取抓取的信息。
3. 研究计划与安排
第一阶段(第1周—第3周):深入阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;
第二阶段(第4周—第10周):配置电脑,搭建电脑运行环境,初步设计算法或系统设计,分析、比较或实现等;
第三阶段(第11周—第14周):撰写论文初稿;修改论文,定稿并提交论文评审;
4. 参考文献(12篇以上)
[1]. python入门经典, (美) william f. punch, richard enbody著[2]. 美丘恩, python核心编程(第2版). 2008: 人民邮电.
[3].马特利, python cookbook (第2版) 中文版. 2010: 人民邮电出版社.
[4].python编程实践, (美) jennifer campbell ... [等] 著
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。