1. 研究目的与意义(文献综述)
数据挖掘是在大型数据库存储中自动发现有用信息的过程。数据挖掘技术用来探查大型数据库,发现先前未知的有用模式。随着大数据时代的到来,数据量已经变得极其庞大。数据挖掘的作用非常重要:日常生活中,各个方面的数据混杂在一起,数据看起来毫无规律,而数据的背后隐藏了很多有用的信息,企业或者机构甚至个人可以通过某种手段去发掘其背后的规律,发现数据背后隐藏的秘密,从中找到商机。数据挖掘是一种很好地解析数据背后隐藏的信息的手段,通过挖掘找到问题的突破口,让杂乱的数据变得有用,然后针对不同的目标做出相应的商业策略,向用户准确地推送对其有用的信息,使相应的网站更加智能、高效,网民能够获取更多有用的信息。
目前不论是国内的互联网公司还是国外的互联网公司,都具有相关的大数据部门专门负责对海量数据进行处理、对大数据进行挖掘,从海量的数据中寻找有用的信息,对用户进行更加精准的把控,向用户推送更加有效的信息,使用户寻找信息更加方便便捷,企业对数据流能够更好的统计分析。一方面提高了商业效率,减少了人力成本,使原本需要花很大的人力物力财力才能解决的任务变得更加智能化,高效化,同时也给广大网民节约了网上盲目冲浪的时间,使网民能够在更短的时间内获取更多有效的信息。
现在互联网已经普及农村,上网已经成了人们必不可少的一部分。广大网民可以在互联网这个虚拟世界里面上干一些平常的事情,社交网站应运而生。由于互联网可以通往各个联网的角落,因此随着用户量的增加,会使数据聚集,使存储在社交网站服务器上的数据日积月累变得越来越庞大。就拿社交网站来说,比如新浪微博、twitter等,每个用户可以在相应的网站注册帐号,在该网站上添加好友,在自己的空间里面发表文章或者段子,并让好友看到,或者转载别人发表的微博分享与好友。这就建立起来一个广大的社交网络,随着好友越来越多,整个网络也会越来越大,社交圈也就会越来越广,数据也会越来越庞大,这些数据带来的附加信息也会越来越多,企业可以通过对这些数据的挖掘获取更多有用的信息,对用户做出更加精确的数据推送,达到自己的某种目的,比如赚取利润。
2. 研究的基本内容与方案
(1)系统功能
①通过相关网站api与该网站建立连接
②探索热门话题
③搜索社交网站相关的内容,比如twitter的推文
3. 研究计划与安排
⑴2016年1月11日--1月22日:查阅参考文献,明确选题;
⑵2016年1月23日--3月7日:进一步阅读文献,分析和总结;确定技术路线,完成并提交开题报告;
⑶2016年3月8日--4月26日:需求分析,算法或系统设计,分析、比较或实现等;
4. 参考文献(12篇以上)
[1](美) Wesley J. Chun. Python核心编程[M].北京:人民邮电出版社,2014
[2] Mark Lutz.Python编程[M]. 北京:中国电力出版社,2014
[3] (美)Mark Lutz and David Ascher.学习Python[M]. 南京:东南大学出版社,2014
[4] (法) Julien Danjou. Python高手之路[M]. 北京:人民邮电出版社,2015
[5] Matthew A. Russell.社交网站的数据挖掘与分析[M]. 北京:机械工业出版社,2015
[6] Jérme Kunegis The slashdot zoo: mining a social networkwith negative edges[M]. 2014
[7] Pawel Sobkowicz,Michael Kaschesky Opinion mining in socialmedia: Modeling, simulating, and forecasting political opinions in the web[M].2015
[8] Tom Gruber Collective knowledge systems: Where theSocial Web meets the Semantic Web[M]. 2014
[9] José Carlos Cortizoa,Francisco M. CarreroaJosé María Gómezb Introduction to the Special Issue: Mining Social Media[M].2015
[10] Christian Crumlish, Erin Malone.社交网站界面设计[M]. 北京:机械工业出版社,2014
[11] 李德奎.社交网站用户群细分研究[M]. 中国财政经济出版社,2014
[12] (美) 梁.Python语言程序设计[M]. 北京:机械工业出版社,2015
[13] (爱尔兰) Igor Milovanovic. Python数据可视化编程实战[M]. 北京:人民邮电出版社,2014
[14] Wes McKinney. Python for data analysis =: Python 数据分析 /[M].南京:东南大学出版社,2013
[15] MichaGorelick, Ian Ozsvald. 高性能Python[M]. 南京:东南大学出版社,2015.
[16] 刘勘.可视化数据挖掘技术[M].长春:吉林大学出版社,2011.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。