1. 研究目的与意义(文献综述)
中国互联网已经形成规模,互联网应用走向多元化。
互联网越来越深刻地改变着人们的学习、工作以及生活方式,甚至影响着整个社会进程。
截至2011年12月底,中国网民数量突破5亿,达到5.13亿,全年新增网民5580万。
2. 研究的基本内容与方案
本次研究的基本内容为构建一个合适的广告点击行为预测模型并实现该模型中所有相关的算法。
本次研究期望使用构建的广告点击行为预测模型对所提供的相关广告点击数据进行适当的分析,预测出每个用户在一定的时间内是否会在各监测点上发生点击行为。
并将预测结果与实际结果进行比对,以此来评判预测的准确性。
3. 研究计划与安排
(1)2016/1/11—2016/1/22:查阅参考文献,明确选题;(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;(3)2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;(4)2016/4/27—2016/5/27:撰写论文初稿;修改论文,定稿并提交论文评审;(5)2016/5/28—2016/6/7:准备论文答辩。
4. 参考文献(12篇以上)
[1]刘艺琨.基于概率图模型的数据密集型广告点击率预测系统设计与实现[D] .云南大学,2015.[2]王朝禄.基于贝叶斯网的广告点击率预测方法及实现[D].云南大学,2013.[3]李哲.基于分类模型的广告推荐方法研究[D].北京交通大学,2014.[4]王志力.云计算下Hadoop平台的搭建与实践[D].中国科技信息,2014.[5]崔文斌,牟少敏,王云诚. Hadoop大数据平台的搭建与测试[J].山东农业大学学报(自然科学版),2013.[6]谢亚鑫.基于Hadoop的数据挖掘算法的研究[D].华北电力大学,2015.[7]李小涛.基于Map-Reduce的并行聚类算法研究[D].中国地质大学(武汉),2014.[8]邓桂骞,赵跃龙,刘霖,王元华.一种优化的贝叶斯分类算法[J].计算机测量与控制,2012.[9]阿曼.朴素贝叶斯分类算法的研究与应用[D].大连理工大学,2014.[10]莱斯科夫,拉贾拉曼,厄尔曼.大数据:互联网大规模数据挖掘与分布式处理[M].人民邮电出版社,2015.[11]韩家炜,裴健.数据挖掘概念与技术[M].机械工业出版社,2012.[12]曼宁,拉哈万,舒策.信息检索导论[M].人民邮电出版社,2010.[13]Barr Valerie,Stonebraker Michael,Rofer C.A Valuable Lesson, and Whither Hadoop?[J].Communications of the ACM,2013.[14]GUNTHER NEIL J,PUGLIA PAUL,TOMASETTE KRISTOFER.Hadoop Superlinear Scalability.[J].Communications of the ACM,2013.[15]Gregory Mone.Beyond Hadoop[J].Communications of the ACM,2013.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。