1. 研究目的与意义
研究背景:
二十一世纪是一个科技发达、信息传播迅速的世纪,科学技术的进步推动着新时代的前进和发展。如今我们生活在的是一个信息的时代,生活中的琐事都充溢着信息的元素。大数据时代的到来,引起了各界学者广泛的关注,哈佛大学社会学教授加里金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都开始这种进程”。ibm公司把大数据概括成了三个v,即大量化(volume)、多样化(variety)和快速化(velocity)。这些特点也反映了大数据所潜藏的价值(value),或许可以认为,这四个v就是大数据的基本特征。就在这样信息泛滥的时代,一些体现信息及时、准确的网络平台也就成了我们交流的工具,其中以facebook、twitter、新浪微博、微信、qq等最为著名,而微博的崛起无疑是很大的进步。
新浪微博是一个由新浪网推出,提供微型博客服务的类twitter网站。用户可以通过网页、wap页面、手机客户端、手机短信、彩信发布消息或上传图片。新浪可以把微博理解为“微型博客”或者“一句话博客”。用户可以将看到的、听到的、想到的事情写成一句话,或发一张图片,通过电脑或者手机随时随地分享给朋友,一起分享、讨论;还可以关注朋友,即时看到朋友们发布的信息。
2. 研究内容和预期目标
研究内容:
本论文是利用mongodb这种新型的nosql数据库,存储新浪微博签到数据,在arcgis中进行相关分析,包括核密度分析、叠加分析、地统计分析等,可对商圈热度等分析提供基本的数据支持和分析服务。
3. 研究的方法与步骤
研究方法:
(1)密度分析法:是通过离散点数据或者线数据进行内插的过程,根据插值原理不同,主要是分为核密度分析和普通的点\线密度分析。核密度分析中,落入搜索区的点具有不同的权重,靠近搜索中心的点或线会被赋予较大的权重,反之,权重较小,它的计算结果分布较平滑。在普通的点\线密度分析中,落在搜索区域内的点或线有相同的权重,先对其求和,再除以搜索区域的大小,从而得到每个点的密度值。
(2)叠加分析法:叠加工具集中包含的工具用于叠加多个要素类以合并、擦除、修改或更新空间要素,从而生成新要素类。将一个要素集合与另一个集合叠加时会创建新信息。共有六种叠加操作;它们都涉及将两组现有要素合并成一组要素,以识别输入要素间的空间关系。1)擦除:通过将输入要素与擦除要素的多边形相叠加来创建要素类。只将输入要素处于擦除要素外部边界之外的部分复制到输出要素类。2)标识:计算输入要素和标识要素的几何交集。与标识要素重叠的输入要素或输入要素的一部分将获得这些标识要素的属性。3)相交:计算输入要素的几何交集。所有图层和/或要素类中相叠置的要素或要素的各部分将被写入到输出要素类。4)交集取反:输入要素和更新要素中不叠置的要素或要素的各部分将被写入到输出要素类。5)联合:计算输入要素的几何并集。将所有要素及其属性都写入输出要素类。6)更新:计算输入要素和更新要素的几何交集。输入要素的属性和几何根据输出要素类中的更新要素来进行更新。
4. 参考文献
[1] 禹文豪,艾廷华, 杨敏,等.利用核密度与空间自相关进行城市设施兴趣点分布热点探测[j].武汉大学学报(信息科学版),2016,41(2): 221-227.
[2] ghosh d, guha r. what are we 'tweeting'about obesity? mapping tweets with topic modeling and geographic information system[j]. cartography and geographic information science, 2013, 40(2): 90-102.
[3] 隋正伟, 邬伦, 刘瑜, 等. 基于签到数据的城市间交互网络研究[j].地理与地理信息科学,2013,29(6): 1-6.
5. 计划与进度安排
(1)接受任务,内容理解,指导教师讲解、讨论、阅读指导教师规定的文献,撰写开题报告(2022.3.6-2022.3.13)。
(2)收集相关参数,通过网络、期刊、报纸、书籍进行相关资料搜集(2022.3.14-2022.3.20);
(3)存储新浪微博数据:利用新浪微博api爬取苏州市一定时间范围内的新浪微博poi数据,并存放于mongodb数据库中(2022.3.21-2022.3.31);
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。