1. 研究目的与意义
随着技术的高速发展和生活水平的不断提高,消费者和企业都意识到了通过位置轨迹来了解日常习惯和需求的价值,并且安装了GPS的智能手机的大量使用使得这些更容易收集。这些轨迹可以帮助我们了解日常活动;特别的是,我们可以使用位置轨迹发现异常的天和聚类相似的天,以使得更好的了解我们的日常行程。GPS定位设备的发展使得人们的出行位置轨迹可以方便的被获取,这些轨迹包含出行人员的生活习惯、消费习惯等众多敏感信息,出行者不希望为潜在的攻击者获知,需要对这些轨迹进行隐藏,隐藏的同时尽可能小的改变原轨迹数值特征,以期保护轨迹的可用价值。
2. 课题关键问题和重难点
1.对轨迹数据进行选取,并且对轨迹数据进行聚类。
2.用k-means方法将每个聚簇内轨迹的平均值代替聚簇内所有轨迹,完成匿名的处理。
3.如何定义两个轨迹距离远近的度量函数。
3. 国内外研究现状(文献综述)
随着移动设备和定位技术的发展,产生了大量的移动对象轨迹数据.轨迹数据含有丰富的时空信息,对其分析和挖掘可以支持多种与移动对象相关的应用.然而,针对轨迹数据的攻击性推理可能导致个人的兴趣爱好、行为模式、社会习惯等隐私信息暴露.另一方面,在基于位置的服务中,由于现有位置隐私保护技术并不能解决轨迹隐私泄露的问题,移动对象的个人隐私很可能通过实时运行轨迹而暴露。针对上述两种场景,轨迹隐私保护的研究提出了明确的要求:在轨迹数据发布中,隐私保护技术既要保护轨迹数据的隐私,又要保证数据有较高的可用性;在基于位置的服务中,隐私保护技术既要保护移动对象的实时轨迹隐私,又要保证用户获得较高的服务质量。
文献1中介绍了数据库系统的基本概念和术语,还介绍了关系数据库系统,包括关系数据库语言、dbms结构和数据目录、数据库的存储结构、查询处理和优化、事务管理、数据安全和完整性约束、触发电子和主动数据库、数据依赖和关系模式规范化、数据库设计、数据库管理和性能调优。
文献2中介绍了数据库技术的基本原理、方法和应用技术。包括数据库技术的由来和发展过程,数据库系统的数据模型、体系结构和全局结构等内容,关系模型的运算理论:关系代数和关系演算,关系数据库标准语言sql的全貌,关系数据库的模式设计理论,实体联系模型的基本要素、设计过程,数据库应用系统设计的全过程,数据库的管理机制,分布式数据库系统额概念,对象关系数据库的定义语言和查询语言,面向对象数据模型。
4. 研究方案
该系统首先对轨迹数据进行选取,然后将轨迹用位置坐标实体化,再通过k-means方法完成聚类,从而实现对轨迹数据的匿名处理。
k-menas方法:先从n个数据对象任意选取k个对象作为初始聚类中心,然后根据每个聚类对象的均值,计算每个对象和中心对象的距离,兵根据最小距离重新对相应对象进行划分,重新计算每个有变化聚类的均值,并重复过程直到每个聚类不再发生变化为止。
已有的k-means处理的数据点集合相当于某个时刻一组轨迹的截面。将每个轨迹看成由一组位置坐标组成从而实现对轨迹的实体化。从这些n个坐标中选取k个作为初始坐标聚类中心,根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离。并且根据最小距离重新对相应对象进行划分,再重新计算每个(有变化)聚类的均值(中心对象)。重复上述过程,直到每个聚类不再发生变化为止。
5. 工作计划
第1周:学生撰写开题报告和完成外文翻译。
第2周:指导学生进行课题总体规划和课题的详细设计。
第3-5周:指导学生进行课题模块化设计并进行模块代码编写与调试。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。