1. 研究目的与意义、国内外研究现状(文献综述)
意义:近年来,随着中国现代化进程的不断加快, 交通情况变得日趋复杂。具体表现在:随着车辆和驾驶人员数量的增长,道路里程的延伸,道路交通压力大大增加,道路交通安全形势复杂,交通事故有愈演愈烈的趋势。为此国家投入了大量资金和精力,致力于改善我国道路交通安全的现状。有关部门也越来越重视对交通事故数据的收集和分析工作。公安机关交通管理部门大力推进信息化建设应用。目前,已建立全国道路交通事故信息数据库。但是分析报表列出的数据信息较为原始和平面,通过这些数据所获得的信息量仅仅是整个数据库所包含的信息量中很少的一部分。我们更加关注隐藏在这些海量数据背后的更具决策意义的交通事故数据整体特征描述、交通事故发生规律及发展趋势的预测,这些信息在预防和减少道路交通事故科学决策制定的过程中具有参考价值。利用数据挖掘技术可以找出潜在的深层规则和数据模式,从而提供决策支持。本文以道路交通系统为基础,以事故产生机理为起点,将交通事故综合分析模型应用于道路交通事故的预防中。
国内外研究状况: 由于我国快速发展,各种汽车数量猛增,交通事故的管制就比较重要。所以,针对交通事故发生的原因的问题就有诸多探究。国内的研究状况主要是以下几个方面。在早期,交通事故成因的关联分析多用灰色关联分析,如:周伟(1993)在分析交通安全影响因素的基础上,利用灰色关联分析技术,对西安市道路交通事故的成因进行了系统地分析;柴涛等(1998)运用灰色系统理论中的灰色预测和关联度分析,根据太原市近几年交通事故的统计情况,对太原市1996-1998年3年中交通事故数值进行了计算预测,并且对影响太原市交通事故的诸因素与交通事故进行了关联度分析,从而确定因素间的主次关系,以便于交通部门抓住重点、减少事故。最近多用数据挖掘中关联规则的apriori算法研究交通事故发生原因的关联分析,江山、宋柯(2019)等提出将灰色关联分析与关联规则的apriori算法相结合的方法,并将其运用于rta数据;赵妍(2018)在《apriori改进算法在交通违法数据分析中的应用研究》中通过对研究交通违法信息数据的需求分析,说明对违法数据进行挖掘分析的必要性,apriori算法是经典的关联规则挖掘算法,分析其基本思想及实现步骤,发现apriori算法在寻找频繁项集时产生大量候选项集,并且重复多次扫描数据库,造成算法执行效率不理想。因此,针对其性能上的缺陷,通过删除无意义的数据项压缩数据集大小并且对频繁项集进行剪枝有效减少候选集的数量,提出了改进算法——r apriori算法;黄常海、高德毅等(2014)基于apriori算法对船舶交通事故数据进行关联规则分析,挖掘事故间的强关联规则。对所挖掘出的强关联规则进行分析,发现事故致因因素间的潜在关系,之后马建斌(2017)针对当前各海事局事故调查的统计格式和描述不统一的问题,以浙江海事局统计数据库为例,对原始数据库进行梳理与清洗,建立了标准化的海事事故信息数据库;并将海事事故的原始统计信息与描述进行变换、编码。同时,采用数理统计的方法,从人、船舶货物、环境、管理四个方面识别出各致因所占的比例,初步探究了海事事故致因因子及影响程度。为进一步研究海事事故各信息之间的定量关系,通过基于动态存储空间的改进apriori算法、k-medoids和改进apriori组合挖掘算法模型对标准数据库中的信息进行深度挖掘。在支持度阈值20%、置信度阈值50%的条件下提取出8条碰撞事故的关联规则;在支持度阈值10%、置信度阈值50%的条件下提取出12条非碰撞类事故的关联规则。 graves(2001)分析了欧洲道路交通事故,通过研究交通事故和道路设施状况间存在的关联找出了每个路段相关设施中极易诱发安全事故的因素,其研究成果为该地区的道路安全建设以及事故预防提供了很大的决策支持。pande 和 abdel-aty(2009)对美国一个州的直行道路所发生的安全事故案例做了系统的分析,通过对不同影响因素和交通事故间的联系的分析得出了导致道路交通事故的因素主要是道路照明条件不足。liling li 等(2017)通过 apriori 算法的启发式关联规则,用朴素贝叶斯分类器建立分类模型,并通过简单的 k-means 聚类算法生成簇。在统计、关联规则、分类模型和聚类的基础上,提出了一些能有效预防道路交通事故的方法与建议。前两年,西方国家例如英国、法国等通过对一些重要城市的四个季度交通事故案例库进行关联分析挖掘研究,得到在早上7点到10点,驾驶速度越快越容易出现事故;晚上 8 点到 9 点这一时段最容易发生非机动车和行人的交通意外。北美国家如美国、加拿大曾联合运用了 fp-growth 的关联算法对城市智能交通体系进行了研究,最终找到了一个优化交通管理的可行方案。
应用前景:
2. 研究的基本内容和问题
研究目标:
分析某地区交通事故发生因素的关联分析,用数据表示各因素之间的关联度,找出导致交通事故发生的最高相关的因素。
研究内容:
3. 研究的方法与方案
研究方法: 本文所用的方法是主要是关联分析中的apriori算法,希望通过将apriori算法与灰色关联分析方法等结合,实现对apriori算法的改进,提高计算的速度和精度。技术路线:
apriori算法的实现:
4. 研究创新点
特色或创新之处: 本文研究的特点是把关联规则应用到交通事故中,具有一定的现实意义。
在试验过程中会对基于简单关联规则的Apriori算法做一些改进,基于灰色关联分析可以提高算法初期搜索数据的速度。
5. 研究计划与进展
研究计划及预期进展:2020年10月23日——11月15日 确定选题、收集相关资料2020年1月9日——2月15日 撰写开题报告2020年2月20日——3月15日 开题、撰写中期材料2020年3月20日——4月1日 调查和寻找所需的数据2020年4月2日——5月1日 数据输入、汇总和处理,形成写作提纲2020年5月2日——5月24日 论文写作及修改2020年5月27日——6月1日 完成毕业论文并定稿打印2020年6月 参加论文答辩,并提交论文
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。