百枢纽通航投资有限公司 广西百色 533000
摘要:近年来,越来越多的研究者将深度学习应用于交通事故预测,本文对基于深度学习的交通事故预测做了简要介绍,将研究者对交通事故的探索过程进行梳理,着重介绍基于TA-STAN框架、STCL-Net框架、ST-RiskNet框架的交通事故预测模型,最后提出基于社交数据的交通大数据获取、数据零膨胀问题的研究和以安全为导向的交通诱导三个方向。
关键词:交通事故预测;深度学习;TA-STAN;STCL-Net;ST-RiskNet
一 引言
交通事故指在特定环境下由于人、车、路、环境四要素的配合失调的综合反映[1],对生命财产产生危害的事件,根据事故的大小一般分为轻微事故、一般事故、重大事故、特大事故[2]。由于交通事故的发生具有不确定性和极大危害性,所以对其的预测尤为重[1]要,特别是对交通事故的防治、城市规划以及道路交通规划和管理有着极其重要的意义。
交通事故发生在特定的时间和空间,因此会受到时间和空间两个要素的影响。近年来,随着大数据和智能算法的快速发展,越来越多的研究者使用大量数据集和深度学习的方法对交通事故的发生进行预测。
基于时空特性对交通事故预测采用深度学习建模主要分为两种方式,一种是单一的应用时间或者空间特性对交通事故的预测。如TARPMLR模型[3]利用循环神经网络(Recurrent Neural Network,RNN)获取交通事故在时间维度上潜在的相关性;SDCAE模型[4]使用卷积神经网络(Convolutional Neural Network,CNN)来获取相邻区域间的空间相关度。
另一种是结合时空双重特性对交通事故进行建模预测,一般情况下是同时使用循环神经网络和卷积神经网络对交通事故的时间、空间的相关性进行建模研究,如Hetefo-ConvLSTM模型[5]。
上述模型均较为理想,无法综合考虑天气、交通流量、路况等影响因素;相似类型交通事故在时空差异较大的情况下难对比;由于交通事故发生的小概率,预测值会集中在零值附近,这被称为数据的零膨胀问题[6]。为解决这些问题近年有研究者提出一种融合局部和全局时空特征网络[7](Local and Global Spatial-Temporal Networks, ST-RiskNet)的交通事故风险预测模型。
随着自动驾驶技术的纵深发展,通过传感器探测的实时数据结合深度学习算法的交通事故风险预测也成为一个研究的热门,这项研究的发展有助于自动驾驶车辆更好的适应道路环境,在这方面有基于CNN的交通事故风险预测算法[8]和处理海量数据更加稳定的Adaboost算法[9]。对于自动驾驶车辆来说,交通事故预测算法复杂度、稳定性以及精确性要求更高一些。
在最新的交通事故预测研究中,大量研究者使用深度学习探索高维数据中的复杂结构,对交通事故预测来说,深度学习可以更好的探究到多元异构数据对风险动态的影响[10]。
二 国内外研究现状
交通事故的影响因素分析和预测一直以来都是交通领域研究者关注的重点,对交通事故的研究主要集中在交通事故影响因素的研究,基于统计学的交通事故预测的研究和基于大数据和深度学习的交通事故预测的研究。各自研究现状如下。
(一)交通事故影响因素研究现状
美国在上世纪有世界上最多的车辆保有量,在交通领域的研究早期以美国为主,最早对交通事故影响因素的研究可以追溯到1988年[11],Jovanis等通过美国卡车事故数据得到疲劳驾驶是交通事故发生的最主要影响因素之一;1990年Joshua[12]通过使用多元线性回归和泊松回归分析美国卡车事故数据集得到交通流量和车辆间的速度差也是导致车辆事故的影响因素。
Ivan等[13]在2000年研究了车流密度、土地利用和光照对交通事故发生的影响。Eisenberg等[14]在2004年通过使用负二项回归发现交通事故和降雨量之间具有正相关关系。
敖曼等[15]在2011年的研究表明极端天气也是导致交通事故发生的重要原因。
(二)交通事故预测研究现状
早期对交通事故的研究主要集中在影响因素方面,这些研究虽然有助于我们理解交通事故的发生机理,对道路设计和车辆安全性能的改进有一定作用,但对交通事故的预测作用较小。随着统计学的发展,越来越多的研究者采用统计学的方法对交通事故进行了预测。
最早是Miaou等[16]在1994年使用泊松分布和二项分布来仿真交通事故的发生频率,随后Qin等[17]在2004年使用零膨胀泊松表明年平均日交通流量和交通事故的发生具有非线性关系。
(三)基于深度学习的交通事故预测研究现状
统计学在交通中的应用主要集中于交通流的仿真,利用深度学习在交通事故预测领域中的应用很早就有进行。国内最早的是李娟[18]使用BP神经网络预测交通事故量。在李娟的研究基础上秦利燕等
[19]2014年使用基于遗产算法的神经网络模型对交通事故进行预测,相较于BP神经网络预测的精度有所提升。Huang等[20]2017年通过改进神经网络的径向基函数更好的拟合出单一地点发生交通事故的频次。
Yuan等在2018年使用Conv-LSTM[21]合并交通事故发生时的时空特征,通过交通量、道路情况以及环境等大量多元异构数据构建了一个基于深度学习的模型来探索交通事故的发生规律。
朱磊等[10]在2016年提出了一个包含时空注意力机制的深度学习框架TA-STAN,以对城市中交通事故风险进行预测。
包杰[22]在2019年提出了一种基于时空学习的深度学习网络(Spatiotemporal Convoltional Long Short-Term Memory Network,STCL-Net)交通事故预测模型。该研究弥补了此前研究中城市路网曝光度不准确、城市出行混杂、传统模型缺乏空间自相关性和动态评估不足的缺点。
王贝贝等[7]在2020年提出了一种考虑融合局部和全局时空特性的交通事故风险预测模型(ST-RiskNet),该模型的优点在于可以融合事件、天气、交通流等多元因素,探索局部相似区域和全局事故发生时的时空相关性,对交通事故的预测有更强的预见性。
三现有模型特点分析
(一)基于TA-STAN的深度学习交通事故预测模型
TA-STAN是在深度学习传统模型的编码器-解构器上加入了空间注意力和时间注意力机制,编码器-解构器是一种在深度学习中完全端到端学习的模型框架[23]。在该模型中使用了带注意力机制的编码器-解码器,注意力机制是Bahdanau[24]在2015年提出,是通过计算编码器中不同隐藏状态对解码器隐藏状态的注意力系数,将编码器和解码器的隐藏状态对齐,使解码器在运行RNN的时候不同时间片有不同的上下文信息。
一般而言,交通事故的发生是基于多种因素的,本模型采用交通事故数据、交通流量数据、外部环境数据如天气,道路设计等。本模型设置了局部空间注意力机制、全局空间注意力机制和事件注意力机制[29]。
基于TA-STAN的深度学习交通事故预测模型首先按照时间维度和空间维度统计出与交通有关的多源异构数据;第二步学习本地时序变化和周围地区的时空影响;第三步使用时间注意力机制和外部特征进行时序预测。
基于TA-STAN的深度学习交通事故预测模型最大的特点是采用了三种不同的注意力机制,融合了外部环境因素,相较于以前的模型,该模型在精度上有较大的提升。
(二)基于STCL-Net的深度学习交通事故预测模型
基于STCL-Net的深度学习交通事故预测模型主要是针对现有城市交通路网传感设施稀疏导致的交通曝光度不足,致使事故风险模型的不准确;现有模型中所有出行混杂,无法剥离由于交通类型不同造成的模型的准确性;由于在城市交通中,事故发生的影响因素大多数具有强空间自相关性,传统模型对此考虑较少;现有模型倾向于从长期、平均对交通事故做静态的评估而不是对实时的交通事故风险进行判别。
早期的交通短时事故风险研究集中在高速公路和城市快速路中[25],这是由于高速公路和城市快速路数据采集设施相对充足。基于STCL-Net的深度学习交通事故预测模型为解决这一问题,采用社交媒体数据和浮动车数据,克服城市交通曝光度低的问题。
STCL-Net针对城市路网短时交通事故预测主要涉及三类解释变量,一类是短时间内空间上变化但不随着时间变化,如人口、土地利用等;二类是短时间内随时间变化,但不随空间变化,如天气等;第三类是既随空间变化又随时间变化的变量[27],如事故风险、出租车出行等数据。
STCL-Net框架通过利用出租车和网络社交数据等非传统交通数据的使用,弥补了交通事故预测中经常出现的数据不足、曝光度低的问题,来挖掘出较为真实的OD数据,同时通过各交通小区之间的联系建立了城市路网交通的空间相关性。同时STCL-Net框架整合了CNN、LSTM和ConvLSTM三种深度学习框架。
该框架相对于TA-STAN来说更进一步使用了城市中真实可能反应交通情况的数据,对于短时交通事故预测更好,但并未对数据“零膨胀”问题进行解决。
(三)基于ST-RiskNet的深度学习交通事故预测模型
ST-RiskNet框架对于交通事故的预测是基于CNN框架的,通过注意力机制调整历史信息,融合了局部和全局时空特征[30]。ST-RiskNet框架对交通事故的预测优于上述两种框架,是因为它很好的设计了加权损失函数解决了数据零膨胀问题。
ST-RiskNet框架设计了样本加权MSE损失函数[26],使得模型对风险较大的值更加关注,由此避免零值附近的预测值集中问题。ST-RiskNet框架提供了一个很好的思路解决STCL-Net框架对于零膨胀问题的缺陷,使交通事故预测更加精确。
四 总结与展望
t框架利用社交数据挖掘深层次交通事故关联问题,加强短时交通事故预测;再到
ST-RiskN以上三种模型都是基于深度学习框架的交通事故预测模型,可以发现的是在研究过程中研究者主要关注大面积路网在时间、空间情况下的交通事故预测,三个深度学习框架相互补充,从最开始传统模型的静态、均衡的交通事故预测到TA-STAN框架关注周围环境而非只关注道路、交通条件;到STCL-Neet框架解决零膨胀问题提供了很好的思路。
可以发现目前基于深度学习框架的交通预测模型对于数据挖掘还存在一定的问题,并不能很好的反映交通情况,通过社交网络,利用爬虫获取OD数据是一个很好的解决方案。对于交通来说,获取大数据一直是一个问题,就目前而言,国内外对利用如微博、推特等数据研究交通事故的方法和案例较少,可以针对大量词频、出行照片等勾画出用户出行方式和OD数据,这项研究或许会成为交通研究的一个新方向。
交通事故数据的零膨胀问题目前来说可用的解决方案较少,可以对此展开研究。
对于交通事故预测来说,目前研究的还是单一点、线、面的交通事故预测,针对短时的交通研究也有进展。以安全为导向的路径优化目前并没有多少研究,如果能利用深度学习获取区域内短时事故风险,可以探索车辆选择路径的事故风险值,并对驾驶员进行以避免交通事故为导向的路径诱导。这项研究无论是对人工驾驶还是自动驾驶的发展都有着极大的意义。
参考文献(References):
[1]袁振洲,娄晨,杨洋.时间差异条件下的高速公路交通事故致因分析[J/OL].北京交通大学学报:1-9[2021-05-30].
[2].交通事故等级划分与行政处罚[J].交通世界,1995(05):13.
[3] REN H, SONG Y, WANG J, et al. A deep learning approach to the citywide traffic accident risk prediction[C]. International Conference on Intelligent Transportation Systems, 2018: 3346-3351.
[4] CHEN C, FAN X, ZHENG C, et al. SDCAE: stack denoising convolutional autoencoder model for accident risk prediction via traffic big data[C]. International Conference on Advanced Cloud and Big Data, 2018: 328-333.
[5] YUAN Z, ZHOU X, YANG T, et al. Hetero-ConvLSTM: a deep learning approach to traffic accident prediction on heterogeneous spatio-temporal data[C]. Knowledge Discovery and Data Mining, 2018: 984-992.
[6]许正. 零膨胀数据的几种模型及应用[D].扬州大学,2014.
[7]王贝贝,万怀宇,郭晟楠,林友芳.融合局部和全局时空特征的交通事故风险预测 [J/OL].计算机科学与探索:1-10[2021-06-03].
[8]陈超. 基于深度学习的城市交通事故风险预测算法研究[D].厦门大学,2019.
[9]程慧玲. 车联边缘网络中基于深度学习的交通事故风险预测算法研究[D].南京邮电大学,2020.
[10]朱磊. 基于深度学习的交通事故风险预测研究与实现[D].西南交通大学,2019.
[11]Jovanis Paul P.,Chang Hsin-Li. Disaggregate model of highway accident occurrence using survival theory[J]. Pergamon,1989,21(5).
[12]Sarath C. Joshua. Nicholas J. Garber. Estimating truck accident rate and involvements using linear and Poisson regression models[J]. Transportation Planning and Techology,1990,15(1):41-58.
[13]Ivan J N, Wang C, Bernardo NR. Explaining two-lane highway crash rates using land use and hourly exposure[J]. Accident Analysis & Prevention, 2000, 32(6): 787-795.
[14]Daniel Eisenberg. The mixed effects of precipitation on traffic crashes[J]. Accident Analysis and Prevention,2004,36(4).
[15]敖曼,翟润平.气象条件对道路交通的影响分析[J].公路与汽运,2011(02):58-62.
[16]Miaou S P. The relationship between truck accidents and geometric design of road sections: Poisson versus negative binomial regressions[J]. Accident Analysis & Prevention, 1994, 26(4): 471-482.
[17]Qin X, Ivan J N, Ravishanker N. Selecting exposure measures in crash rate prediction for two-lane highway segments[J]. Accident Analysis & Prevention,2004, 36(2):183-191.
[18]李娟,邵春福.基于BP神经网络的交通事故预测模型[J].交通与计算机,2006(02):34-37.
[19]秦利燕,邵春福,赵亮.道路交通事故宏观预测模型[J].武汉理工大学学报(交通科学与工程版),2010,34(01):154-157.
[20]Helai Huang, Qiang Zeng, Xin Pei, S. C. Wong, Pengpeng Xu. Predicting crash frequency using an optimized radial basis function neural network model[J]. Transportmetrica A: Transport Science,2016,12(4).
[21]Yuan Z, Zhou X, Yang T, et al. Predicting traffic accidents through heterogeneous urban data: A case study[C]. UrbComp, 2017: 1-9.
[22]包杰. 基于多源数据的城市路网交通事故风险研究[D].东南大学,2019.
[23]Britz D, Goldie A, Luong M T, et al. Massive exploration of neural machine translation architectures[J]. arXiv preprint arXiv:1703.03906,2017.
[24]Bahdanau D, Cho K, Bengio Y. Neural machine translation by jointly learning to align and translate[J]. arXiv preprint arXiv:1409.0473,2014.
[25]吴刚. 高速公路交通流预测及事故预警方法研究[D].天津大学,2014.
[26]黄介武. 线性与广义线性模型中参数估计的一些研究[D].重庆大学,2014.
[27]王彦浩.基于图神经网络的交通事故预测方法研究[D].华北电力大学,2021.
[28]王文博,陈红,韦凌翔.交通事故时间序列预测模型研究[J].中国安全科学学报,2016,26(06):52-56.
[29]张志豪,杨文忠,杨婷婷,等.基于LSTM神经网络模型的交通事故预测[J].计算机工程与应用,2019,55(14):249-253
[30]张广南,钟俏婷,杨清玄.交通违法事故时空分布特性及其影响因素[J].交通运输系统工程与信息,2019,19(03):208-214
[1] 作者简介:赵付万(1989年6月-)……