城市交通拥挤事件的模糊C均值聚类识别方法研究

城市交通拥挤事件的模糊C均值聚类识别方法研究

吴宏娜WuHongna;韩印HanYin

(上海理工大学管理学院,上海200093)

(SchoolofManagement,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China)

摘要:交通拥挤事件是城市公共交通系统中造成交通延误的最主要原因之一,快速有效的识别拥挤事件是城市交通控制策略的重要环节。针对交通流相态及其交通因素类属方面存在的模糊性,本文在分析交通流特征时对其进行了聚类软化分。根据交通流特性,运用模糊C均值聚类算法对交通流各要素进行模糊分析处理。通过对交通量隶属度的判别和聚类分析结果,找出不同交通流间的亲疏程度和相似性,将具有相近特性的交通流归纳在一类,从而判别出交通流相态属性,确定交通拥挤事件的发生,达到对交通拥挤事件识别的目的。

Abstract:Trafficcongestionincidentisoneofthemainreasonsthatcausethetrafficdelayintheurbantransportationsystem.Howtoidentifythesecongestionincidentsquicklyandeffectivelyisanimportantpartofurbantrafficcontrolstrategy.Trafficflowstatusandtrafficelementshavefuzzinessthatishardtocategorize.Thepaperdoesafuzzyclustersoftpisionwhileanalyzingthecharacteristicsoftrafficflow.Accordingtothecharacteristicsoftrafficflow,itusesfuzzyC-meansclusteringalgorithmtodealwiththesefuzzyfactors.Throughthestudyofthemembershipdegreeandtheclusteringanalysis,itgetsthedegreeofclosenessandsimilarityoftrafficflowandcategorizestheflows.Afterthecomparisonanddistinguishthesecharacters,itachievesthepurposeoftrafficcongestionincidentidentification.

关键词:模糊聚类;交通拥挤事件;交通流;事件识别

Keywords:fuzzyclustering;trafficcongestionincident;trafficflow;incidentidentification

中图分类号:U491文献标识码:A文章编号:1006-4311(2011)07-0184-03

0引言

交通拥挤事件是指常发性及偶发性拥挤(如高峰期流量过大导致的交通堵塞、重大活动导致的交通量激增引发拥挤),都会严重影响交通畅通安全。当路段发生拥挤时,交通流状态发生迅速改变,引发一个或更多车道的交通被阻断。如果不能快速的识别出拥挤地点并进行处理,短时间内会迅速引起道路通行能力的下降或交通需求的增加,从而严重影响交通的畅通,甚至引发二次事故[1]。为减少由交通拥挤事件带来的出行损失和其他负效应,建立有效的针对交通流状态判别的事件识别方法,能快速发现拥挤事件的发生并进行及时处理,减少由拥挤引发的交通延误。因此在特定具体的城市道路条件下,根据道路实时交通流的变化监测,把交通流相态分析理论与具体模糊聚类识别算法相结合,进行数据融合和算法融合,形成适合于城市道路的交通事件监测的识别方法是事件识别算法研究的重点,对城市公共交通服务水平的提高有重大社会及经济效益[2]。

城市公共交通系统是复杂、动态的平衡系统,交通流相态及属性也同样存在其复杂性和不确定性。由于模糊理论能够较好的描述其不确定性,本文通过运用模糊聚类算法,在分析拥挤交通流特性的基础上,根据不同交通流相态间的相似度,将同类相态聚合成子集,对其进行聚类软化分,属性差异大的个体会有较低的隶属度而偏离聚类中心,以实现对交通状态判别和交通拥挤事件的识别目的。

1交通拥挤事件分析

由于交通流量突然增大且超出道路设施正常的容量所引起的交通拥挤称为常发性交通拥挤。常发性拥挤相对是稳定有规律和可以预测的,最容易发生在高峰时间,属于周期性拥挤。它多是由于道路设计交通容量不足或交通需求增长过快等造成的,具有较显著的客观性特征。由于一些特殊事件引起道路容量的减少或吸引过多的流量而引起的拥挤为偶发性交通拥挤。最常见的道路突发事件有:大型活动、交通事故、道路维修、恶劣天气等,偶发性拥挤是没有规律和不可预测的,而且持续时间可能较长[3]。拥挤事件发生后,道路上的交通状况会随之发生变化,发生事件的上游路段的速度下降,车流量减少,而占有率增加;下游路段的流量和占有率降低而速度可能早增加。待事件消除后,速度会逐渐快速回升,流量随之上升,占有率降低,恢复到未发生交通拥挤事件前的情况。无论是何种交通拥挤事件,其发生后,都降低了道路的通行能力,导致了交通需求量无法得到满足。因此,在事件识别的同时,可根据事件拥挤事件发生在较低时这一特点,来进行监督识别拥挤事件,从而降低误报率[4]。

交通拥挤事件识别,即是发现路网中的拥挤状态点或路段,并对获得的情况信息进行判别,针对不同判别结果采取相应的事件响应措施,给与预警通知或对重大交通拥挤事件进行及时清除和合理处置。

2模糊C均值聚类算法原理

聚类就是按照事物间的相似性进行区分和分类的过程,在这一过程中没有教师指导,因此是一种无监督的分类[5]。聚类分析即用数学方法研究和处理给定的对象分类。传统的聚类分析算法是一种硬划分[6],它把每个待辨识的对象严格的划分到某个类中,因此具有非此即彼的性质,这种分类的类别界限是分明的,而实际上大多数对象并没有严格的属性,他们的性态和类属方面存在着中间性,适合进行软划分。而交通流特性正属于此类待辨识的对象之一,因此用模糊聚类分析理论来对交通流状态进行聚类处理,建立起了样本对于类别的不确定性描述,能更客观的反映真实交通流状况。

2.1算法原理模糊C均值聚类方法的思想,就是使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。其本质是每一数据点属于某一聚类是以特殊的隶属等级给出的,它提供了一种将多维空间的数据点映射到不同聚类集的方法[7]。这一方法是JimBezdek于1981年提出的,以改善早期的聚类方法[8]。

模糊C聚类方法是一种柔性的模糊划分。该算法中,所谓C系指将有限样本集X={x1,x2,…,xn}划分成C类,各样本以一定程度隶属于C个不同的域。用uij表示第j个样本隶属于第i个类的隶属度,uij满足下述条件:

①uij∈[0,1];

②每个样本对全部聚类中心的隶属度之和为1;

③每个聚类中心包含的样本个数介于0和n之间。

模糊C举止聚类算法的出发点是基于对目标函数的优化,通过对平方误差函数求最优值,旨在寻找一组中心矢量,以使各类中的样本到聚类中心的加权距离平方和达到最小,其目标函数常取如下形式:

m—模糊指数,m∈(1,∞)模糊指数越大,聚类的模糊程度就越大。

2.2计算步骤:

①选择一个常数ε>0,置迭代次数k=0,随机给出聚类中心矩阵V(0)。

经过聚类分析后,可得到模糊类别的聚类中心和最终的样本隶属度矩阵,将这些数据输入到决策模块中,即可实现对交通拥挤状态的判别。

m∈[1,+∞),是一个加权数,控制着模糊类间隶属分配和聚类的模糊程度。其值对计算结果影响较大,如果m取值过大,会造成聚类效果较差,无法反映真实情况,而如果m过小则算法会接近HCM聚类算方法(隶属矩阵为0或1),而无法反映该方法基于统计学思想的优点。本文查阅研究[9],一般m的取值在1.5~2.5之间,本文取m=2。

3实例测算

数据来源上海市重点学科项目(S30504)于2008年7月22,上海市某交叉口全天实测流量数据。数据记录周期选择5min,若选择1min或2min为周期,则数据分析记录周期小于信号周期,会使车流量数值范围波动较大,过大的随机性和不确定性不适合对交通流进行连续分析。故选用5min为数据分析周期。原始调查交通数据如图2所示。

按模糊c均值聚类算法的算法步骤,进行求解,得到不同时段下的交通量差别隶属度函数值。由于数据量巨大,本文仅选隶属度差异最显著的三个交通时段,数据如表1。

将24小时内的交通流相态,按经验预划分三类,高峰拥挤状态,平峰非拥挤状态,自由流状态,并用3.2.1分别标定其状态。由表1可以看出,在不了解交通流状态的前提下,由隶属度的结果差异可以明显的区分出三个差异最大最具代表性的时段。8:30—9:30,平均隶属度值的水平最高,实际观测中,这一时段正是该交叉口的高峰拥挤期;12:00—13:00的隶属度水平居中,相对平稳,实际点观测中,该处中午时段确实未出现早晚高峰期的巨大车流量,属于平峰非拥挤状态,相对一天24h属于次高峰;而0:00—1:00时段内的隶属度值平均水平最低,实际检测情况该时段交通流量处于一天中的最低水平,属自由流状态。可以得出,由交通流量隶属度的差异性,能较明显区分出交通流状态差异,相比实际检测结果有很高的准确性和可行性。

由图3可以看出,高峰交通拥挤状态出现在8:30-10:00及17:00-19:00时间段内,其他时段分别为平峰非拥挤状态或自由流状态。其中高峰期实际检测中,交叉口实际发生交叉口严重拥堵事件2次,使该点出现堵塞,造成交通延误。运用本方法得出的聚类结果分析与实际检测情况基本高度吻合。

4结语

本文在模糊聚类理论的基础上,提出了交通流相态分析聚类处理方法。结合实际交通数据案例演算,给出了针对不同时段的交通流相态分属和交通拥挤状态识别结果。结果证明,利用模糊C均值聚类算法,通过对隶属度的分析和聚类结果分析,能相对快速有效地实现对交通流状态的类别划分,得到精确度较高的拥挤事件识别结果。

基于模糊逻辑的模糊均值聚类交通事件识别方法,优势在于采用了模糊分析法,消除了传统算法由于采用具体确定阀值而引起的临界决策区域,对交通流进行模糊软化分再进行类属判别。

模糊C均值聚类算法在交通流量较高或中等情况下,能取得较好的聚类分析识别效果,但在平均流量较低的情况下其稳定性及有效性有待进一步研究验证。

参考文献:

[1]温慧敏,杨兆升.交通事件识别技术的进展研究[J].交通运输系统工程与信息,2005,5(1):25-28.

[2]FarradynePB.Trafficincidentmanagementhandbook[R].FederalHighwayAdministration0fficeofTravelManagement,November2000.

[3]黄欣,杨新苗,常玉林,程杰.城市交通拥挤的成因探析[J].交通运输工程与信息学报,2007,5(2):112-118.

[4]周伟,罗石贵.基于模糊综合识别的事件识别算法[J].西安公路交通大学学报,2001,4(2):70-73.

[5]何清.模糊聚类分析理论与应用研究进展[J].模糊系统与数学,1998,12(2):89-94.

[6]ParkanyE,XieC.Acompletereviewofincidentdetectionalgorithms&theirdeployment:whatworksandwhatdoesn’t[R].PreparedforTheNewEnglandTransportationConsortium,NETCR37ProjectNo.00-7,February7,2005.

[7]闻新,周露,李东江,贝超.MATLAB模糊逻辑工具箱的分析与应用,2001,(1):175-176.

[8]BezdekJC.Patternrecognitionwithfuzzyobjectivefunctionalgorithms[M].NewYork:PlenumPress,1981.

[9]高新波.FCM聚类算法中模糊加权指数m的优选方法[J].模糊系统与数学,2005,19(1):143-148.

基金项目:国家自然科学基金(51008196),上海市重点学科项目(S30504),上海市研究生创新基金(JWCXSL1002),上海市科委科技攻关项目(10dz21510700)。

作者简介:吴宏娜(1984-),女,辽宁阜新人,上海理工大学硕士研究生,研究方向为智能交通系统。

标签:;  ;  ;  

城市交通拥挤事件的模糊C均值聚类识别方法研究
下载Doc文档

猜你喜欢