交通可视化——通向智慧城市的必经之路
朱闽峰
mail: minfeng_zhu@zju.edu.cn 陈为 郭方舟 王飞跃
摘要:城市交通与我们每个人的生活息息相关,也给现代化城市带来了巨大的难题,如交通拥堵、空气污染等经济环境问题。可视分析技术一直在交通数据分析的过程中扮演了一个重要的角色。从基础的流量分析到交通事件的挖掘,可视化方法进一步结合交通和周围环境的关系,从全新的角度解释交通系统与人类社会的关系。本文简单回顾了一个世纪以来交通可视化的历史发展和近年来基于交通大数据的可视化应用,希望带读者揭开未来智慧城市的一角。
关键词:交通大数据,可视化,可视分析
引言
随着交通系统的快速发展,交通已经成为人类生活中一个重要的组成部分。据统计,城市中大约有 40%的人口每天花费 1 小时在交通上[1] 。然而,现代城市中大量的人口以及交通工具产生了许多城市问题,比如交通拥堵、交通事故和空气污染等[2]。
伴随着大数据可视化的热潮,在交通数据中使用可视化可以帮助人们有效地理解移动车辆的行为、发现交通在时空上的模式,从而为交通优化等提供决策信息。当代交通系统每时每刻都会产生大量的数据,比如,出租车上搭载的 GPS 传感器会记录出租车的行驶轨迹;街道监控摄像头会记录车辆的通过情况。而且,伴随着城市越来越大,汽车越来越多,监控越来越多,交通数据的规模有了爆炸性的增长。在这种情况下,直接对交通数据进行分析的传统方法已经变得越来越困难,而且效率越来越低,数据挖掘、机器学习和可视化等智能化技术的深入和广泛使用已经变得刻不容缓[3-4]。特别地,可视化可以将用户和数据直接相关,支持用户以简单可视的方式与数据进行交互,进而实现用户智慧和机器智慧交融反馈,可以极大地提高分析和决策的效率与准度。
文献[3]首次将交通可视化作为一个独立的研究与应用领域展开工作,认为这一技术是通向未来智慧城市的必由之路。狭义上来说交通可视化就是对交通系统中产生的数据进行编码,通过图片、图表的方式向用户展示交通数据,支持用户交互的分析交通数据,主要包括对象轨迹的可视化、监控数据的可视化以及路网路况的可视化。轨迹的可视化一般是将交通系统中的实体(比如出租车、公交车、行人等等)的轨迹在地图上用线条的方式进行展示;而监控数据的可视化则可以根据监控的类型分为基于监控事件的可视化和监控视频的可视化;至于路网路况的可视化,则一般是通过热力图等技术可视化实时通行状况和拥堵状况等。
广义的交通可视化则可以理解为在交通智能分析系统中可以利用的所有可视化技术的总和。一个智能分析系统一般可以大致的拆分成数据采集、数据预处理、数据查询和数据分析四个部分。除了数据采集外,其他三个部分都有可视化技术的施展空间。比如,在数据预处理过程中,采集到的原始交通数据可能存在包括重复、缺失在内的各种各样的问题,可视数据清洗可以帮助用户对原始交通数据进行去重、补全等操作,提高数据的可用性;在数据查询过程中,通过可视化的查询界面,帮助用户优化查询条件,分析查询结果等等;在数据分析过程中,可视化技术可以与其他数据分析方法相结合,支持用户干预数据分析流程。
交通可视化起源
随着交通系统的完善,人们对于出行的需求越来越迫切。为了提升交通系统对于人们的服务质量,交通数据的可视分析扮演了一个重要的角色。数据可视化虽然是刚兴起的学科,但是可视化方法在交通数据的分析过程中存在已久。
地铁出现至今已有百余年历史,目前最早的地铁工程可追溯至 1863 年的伦敦大都会铁路。为了向公众展示地铁在城市中的分布情况和站点地址,人们使用线条和圆点在城市地图上直观地表示地铁线路。图 1 是 1907 年英国伦敦 The Evening News 发布的“伦敦地铁地图(Tube Map)”,其中不同的地铁线路使用能够明显区分的颜色进行编码,站点位置均采用地图上的真实位置。
图 1 1907 年英国伦敦 The Evening News 发布的城市地铁地图
来源:https://en.wikipedia.org/wiki/Tube_map
早期地铁线路图通常将视觉元素直接叠加在真实比例的城市地图上。然而在人们出行时,很多时候并不需要考虑准确的站点地理位置,只需要关注“我从某地出发,乘某条线,能到某个站点”这样的信息,就已足够满足出行需要。因此现代地铁图放弃完全贴合真实比例地图,转而使用比较规整的“示意性”布局方案。我们以目前最新的上海城市地铁示意图为例,其中所有用于表示线路的线条均由水平、垂直线和接近 45 度的斜线段组成,其站点位置的摆放仅大致表达了站点在城市中所处的方位。这种规整的布局设计能使人更加专注于提取“起始点——终点”信息,而无需费力地跟踪原本错综复杂的曲线线条。然而真实比例的地铁地图并不是完全被抛弃,地铁站经常会在非主要位置摆放真实比例图,提供给需要参考准确地理位置的乘客使用。
图 2 上海轨道交通网络图
来源:http://service.shmetro.com/yxxlt/index.htm
制作地铁示意图的工作最开始通常由设计师完成,其站点位置完全由人工安排。不过在站点和线路关系复杂的城市中,如何生成这种规整的地铁示意图着实是一门学问。随着优化算法的引入,很多专门的算法都可以用于生成这些地图,并支持加入各种约束条件(如保持整体形状、减少交叉数目、减少使用斜线等),以生成不同需求下的示意图结果,供设计师和决策者参考。早在一个世纪前,Étienne-Jules Marey 为了分析火车交通系统的运行状态,设计了一个展示火车时刻的图表。如图 3 所示,多个时间轴平行分布,每一个时间轴对应一座车站,沿纵向根据车站间地理距离分布。每一条折线连接不同时间轴上的时间点,揭示每一列火车在每个站点停靠的时间。同时,线的斜率反映了火车的速度:越倾斜代表火车速度越快。现在我们称这样的图表为 Marey’s Graph。在线网站http://mbtaviz.github.io提供了可交互的Marey’s Graph。
图 3 Marey’s Graph 展示火车时刻表
来源:http://mbostock.github.io/protovis/ex/marey-train-schedule.jpg
可视化方法
交通数据主要指的是由移动设备的位置传感器和安装在道路上的监控器所生成并且收集的数据。例如,出租车 GPS 轨迹数据记录了车辆实时的精确经纬度位置,手机用户的基站数据记录了手机用户进出的基站序号,道路上的监控设备实时录制、拍摄和计数过往的车辆信息。轨迹数据是一种最常见的交通数据,每一个轨迹记录点不仅包含位置信息,同时还记录了当时的时间。事件日志提供了更多关于城市交通道路上的语义信息,可以增强我们对异常轨迹的理解和分析,比如堵车、车祸等事件。交通数据的可视化方法主要分为三类:统计、时空轨迹和多维编码。
统计
热力图作为最基本和常见的可视化形式之一,通常用于表达单一数值(如车流量、人数、繁忙程度等)在不同位置上的分布。图 4 是美国纽约 2011 年中某一周的出租车运营状况,其中,地图上每个像素点的颜色深浅代表该位置每小时的平均营运量;颜色越深,则代表该位置出租车上下客越频繁。因此在热力图的颜色分布中,我们可直观看到城市繁华地区的出租车客运更加繁忙。
图 4 2011 年某星期纽约城区平均每小时的出租车客运量[5]
时空轨迹
轨迹数据蕴含着丰富的时空信息,我们可以从时间和空间角度对轨迹数据进行可视化。轨迹的时间属性主要有线性时间和周期性时间两种。线性时间可以使用基于时间线的可视化方法编码,时间线的两端编码了数据的起始时间。图 5 中的视图采用时间线的方法可视化了地铁路径选择与时长的关系[6]。从一个站点出发,用户可以根据地铁网络选择任意一个站点下车,水平轴上的长度代表了整一趟旅途所花费的时间。对于周期性的时间,比如周、天、小时,最常用的可视化方法是环形布局。
图 5 时间流图展示了从城市中心站到其他站点的路径的时间效率
空间在轨迹分析中是非常重要的属性,人类的社会活动都和位置密切相关。轨迹的空间属性可以基于线进行绘制。Lundblad 等人[7]将轮船的航线用折线绘制于地图上,提供船只的监测服务。然而,如果直接绘制大规模的轨迹,屏幕上就会充斥着大量繁杂的轨迹,可视分析系统的使用者就无法进行理解分析。可视化研究者提出了边绑定算法对相似的轨迹进行聚合。图 6 所示的是美国境内的飞机轨迹。当我们采用边绑定的算法[8]对形状类似的轨迹进行聚类,用户可以清楚地看到美国州与州之间的飞行情况。
图 6 边绑定可以对地图上复杂的轨迹进行聚合
多维编码
热力图和轨迹图等可视化形式一般只能编码较少的维度信息。当数据维度较多时,通用可视化形式开始变得难以驾驭如此复杂的信息,因此需要针对应用场景和分析任务针对性设计合适的视觉编码。例如,时空立方体(Space-Time Cube,STC)是一种表达时空轨迹的常用方法,其中物体的轨迹使用从地图平面逐渐向上方延伸的线条进行表达。为了展现轨迹不同位置上的多种属性(例如人群类型,车辆类型,发生事件的详细信息等),轨迹线条上还可以在相应位置添加颜色、点、几何图形或是特殊设计的图符等。如图 7 所示,折线编码了车辆在空间和时间维度上的位置,其中颜色从红到绿编码了移动速度,一些遭遇交通拥堵的轨迹很容易被分辨出来。
图 7 使用时空立方体展示轨迹在时间和空间上的联合分布[9]
在交通智能分析系统中所使用的可视分析技术按照应用类型可以分为查询、统计分析和查询推理三大类。
查询
城市交通路网分析对于交通管理有一定的指导意义。现有的路网分析方法一般需要布置特定的设备和专业人员现场采集数据,过程也多采取多次试错的方式调节各类模型参数,需要大量的人力和物力。城市交通轨迹数据保存了大量车辆长期行驶记录,数据覆盖城市大部分道路,有利于城市道路整体评估。陈为教授团队提出了一种基于道路的轨迹查询模型[10],对轨迹数据建立了双向链接哈希索引提升查询效率。他们设计的可视化系统中将道路作为空间查询约束,把道路上车流模式划分为四种拓扑模式:leave,cover,enter 和 cross。同时,系统提供了刷选工具,分析师可以任意选择道路,通过该道路的车流热力图,统计图等对道路进行评估和分析,见图 8。通过实际案例分析,该系统可以发现潮汐车道以及“分水岭”等城市道路的车流模式特征。
图 8 城市交通评估可视分析系统,图中分析师在左侧地图中刷选道路,系统实时显示右侧图中的可视化结果
对于交通轨迹数据的信息挖掘和知识提取越来越重要,现有的工作大多都围绕对特定地理位置区域和时间段的轨迹数据进行过滤。而对于特定的分析任务,查询难度就大大上升了。例如商场的管理者,希望知道在城市的什么地点放置摆渡车辆。赵烨教授团队研发了一种能够基于语义的大规模轨迹检索方法[11]。系统将海量轨迹数据转换为两种不同的索引文本文件从而支持对出租车和针对行程的快速查询功能(图 9)。领域专家或管理人员可以通过输入带有语义的查询句子对轨迹进行检索。例如用户可以查询经过特定的街道或地点的轨迹。统计视图、文本视图和环境地图从不同的分析角度展现查询结果。最后团队通过对商场轨迹的实际案例分析,发现了如“商场繁忙路段”、“最爱来商场购物人群”及“最热门商圈”等有价值的信息。
图 9 出租车轨迹语义查询系统界面
统计分析
手机位置数据可用于研究城市中的人群流动模式与特征。然而对于城市级别的海量位置数据,分析师首先希望从宏观角度查看和探索整个数据集,得到对数据分布和特征的大致印象。如图 10 所示,陈为教授团队将用户在手机基站间的流动量作为网络流进行建模,对城市范围内的手机用户的移动行为特征从四个方面进行可视化[12]:① 基于基站的流量分析,使用特殊设计的视觉编码展示每个基站上的流量和方向分布;② 基站流量的时序特征分析,用于分析基站流量随时间的分布和周期性波动;③ 基站间流量的密度图可视化,使用密度图方法展示基站间的流动关系和人流密度;④ 结合社交关系的人群流动可视化,通过在同一社交圈中的手机用户在地域上的移动发掘人群社交关系与地理位置间的关联。
图 10 基于手机位置与通信的人群流动可视化流程
查询推理
“智慧城市”一词萌芽于当今的数据爆炸时代。社交媒体,车辆人流,设施图像等各个领域汇集了海量数据信息。人们开始融合多领域数据,期望得到更加全面的分析结果。多源异构数据的查询与推理能够最直接的结合各个数据集的知识。“Step by step”的数据分析方法利用上一步分析结果,指导并影响下一步的分析,利用推理模式对多数据源的城市数据进行分析。针对查询推理的可视分析工具则能使人更加直观方便的输入查询条件,构建推理流程,得到分析结果。浙江大学陈为教授的团队研发了一种能够应用于城市规划,交通监管和场景再现的可视分析系统[13]。系统通过建立高效的数据索引,提供对多源异构城市数据的查询、展示和推理,可以实现复杂的城市分析任务。系统中,繁琐的城市问题可以被拆分成多个简单的原子查询,从而建立推理流程,完成分析。例如图 11 案例,微博的博主希望寻回在出租车上丢失的手机。分析人员首先在建筑物信息数据中检索到行程起点和终点的位置。紧接着,通过对出租车轨迹数据的 O-D 查询,定位到两辆当晚经过起点和终点的出租车。系统通过对出租车轨迹的场景再现,结合出租车的载客状态与微博描述,从而锁定了乘客乘坐的出租车。
图 11 查询推理可视分析系统,该系统通过对微博数据、建筑物信息数据、轨迹数据和手机信令数据的查询推理,帮助微博博主找到丢失的手机
系统实例
本文以多个交通数据可视分析系统的实例介绍交通模式发现和交通态势监控。
交通数据可视化的一个重要目标就是发现和分析交通系统中实体的移动模式。一种移动模式可以描述交通系统中一组实体的移动方式。通过将可视化技术与聚类等数据挖掘的方法相结合,便可以支持用户交互的探索交通数据中实体的移动模式。例如,在 TripVista[14]中,就利用了 stream map,平行坐标图等可视化技术对一个十字路口中,行人、公交车、轿车、自行车等实体的移动模式进行了可视化的分析,如图 12 所示。
图 12 TripVista 是一个分析交叉路口交通流的可视分析系统
交通可视化的另一个重要目标就是对交通态势的可视化监控。可视化监控的目标就是从交通监控数据中发现在交通系统中出现的一些意外事件,比如车祸、汽车抛锚等等。一般情况下,交通监控系统产生的数据量是非常庞大的,因为这些系统每时每刻都在不断的产生数据。因此,直接从原始的监控数据中找到交通系统中发生的特殊事件是非常费时且困难的工作。如果利用可视化技术,就可以让用户根据可视化提供的一些视觉线索,从宏观到微观,自顶向下地寻找交通数据中存在的一些事件。比如,AIVis[15]就首先从视频监控中抽取出交通事件,然后再通过可视化的方式展示在隧道中发生的事件;而 T-Watcher[16]则是一个监控和分析大城市中复杂交通状况的可视分析系统,通过多种视图来展示城市中不同尺度下的交通情况,引导用户从整个城市的宏观交通情况探索到一个较为微观的尺度中,监控一小部分车辆的行驶情况。
图 13 AIVis 系统实时监控隧道通行状况
图 14 T-Watcher 从多个层次监控分析交通态势
结语
交通大数据给我们带来了无限的机遇,同时也存在着巨大的挑战。如何理解、分析和预测交通数据,是我们这个时代所面临的问题。可视化是解决分析大规模非结构化交通数据的一把重要的钥匙。通过对交通数据的交互式分析,可视化技术将用户智慧和机器智慧交融反馈,进而优化并且解决交通问题。相信在不久的将来,我们可以享受到更加高效的城市交通系统,生活在一个便捷的智慧城市中。
参考文献
[1] Junping Zhang, Fei-Yue Wang, KunfengWang, Wei-Hua Lin, Xin Xu, Cheng Chen. Data-driven intelligent transportationsystems: A survey, IEEE Transactions on Intelligent Transportation Systems,vol. 12, no. 4, pp. 1624–1639, 2011.
[2] Xinhu Zheng, Wei Chen, Pu Wang, DayongShen, Songhang Chen, Xiao Wang, Qingpeng Zhang, Liuqin Yang. Big Data in SocialTransportation. IEEE Transactions on Intelligent Transportation Systems,17(3):620-630, 2016.
[3] Wei Chen, Fangzhou Guo, Fei-Yue Wang. ASurvey of Traffic Data Visualization. IEEE Transactions on IntelligentTransportation Systems, 16(6):2970 – 2984, 2015.
[4] Fei-Yue Wang. Scanning the Issue andBeyond: Computational Transportation and Transportation 5.0, vol. 15, no. 5,pp. 1861-1868, Oct. 2014.
[5] Nivan Ferreira, Jorge Poco, Huy T. Vo,Juliana Freire, Cláudio T. Silva. Visual Exploration of Big Spatio-TemporalUrban Data: A Study of New York City Taxi Trips. IEEE Transactions onVisualization and Computer Graphics, 19(May), 2149–2158, 2011.
[6] Wei Zeng, Chi-Wing Fu, Stefan MüllerArisona, Alexander Erath, Huamin. Visualizing mobility of public transportationsystem. IEEE Transactions on Visualization and Computer Graphics, 2014, 20(12):1833-1842.
[7] Patrik Lundblad, Oskar Eurenius, TobiasHeldring. Interactive visualization of weather and ship data. IEEEInternational Conference on Information Visualisation. 2009: 379-386.
[8] Danny Holten and Jarke J. van Wijk.Force-Directed Edge Bundling for Graph Visualization. Computer Graphics Forum,28: 983–990.
[9] Gennady Andrienko, Natalia Andrienko,Heidrun Schumann, Christian Tominski. Visualization of trajectory attributes inspace–time cube and trajectory wall. Springer Berlin Heidelberg, 2014: 157-163.
[10] Fei Wang, Wei Chen, Feiran Wu, YeZhao, Han Hong, Tianyu Gu, Long Wang, Ronghua Liang, Hujun Bao. A VisualReasoning Approach for Data-driven Transport Assessment on Urban Road, IEEEConference on Visual Analytics Science and Technology, 103 – 112, Oct, 2014.
[11] Shamal AL-Dohuki, Farah Kamw, Ye Zhao,Jing Yang, Chao Ma, Yingyu Wu, Xinyue Ye, Fei Wang, Xin Li, Wei Chen.SemanticTraj: A New Approach to Interacting with Massive Taxi Trajectories.IEEE Transactions on Visualization and Computer Graphics, 23(1):11-20, 2017.
[12] Yuxin Ma, Tao Lin, Zhendong Cao, ChenLi, Wei Chen. Mobility Viewer: An Eulerian Approach for Studying Urban CrowdFlow. IEEE Transactions on Intelligent Transportation Systems,17(9):2627-2636,2016.
[13] Wei Chen and Zhaosong Huang and FeiranWu and Minfeng Zhu and Huihua Guan and Ross Maciejewsk. VAUD: A Visual AnalysisApproach for Exploring Spatio-Temporal Urban Data. IEEE Transactions onVisualization and Computer Graphics, 2017.
[14] Hanqi Guo, Zuchao Wang, Bowen Yu,Huijing Zhao, Xiaoru Yuan. TripVista: Triple Perspective Visual TrajectoryAnalytics and its application on microscopic traffic data at a roadintersection. IEEE Pacific Visualization Symposium, 2011, pp. 163-170, 2011.
[15] Harald Piringer, Matthias Buchetics,Rudolf Benedik. AlVis: Situation awareness in the surveillance of road tunnels.IEEE Conference on Visual Analytics Science and Technology, pp. 153–162, 2012.
[16] Jiansu Pu, Siyuan Liu, Ye Ding; HuaminQu, Lionel Ni. T-Watcher: A new visual analytic system for effective trafficsurveillance. IEEE International Conference on Mobile Data Management, vol. 1,pp. 127–136, 2013.
作者简介
朱闽峰
mail: minfeng_zhu@zju.edu.cn 浙江大学计算机科学与技术学院博士研究生。研究兴趣是城市数据可视化与可视分析。
陈为 教授,博导,浙江大学计算机学院副院长。研究兴趣是大数据可视化与可视分析。个人主页: http://www.cad.zju.edu.cn/home/chenwei。
郭方舟 浙江大学计算机科学与技术学院博士研究生。研究兴趣是动态图可视化与可视分析。
王飞跃 中国科学院自动化所研究员。研究方向为智能控制、智能机器人、无人驾驶、智能交通等领域,自二十一世纪初,发起并开拓了社会计算、社会制造、平行智能、平行控制、平行管理、知识自动化等新的研究领域。
✉️ zjuvis@cad.zju.edu.cn