论文:Visual Analysis of Movement Behavior using Web Data for Context Enrichment
作者:Robert Krueger, Dennis Thom, Thomas Ertl
发表会议:Pacific VIS 2014

随着 GPS 设备的日益普及,由 GPS 设备生成的轨迹数据也越来越丰富。然而凭借单一的位置信息,我们可以做的分析很有限,我们更希望知道 人们(GPS 设备)为什么移动、他们的目的地是什么地方(对目的地的具体描述,而不单单是经纬度信息)。想要回答以上问题,我们就需要对地理位置赋以更为丰富的语义信息,比如明确某个位置的功能是学校还是商场。

本文从一个以地理位置 POI 为核心的社交平台 Foursquare 中抓取 POI 的信息,用以丰富电动车(electric scooters)的轨迹数据。然后从空间、时间两个方面,分别设计了两个视图来分析人们使用电动车的具体行为、目的。中间还穿插了不确定性的可视化。原型的界面如下图所示:

img

数据

500 个带 GPS 的电动车(electric scooters)用户的轨迹数据,没 30 秒采集一次数据,一共采集了 2 年,产生了 150,000 条轨迹(trips),总共 8,200,000 条 GPS 记录.

数据预处理\1. 首先提取出所有轨迹中的目的地,然后使用 DBScan 对所有的目的地进行聚类。相对于 k-means 方法,DBScan 不需要指定类别数 k,同时具有良好的抗噪性。下图中红色的点表示聚类的结果,白色的点被认为是噪声抛弃。

img

  1. 聚完类之后,本文为每个类赋以一定的语义,语义可以分成三类:
  • 充电站:直接与充电站位置的数据进行匹配,将距离充电站 50m 范围内的类表示为充电站
  • 家:将轨迹最常出现的地方定义为电动车使用者的家
  • POI:从 Foursquare 抓取 POI 的信息赋给相应的类

其中,很多类会对应于多种类型(多个 POI),那么怎么来确定这些类的类型呢?本文提出了一种简单的不确定性可视化方法:某种类型的确定性按它在所有类型中所占的比例来计算,确定性最高的类型被认为是该类所对应的类型,背景色的深浅表示类型判断的不确定性(颜色越浅,不确定性越高)

类型自动标记的结果如下图所示,本文还针对遮挡问题进行了简单的合并处理。当然,为了修正自动标记步骤的错误,用户可以根据自己的经验手动修改类别。

img

#

基于空间的分析

在基于空间的分析中,主要提供了两种交互方式:一种是全选一个范围内的 Home,对家在这个范围内的电动车轨迹进行分析;另一种是选中单个 Home,对单个电动车的轨迹进行分析。效果如下所示,轨迹有透明度,可以看到哪些道路的经过比例较高,通过结果还可以看到用户常去哪些地方。从而用户可以进一步分析,这些电动车的用户是怎么使用这些电动车的,这些电动车是否真正对用户的出行、日常使用有帮助。

img

img

基于时间的分析

在时间视图上,用户可以看到用户在一天、周、年的统计行为。下图中展示的是用户一天 24 小时的移动情况,每个小时的数据都是对用户在两年时间内每天在这个小时内数据的统计结果。可以看到家总是出现频率最高的,说明用户不是每天使用电动车。在白天,用户会出现在学习、购物、餐馆等各种场所,说明电动车确实对于用户的日常生活是很有帮助的,用户愿意驾驶电动车去各种场所。

img

总结

  1. 分析电动车用户行为的目标明确,且整个工作完整,可以从时空两个方面对轨迹数据进行有效分析。

  2. 无论是可视编码还是 case study,都没有出彩的地方。

  3. 将来工作:

    1. 融入更多的 context data
    2. 用真实的数据去验证地点自动表示的准确性
    3. 拓展到更多的应用领域,比如动物迁徙、汽车轨迹数据


Questions & Discussion: ✉️ zjuvis@cad.zju.edu.cn