论文:Considerations in Visualizing Comparison

作者:Michael Gleicher

发表:InfoVis 2017

“比较”或“对比”(comparison)是数据分析中最主要的任务之一,例如比较两张CT扫描结果,在不同车辆的行车轨迹中寻找差异,或是对比多次天气预报模型的预测结果等。当我们进行比较InfoVis 2017的这篇《Considerations in Visualizing Comparison》主要从视觉设计和交互角度出发,总结可视化中出现的对比分析形式和手段,来指导可视化系统的设计者如何设计面向比较任务的视图和交互。

这篇文章主要从以下四个层次来帮助读者理解可视化中的对比任务:

  1. 识别参与对比的对象(Identify the Comparative Elements)
  2. 明确对比分析的挑战(Identify the Comparative Challenges)
  3. 筹划分析策略(Identify a Comparative Strategy)
  4. 制定具体设计方案(Identify a Comparative Design)

上述层次划分可以与可视化领域著名学者Tamara Munzner提出的“What-Why-How”可视化层次模型对应起来,如下图所示。其中“识别对象”和“明确挑战”两个层次,对应模型中的“What”和“Why”两部分;“筹划策略”和“制定设计方案”则对应模型中的“How”。

img

接下来,我们将分别介绍上述四个层次和对应的应用场景。

识别参与对比的对象

参与比较的“对象”主要包含两个方面:

  • 比较目标,即对“谁”或“什么物体”来做比较。比较目标可细分为显式目标和隐式目标两类。显式目标比较好理解,比如下面的散点图中,分析者需要比较的就是这两根折线在不同横坐标位置上值的大小。隐式目标则是隐藏在显式目标背后的、非直接的比较。

img

  • 比较行为,即在比较时,分析者希望进行的比较操作,其核心在于分析者希望认清对象之间哪一方面的关系,例如识别对象间有怎样的对比关系,对象之间某个值上差距有多大、怎样量化,当对象放在不同背景中时对象间的差距是否会发生变化,以及怎样合理地展示对象见的不同、怎样与他人交流和沟通等。

明确对比分析的挑战

可视化的原始限制主要包括三方面:计算机数据处理能力的限制,显示区域的限制,和人类认知能力的限制。而在比较的语境下,其三方面的限制体现为参与比较的目标数量过大,单个目标的尺寸或复杂度过大,以及目标间关系的尺寸和复杂度过大。并且在解决这三个方面限制的“头疼程度”上,以上三点头疼程度成递增趋势。因此在确定对比分析的挑战时,可以分别从这三个方面考虑。

  • 参与比较的目标数量:对象之间需要两两比较,还是需要进行多目标比较?通常来说,两两比较是非常直观和简单的,因此多目标比较场景下,我们可以思考这样的多目标比较是否有必要,或是可以简化为两两比较。
  • 目标的复杂程度:参与比较的对象在视觉表达上的复杂度,会直接影响比较任务的复杂程度。以下面三幅图为例,第一幅图中对比两个折线的变化趋势可以认为是非常简单的任务,然而第二幅图中对比热力图的分布就会耗费更多的人类认知资源。对于第三幅图这种复杂的视觉设计,分析者需要耗费更大的认知资源来找出左右两个对象之间的差异(我才不会告诉你第三幅图里两个对象一模一样呢)。

img

  • 目标之间关系的数量和复杂程度:我们可以把参与比较的目标对象之间的关系描述为一个图结构,其中节点代表对象本身,边代表对象间的关系。在图结构中一个很重要的问题就是组合爆炸,即边的数量随着节点数目的增长而暴增。并且这些边本身可能带有各种属性,代表不同的关系类型。

总结一下,上述三个方面的限制可以组成一个三维的特征空间,其中每个可视化系统都可以在这个特征空间中找到属于自己的位置。对于可视化设计者来说,明确对比任务面临的挑战,即是在这个特征空间中找到可视化系统所处的位置。

img

筹划分析策略

既然知道了需要解决什么样的问题,那么我们就可以设计相应的方法来解决它们。“分析策略”可以认为在是较高抽象层次上把握解决问题的方向,主要包含三个种类:

  • 顺序扫描——最累人的方式,也是最直接的方式,基本上算是穷举所有需要比较的对象。比如在折线图的折线比较任务中,我们从左到右地遍历每一个点对。
  • 选取子集——使用采样方法,从所有需要比较的对象中选取一部分进行顺序扫描。该策略的重点在于如何选择合适的采样方法,以及采样出的对象是否具有足够的代表性。
  • 总结重点——略去细节,展现对比中的主要部分。问题在于细节无法直接展示。

如果把这三个分析策略整合到上面的挑战三维空间中,那么策略相当于降低三方面挑战复杂度的原力,将你的系统拉回原点。

制定具体设计方案

本文作者将可视化中具体的对比技术分为三大类:

  • 并排:将参与比较的对象并排放置,分析者可以来回查看需要对比的区域,如下图(a)所示。
  • 交叠:对象重叠放置,通常放在同一坐标系下,如下图(b)所示。
  • 显式编码:使用视觉编码直接展示参与比较对象之间的差异,如下图(c)和(d)所示。

img

通常来说,可视化中对比分析的视觉设计包含在这三种类别中,或是融合多种类别的技术。在选择适合的视觉设计和交互时,一定要围绕“任务导向”这一基本思想进行展开。

总结

对比是可视化中最基本的分析任务之一,本文展示了设计可视化对比分析时需要考虑的四个层次,并详细展开了每个层次中的要点。可视化设计者在设计视图时,可以将这种思维方式作为参考使用。



Questions & Discussion: ✉️ zjuvis@cad.zju.edu.cn