论文:A Multi-Level Typology of Abstract Visualization Tasks

会议:InfoVis 2013

作者:Matthew Brehmer, Tamara Munzner

这是一篇关于可视化理论架构的文章,和通讯作者 Tamara Munzner 在 09 年提出的可视化设计与评估的嵌套模型[1]相匹配,描述了从抽象任务到具体算法的可视化设计过程。文章从 why, how, what 三个层面对可视化任务进行抽象的分类,其中 why 指明任务的目的和目标(展示、发现、兴趣),how 说明达到目标所用的方法(可视表达,数据操作、交互),what 通过输入和输出对不同层次任务进行串联。基于这种分类,文章对已有可视化系统、方法进行回顾和分类。

在这篇论文之前有必要先对上文的可视化设计嵌套模型加以说明。如下图所示,可视化的设计自顶向下分为 4 个层次:首先定义问题和任务,可视化的目的是什么,达成目的需要完成怎么样的任务;其次达成所需的任务需要什么数据,对数据进行怎么样的操作;再次对这样的数据进行的操作最终落实到可视化层次需要怎么样的可视编码和交互设计;最后对于可视化编码和交互设计对应的算法。

img

这篇论文相当于是对上一篇论文的进一步细化,对各个层次所对应的目的、形式、方法所涵盖的内容进行分类,提取任务之间的输入和输出作为任务流的串联,从而解决可视化设计中 why、how、what 三个问题。

img

上图 why 的第一层表达了用户使用或者设计师设计可视化作品的最初目的,无非呈现(present)、探索(discover)和把玩(enjoy)三种,另外用户也可能在使用的过程中生成新的可视化内容(produce)。所有的可视化任务落实到操作上首先都要找到用户关心的数据点(search),这种 search 可以是已知要找什么数据也知道位置在哪里的查找过程(look-up),可以是知道数据不知道位置的定位过程(locate),可以是不知道数据但是知道位置的浏览过程(browse),也可以是既不知道数据也不知道位置的探索过程(explore)。一旦找到所关心的数据点,用户可以执行识别(identify,对于一个数据点)、对比(compare,对于两个数据点)和概括(summarize,对于多个数据点)。

这些任务都对应了方法中的可视编码(encode)和交互过程,其中交互分为对原始数据的操作(manipulate)和产生新数据的操作(introduce),对应上图的 how 部分。任务之间以输入和输出进行关联,对应上图的 what 部分。

做好分类后,本文以这种分类方法对几个系统的任务案例进行尝试分类,这里只展现对 Overview 系统的分类案例。如下图,系统的两个视图分别生成可视化结果(task 1a 和 1b),这里生成了新的衍生数据;用户 在两个视图的综合使用下发现数据(task 2),也就是在可视编码中进行导航和选择;最后执行人工标注(task 3),又产生了新的数据。这样,即便我不知道 Overview 是个怎么样的系统,也能够理解其中的逻辑过程。套上系统和数据的语义就可以设计实现出对应的功能和算法。

img

话说分类的目的是什么呢?其目的有三,一是区分类型相似的可视化系统,在整个可视化任务完成过程中哪个环节是不同的;二是指导设计师对可视化作品的设计,设计师可以将一个可视化作品按层次逐层分解为任务-操作-编码与交互,并通过输入输出将任务串联;三是评价可视化系统,分类可以将可视化的系统评价细化到具体某个任务的某个层次设计得好或不好。

案例之后,本文首先归纳了已有的一些可视化系统和方法到本文的分类系统中。然后对在分类过程中参考的认知科学、玩耍理论(play theory)、sense making 理论,以及其它可视化相关理论进行集中的讨论。尽管已有一些对于任务和交互相关的分类(Jokn T. Stasko 也是可视化理论建设执牛耳者),本文是唯一一篇连通高层次任务到低层次方法与算法的完整的分类,并且考虑到人们在使用可视化的根本目的是不同的,有人为了作展示,有人为了探索数据,而有的人只是想把玩一下这个可视化作品。

惭愧地说我以前都不喜欢阅读可视化的理论建设、感知认知方面的论文,觉得太不工科了,没什么技术含量。相信很多读者也是这么想的,觉得那些需要很复杂的数据结构和算法、处理非常大非常复杂的数据集的论文才是很厉害的论文。但是可视化作为一个交叉学科,集合心理学、认知行为学、艺术设计、计算机科学、数学等从非常感性到非常理性的学科,本身就不应该“偏科”。信息可视化和可视分析作为新兴学科,早年更多地在底层的交互、布局算法上展开研究,这也使得理论建设的研究有了更加坚实的基础。因此这几年这方面的论文开始涌现。虽然一般不需要有系统实现,但是理论框架的建设并不是一件容易的事情,这需要作者对整个领域有透彻的了解和独到的见解。本文的参考文献一共 80 余篇,一部分是已有可视化理论的援引,一部分是认知科学的理论,另一部分是已有可视化系统的回顾和分类。没有强大的研究基础的人是写不好也不敢写这样的论文的。

Tamara Munzner 在她即将出版(2014 年?)的书中系统地介绍了可视设计和分析的理论和方法[2],她很慷慨地将进行中的草稿公开分享。虽然只是草稿,还存在很多问题(很多图都只是草图,内容并不完整),但是还是非常值得大家阅读。能够在设计可视化的时候提供很多指导。

[1] T. Munzner. A nested model for visualization design and validation. IEEE Trans. Visualization and Computer Graphics (TVCG), 15(6):921–928, 2009.

[2] Tamara Munzner. Visualization Design and Analysis: Abstractions, Principles, and Methods (draft). http://www.cs.ubc.ca/~tmm/courses/533/book/ (该书作者声明:书籍未正式出版,请勿在正式场合引用)



Questions & Discussion: ✉️ zjuvis@cad.zju.edu.cn