图简化技术——要简单,要有“型”

论文:Motif Simplification: Improving Network Visualization Readability with Fan, Connector, and Clique Glyphs

会议:CHI2013

作者:Cody Dunne, Ben Shneiderman

图简化技术是大规模网络可视化衍生出来的一个问题,对于数据量大(一般网络布局对上千个点和边的处理就已经非常勉强)结构复杂的网络,除了利用交互获取网络局部信息之外,就是要使用图简化的技术了。图简化技术也分点聚合(node aggregation)、边剪枝(edge pruning)和边绑定(edge bundling)三种:边绑定有多种模型,基于骨架的(energy-based),基于能量的(energy-based)等等;边剪枝的典型就是构建网络的最小生成树;这篇论文描述的是第一种点聚合技术。

本文之前的点聚合技术有基于属性的,也有基于拓扑的,本文属于基于拓扑结构的。这篇论文的切入点很小,就是把基于一定拓扑结构聚合而成的点集用能够一定程度上表意的图元来表达。为了证明这种方法的有效性,作者设计了 3 种常见网络结构的聚合表达,如图所示:

  • Fan — 扇形表达节点中心性(node centrality),描述一个节点连接多个叶节点的情况,如下图左上的紫色节点连接橙色节点而形成的结构
  • Connector — 锥形菱形表达节点的连接性质,描述一系列节点共享完全相同的连接节点,如下图中上,中间三个节点所连接的节点是相同的
  • Clique — 粗”X”形表达完全连通子图(clique),如下图右上

1

经过一系列的图结构检测算法(感兴趣的读者可以搜索论文的补充材料),就可以把一个纷繁复杂的网络简化成非常简单的形态。以论文中的第一个案例美国议员投票模式相似性数据为例,如下 4 张图分别表示把议员之间的投票模式相似性分别按 65%相似、70%相似、80%相似、95%相似进行过滤。过滤结果逐层表达了美国议会议员之间的关系:民主党和共和党各自为阵,部分议员党性不纯,部分议员党性纯正但是投票不随大流,共和党内部拉帮结派等等。

2

作者将这个方法在NodeXL上开源发布出来,用户可以直接安装 NodeXL 并在上面试用这个功能。

作为一篇 CHI 的文章,作者在论文中花了很多笔墨描述他们设计这些图元(而不是其它图元)的数据合理性和感知合理性,细到用户对视觉通道的敏感优先级等的考虑。这让小编想起了之前看到的 Stephen Few 的关于地理数据可视化的“砖形”(bricks)可视化方法,虽然这种方法在处理重叠上比较吃力,但是的确提出了一种非常易于进行数值量化比较的地理相关的数值型数据的可视化表达。给出一个简单示意图如下,相比用大圆小圆表达不同的数值,砖形表达在数值对比上更加清晰。

3



Questions & Discussion: ✉️ zjuvis@cad.zju.edu.cn