论文: AggreSet: Rich and Scalable Set Exploration using Visualizations of Element Aggregations

作者: M. Adil Yalçın, Student Member, IEEE, Niklas Elmqvist, Senior Member, IEEE, and Benjamin B. Bederson

发表会议/期刊: InfoVis2015

本文的三位作者均来自马里兰大学帕克分校。文章针对set-typed(类别型多值)属性的可视分析进行了建模,并实现了一个功能丰富、数据可拓展的探索系统。

Set-typed属性

Set-typed属性的值可能由多个类别型数据组成,比如:电影的类别,食谱的原料,学生上过的课程等等。

根据元素的set-typed属性,可以判断元素是否属于某个类型(集合)或多个类型的交集。

大量的真实世界的数据集具有set-typed属性。

相关可视化手段

1. 欧拉图

img

欧拉图在外观上与韦恩图类似,主要展示的是对象的特定集合,韦恩图还包含全集的表示,包含所有可能的集合。对欧拉图的优化主要在复杂图形的分解上。

欧拉图的局限在于:集合的数量一旦增加,图形的复杂度陡增,一般难以处理集合数>10的情况。

2. 覆盖图

img

覆盖图的思路是将元素映射到而且平面中,通过图形覆盖且仅覆盖所代表集合的元素。覆盖的图元一般为块状、条带或者线条。

覆盖图的局限在于:平面中能表示的元素有限,并且对属于多集合的元素,图形覆盖问题过于复杂。

3. 节点链接图/弦图

img

节点链接图/弦图中,节点表示集合,节点之间的连线表示两个集合的并集。传统的节点链接图/弦图无法表示3+个集合的并集,于是有文章将连线也具象为一个节点,通过这种方式实现多集合并集在图中的表示。

节点链接图/弦图的局限在于:图像的篇幅局限了集合数和链接密集程度。

4. 矩阵图

img

矩阵图中,每个单元可以表示两个集合的并集,且更易于搜索和比较并集。

矩阵图的局限在于:难以表示多集合之间的交集。

建模

img

1. 数据表现

如图6,set-typed属性数据分析中,涉及的数据以元素或集合(聚合)的形式呈现。

2. 底层操作

在图6中可以看出,set-typed属性数据分析的底层操作包括五个:分析、发现、检索、选择、同步。

3. 高层任务

  • 比较任务,可以通过“选择→同步→分析”的模式完成
  • 基于共同元素的集合关系探索
    集合关系【不相交、弱相关、强相关、真子集、相等(由弱到强)】与关系强度表示

系统介绍

本系统提供在线Demo,如图1所示。
img

通过图7简单介绍通过在电影数据集中的主要视图;电影的所属类别是set-typed属性。

  1. 集合度统计,在此数据集中为对电影所属类别数的统计。大部分电影(2k+)只有1个电影类别,有7部电影属于5个电影类别。
  2. 元素列表,按一定顺序排列。在评分高的电影中,只有《The Godfather》是动作电影(鼠标悬停)。
  3. 集合元素统计、比较。在惊悚电影中,有133部动作电影(橘色)和更少的烂漫电影(黑色)。
  4. 矩阵图统计。科幻冒险电影中,有超过半数的动作电影(橘色)和很少的烂漫电影(黑色)。
  5. 矩阵图统计。惊悚电影(一行一列)中,动作电影多于儿童电影。
  6. 矩阵图统计。不存在儿童犯罪电影(无背景色)。

系统通过联动和动画,提升了交互中的体验。矩阵图中,通过最小最小生成树算法,对可能存在的关系紧密的若干节点进行了聚集和排序。

本文因篇幅关系,仅粗略介绍系统的主要功能,更多细节和介绍,请访问Demo页面以及其中的相关介绍。

>>>介绍视频

引用

  • Yalcin M A, Elmqvist N, Bederson B B. AggreSet: Rich and Scalable Set Exploration using Visualizations of Element Aggregations[J]. Visualization and Computer Graphics, IEEE Transactions on, 2016, 22(1): 688-697.
  • Alper B, Riche N H, Ramos G, et al. Design study of linesets, a novel set visualization technique[J]. Visualization and Computer Graphics, IEEE Transactions on, 2011, 17(12): 2259-2267.
  • Henry N, Fekete J D. Matlink: Enhanced matrix visualization for analyzing social networks[M]//Human-Computer Interaction–INTERACT 2007. Springer Berlin Heidelberg, 2007: 288-302.
  • Alsallakh B, Aigner W, Miksch S, et al. Radial sets: Interactive visual analysis of large overlapping sets[J]. Visualization and Computer Graphics, IEEE Transactions on, 2013, 19(12): 2496-2505.
  • Lex A, Gehlenborg N, Strobelt H, et al. UpSet: visualization of intersecting sets[J]. Visualization and Computer Graphics, IEEE Transactions on, 2014, 20(12): 1983-1992.
  • Kim B, Lee B, Seo J. Visualizing set concordance with permutation matrices and fan diagrams[J]. Interacting with computers, 2007, 19(5-6): 630-643.


Questions & Discussion: ✉️ zjuvis@cad.zju.edu.cn