论文:ColorMapND: A Data-Driven Approach and Tool for Mapping Multivariate Data to Color
作者:Shenghui Cheng, Wei Xu, Klaus Mueller
发表:IEEE TVCG 2018
动机
目前为止几乎没有支持将多元数据到颜色的研究,已有的一些方法能够将低维数据映射到颜色,但只支持2~3个变量。
系统界面
系统由四个视图构成,Color Legend(本文方法生成的调色板), Pseudo Colored Plot(着色图),Local Enhancement(对选择区域进行对比度增强)和Channel View(对单个属性分布着色)。
基础框架
基本任务
- 数据样本间的相异性可以通过颜色来感知。
- 属性间的相异性可以通过颜色来感知。
- 将数据样本与属性之间的关联表示为可感知的颜色标记
色彩映射
本文的多元数据映射到颜色的方法 简单说就是 将数据点嵌入到Radviz空间,在根据嵌入点的坐标 计算得到相应的色彩值。
解决方法
- 任务一和任务三可以通过RadViz来解决,由于Radviz的特性,数据样本 越相似,布局位置肯定越接近;数据样本某个属性的值相对越高,它与边缘上的属性点位置也会越近。任务二通过一种新的基于相似性的属性排序和间距来解决,通过哈密尔顿回路 对属性进行排序 ,根据属性相关性 确定 间距。
将优化后的RadViz显示器 与 等形状的彩色地图融合,形成ICD(circular interactive multivariate color mapping display)。
三大基本任务中相异性都需要通过颜色来感知, 这一过程的基础是需要一个精确的色彩空间。这个色彩空间需要符合以下3点要求:
a. 感知均匀;
b. 圆盘形状;
c. 颜色空间的色调饱和度切片应该是等亮度的。
CIE HCL (Hue Chroma Luminance)符合了以上要求,但在显示器所用的sRGB色彩空间环境下只能显示部分色彩,因此需要在可见部分中找到最大直径的CIE HCL切片来作为ICD中使用的色彩空间。
其他功能
多元着色插值
Adaptive kernel density estimation(AKDE)是核回归(kernel regression)方法的一种,是使用核函数对数据进行非参数估计(nonparametric estimation)的回归模型。本文对着色图根据数据样本进行AKDE插值讨论了三种策略:
- 先着色,后插值(效果不好,颜色偏差)
- 先插值,后着色(布局过程需要不断迭代,初始位置丢失,代价昂贵)
- 先插值,根据插值计算权值来着色(Nadaraya-Watson回归)
处理大规模数据
当数据样本过多时,会造成ICD过于密集遮挡调色板的问题。本文使用了hashmap采样来解决这个问题,既解决了遮挡色板的问题,又能保持整体分布。下图分别为原始、降采样和hashmap采样三种效果。
案例分析
America’s Mood Map
从华盛顿和俄勒冈州来看,这两个州的人性格非常相似,但与相邻的加州却有很大的不同,主要的区别是外向。另一方面,蒙大拿州是一个相对“正常”和“和平”的州——它在所有属性上几乎是平等的,值也很低。
总结
- 通过ICD,可以得到多元数据的着色方案。
- 颜色能在一定程度上表现数据样本的组成和相关性。
- 颜色对数据相关性的表达未定量地评估。
- HCL空间和sRGB空间不能完美覆盖。
✉️ zjuvis@cad.zju.edu.cn