论文: Multi-Resolution Climate Ensemble Parameter Analysis with Nested PCPs
作者: Junpeng Wang, Xiaotong Liu, Han-Wei Shen and Guang Lin
发表会议: VAST2016/ Session Machine Learning
一、气象预测数据集及相关问题简介
气象学中, 对流是降雨形成原因。 给定一个大气状态和大气移动参数的值(对流参数),根据已有信息迭代地运行模拟来得到下一个时间段的状态。 一般将感兴趣的空间区域离散化划分成一块块网格,在这些网格上迭代计算,计算下个时间段的状态,网格大小即是分辨率。为了提升准确率,会采用不同参数调节机制,这样就导致了多组参数;另在不同的分辨率下模拟可捕捉不同尺度下的特征,导致了 多分辨率时空气象 ensembles 这样的数据集。
在相关领域研究中,这样的预测模型有一定的局限性:模型对于参数设定与分辨率都很敏感,高分辨率模型不一定总比低分辨率的好、而且计算开销不同,分辨率越精细开销越大。为此,领域专家需要分析一些问题,来应对这样的局限性。比如:不同参数之间的关联(correlation);这样的关联在不同分辨率下是否可转移(transferable);对流参数和时空模拟 ensemble 数据(输出)间的关系。
为了方便叙述,我们做一些概念的正式定义:
Ensemble 集(Ensemble Set) :
一次模拟的运行输出包含了多天的预测结果,单天的结果称为 ensemble item;
多天的构成一次运行的输出结果称为 ensemble member;
多个 ensemble members 构成 ensemble set(简称 ensemble),会有不同分辨率。
参数集(Parameter Set) :
一次模型运行中,由不同对流参数的值组成的一组值称为参数设定;
一个 ensemble 中采用的一批参数设定被称为一个参数集。
观测集(observation set) :
卫星观测到的特定区域的在一段时间上的天气,每天是一个观测项(observation item)。同样可以有不同分辨率。在此基础上我们定义更具体的分析任务,其中 R1~3 针对于参数可视化、而 R4~6 针对于 Ensemble 的可视化。
R1 集内参数关联(intra-set parameter correlation)
R2 集间参数关联(inter-set parameter correlation )
R3 高维参数范围查询
R4 Ensemble item 和 ensemble member 的质量评估
R5 Ensemble member 的比较
R6 展现 ensemble 的时空方面的特性
二、系统概览
系统结构清楚,各视图分工明确,其中有三个主要视图:嵌套平行坐标、概览视图、地理信息视图。
三、可视设计
文章首先将一些常见平行坐标图列举,针对本文分析问题,陈述各自优缺点(他们用的是同一种人造数据),如下图:
本文提出的嵌套式平行坐标 (NPCP), 则结合了他们的优点, 避免了他们的缺点. 其设计上也比较细致, 比如颜色、透明的自定义、实时范围查询的支持 交互上也做的很周到.
对于概览图,分为两块:Heatmap 展示天气预测的质量评价、 dendrogram 展示 ensemble 之间的关系。
其中质量评价是与观测集比较的,每个 ensemble item 有一个准确度的值,每个 ensemble member 是一个准确度向量。而在 dendrogram 中,首先有了准确度向量结合 Dynamic Time Warping 计算 ensemble member 之间的关系,这样计算出一个对称的距离矩阵,对于这个用自底向上的层次聚类。这些视图都是可以互相联动的,并且与 NPCP 也是互相关联的。
最后还有一些地理信息视图,从 ensemble item 和 ensemble member 的层面来展示上面预测结果与地图结合的可视化结果。
四、案例与专家评价
文章用了 2007 年 6 月某地 30 天的数据 (如下),其中专家感兴趣的有 5 个。结合这些数据,有一些比较浅显的 case,这里不再 复述。
专家评价如下(比较常规性的评价)
- NPCP / heatmap + dendrogram 都获得好评
- 两者间互动构建了参数和 ensemble 之间的关联
- 可以泛化至其他类似应用场景
局限性:
- 在某些条件下可视化结果会显得复杂
- 学习曲线略陡
- 数据量太大时仍有视觉混乱
五、个人想法
解决的问题看似不难(其实也算是个老问题),但其实文章抽象概括的很好,并把可视化很好的套上去;提出的分析任务也是很完备。设计上尽管有些细节可能略奇怪,但总的来说还是十分细致,并且交互简洁而实用。文章的语言描述也很完备。在系统评估方面,篇幅比较少、也未给人耳目一新的感觉。
✉️ akiori@zju.edu.cn