论文: Multi-Resolution Climate Ensemble Parameter Analysis with Nested PCPs

作者: Junpeng Wang, Xiaotong Liu, Han-Wei Shen and Guang Lin

发表会议: VAST2016/ Session Machine Learning

一、气象预测数据集及相关问题简介

气象学中, 对流是降雨形成原因。 给定一个大气状态和大气移动参数的值(对流参数),根据已有信息迭代地运行模拟来得到下一个时间段的状态。 一般将感兴趣的空间区域离散化划分成一块块网格,在这些网格上迭代计算,计算下个时间段的状态,网格大小即是分辨率。为了提升准确率,会采用不同参数调节机制,这样就导致了多组参数;另在不同的分辨率下模拟可捕捉不同尺度下的特征,导致了 多分辨率时空气象 ensembles 这样的数据集。

在相关领域研究中,这样的预测模型有一定的局限性:模型对于参数设定与分辨率都很敏感,高分辨率模型不一定总比低分辨率的好、而且计算开销不同,分辨率越精细开销越大。为此,领域专家需要分析一些问题,来应对这样的局限性。比如:不同参数之间的关联(correlation);这样的关联在不同分辨率下是否可转移(transferable);对流参数和时空模拟 ensemble 数据(输出)间的关系。

为了方便叙述,我们做一些概念的正式定义:

Ensemble 集(Ensemble Set)

  1. 一次模拟的运行输出包含了多天的预测结果,单天的结果称为 ensemble item;

  2. 多天的构成一次运行的输出结果称为 ensemble member;

  3. 多个 ensemble members 构成 ensemble set(简称 ensemble),会有不同分辨率。

参数集(Parameter Set) :

  1. 一次模型运行中,由不同对流参数的值组成的一组值称为参数设定;

  2. 一个 ensemble 中采用的一批参数设定被称为一个参数集。

观测集(observation set) :
卫星观测到的特定区域的在一段时间上的天气,每天是一个观测项(observation item)。同样可以有不同分辨率。在此基础上我们定义更具体的分析任务,其中 R1~3 针对于参数可视化、而 R4~6 针对于 Ensemble 的可视化。
R1 集内参数关联(intra-set parameter correlation)
R2 集间参数关联(inter-set parameter correlation )
R3 高维参数范围查询
R4 Ensemble item 和 ensemble member 的质量评估
R5 Ensemble member 的比较
R6 展现 ensemble 的时空方面的特性

二、系统概览

系统结构清楚,各视图分工明确,其中有三个主要视图:嵌套平行坐标、概览视图、地理信息视图。

三、可视设计

文章首先将一些常见平行坐标图列举,针对本文分析问题,陈述各自优缺点(他们用的是同一种人造数据),如下图:

本文提出的嵌套式平行坐标 (NPCP), 则结合了他们的优点, 避免了他们的缺点. 其设计上也比较细致, 比如颜色、透明的自定义、实时范围查询的支持 交互上也做的很周到.

对于概览图,分为两块:Heatmap 展示天气预测的质量评价、 dendrogram 展示 ensemble 之间的关系。

其中质量评价是与观测集比较的,每个 ensemble item 有一个准确度的值,每个 ensemble member 是一个准确度向量。而在 dendrogram 中,首先有了准确度向量结合 Dynamic Time Warping 计算 ensemble member 之间的关系,这样计算出一个对称的距离矩阵,对于这个用自底向上的层次聚类。这些视图都是可以互相联动的,并且与 NPCP 也是互相关联的。

最后还有一些地理信息视图,从 ensemble item 和 ensemble member 的层面来展示上面预测结果与地图结合的可视化结果。

四、案例与专家评价

文章用了 2007 年 6 月某地 30 天的数据 (如下),其中专家感兴趣的有 5 个。结合这些数据,有一些比较浅显的 case,这里不再 复述。

专家评价如下(比较常规性的评价)
  • NPCP / heatmap + dendrogram 都获得好评
  • 两者间互动构建了参数和 ensemble 之间的关联
  • 可以泛化至其他类似应用场景
局限性:
  • 在某些条件下可视化结果会显得复杂
  • 学习曲线略陡
  • 数据量太大时仍有视觉混乱

五、个人想法

解决的问题看似不难(其实也算是个老问题),但其实文章抽象概括的很好,并把可视化很好的套上去;提出的分析任务也是很完备。设计上尽管有些细节可能略奇怪,但总的来说还是十分细致,并且交互简洁而实用。文章的语言描述也很完备。在系统评估方面,篇幅比较少、也未给人耳目一新的感觉。



Questions & Discussion: ✉️ akiori@zju.edu.cn