论文:ConTour: Data-Driven Exploration of Multi-Relational Datasets for Drug Discovery
作者:Christian Partl, Alexander Lex, Marc Streit, Hendrik Strobelt, Anne-Mai Wassermann, Hanspeter Pfister and Dieter Schmalstieg
发表会议:VAST 2014
在现有的医药、化学领域探究多种关联性信息的研究中,由于数据尺度、关联性复杂等问题,快速探究多关联性很有难度,本文设计了名为 ConTour 的针对探索复杂、多关联性数据的交互性可视分析技术。用于探究在药物探索中,对药物潜在有效性和安全性的研究工作。
系统在功能上是对个体项目进行一系列属性关系的重排序;利用列嵌套、筛选等交互在表现具有父子关系的关联信息的交互,通过关系视图表达列与列之间的关联性的强弱、数据丰富的属性;通过细节视图同时表达多个数据集之间的多个个体的关联关系。
本文的相关工作分为三个部分:
Graph Exploration:Jigsaw、GraphTail
Faceted Browsing:InfoZoom、FOCUS
Pharmacology visualization: 相关的医药研究领域的可视化工具
本文的系统设计基于医学上的 Biological Fingerprints(基因指纹)的概念,用来记录能够作用在细胞或者有机体上的分子和反应过程。设计的目标需求由相关专业领域的专家们提出:
- 系统可以表现药物的反应机制;
- 系统可以表现药物机制的生物反应流程;
- 系统能够观察到在特定的治疗方案中新药品的潜在效用。
系统的数据是医药公司提供的大规模尺度的 Pathways 数据,从中我们可以提炼出相关的 Gene,Compunds,Fingerprints,Therapeutic Groups 数据集,用于探究其中的关联信息。
系统提出了 6 种分析任务:
鉴别个体之间的关联性;
表现个体集合之间的全部相关关系;
分析丰富的网络结构;
对个体进行排序;
筛选项目的个体;
观察每个个体的细节信息。
针对以上的 6 种分析任务,系统在关系视图中设计了几种操作方法:
选择、高亮项目:设计了 Hover 和 Click 的交互方法,click 的操作附带置顶的功能设计
筛选选择项:设计了交集和并集两种选择模式
- 嵌套操作:分为简单的嵌套设计,压缩空间;循环嵌套表示多层次的关系
- 排序、排列操作:可以根据首字母、数值属性进行排序排列
- 列筛选:可以进行全局筛选或者局部的列筛选
在细节视图上,有关系视图触发生成,有效得显示一种或几种条目的可视化结果,包括平行坐标视图,化合物分子式视图。
在关系视图中:D 视图利用柱状图表示基因指纹的数值属性,其中灰色的背景色表示数值的有效性;B 视图表示选中的项目的两个参数,对作用的有机物的影响效果(促进、抑制还是绑定),以及化合物的 AC50 指数大小;在嵌套的关系视图中,F 视图表示具有的相关性的 Items 的数量信息;E 视图表示聚类中的基因指纹的中位数的线图。
在细节视图中,显示了路径视图,分子化合物的分子式视图,平行坐标视图等,来表示 Pathway 的流程和涉及到的反应物。
除此之外,还设计了历史视图和筛选视图作为系统的辅助视图,方便交互和使用。
文章定义了加强指数的概念,用来直观的反应药物或者化合物的作用的效果比重。
Case Study:
本文设计了三个 Case Study,通过专家的使用和反馈信息来评估系统的有效性和正确性,以及评估系统是否具有能够快速分析相关关系的属性的实用性。
观察四种对磷酸二酯酶有抑制作用的化合物中找出聚类中其他的化合物,通过这样的交互和流程,可以得到用于类似症状治疗的其他的化合物,便于观察不同药物之间治疗效果的相似性
探究在相同的治疗方案中化合物的有效性的比重,用来探究药物之间的化学相似性和生物相似性
通过反应过程的可视化结果来解释聚类中的组成成分的相似性和作用关系。
总结:
本文设计的 ConTour 系统,是一个具有友好交互性、面相大规模尺度的医学相关性探究数据的可视分析系统,在今后的发展中,还可能拓展到其他领域的多关联信息的大数据的探究和分析;并且在大屏可视化中也有一定的使用价值。文章对交互和功能的描写非常相信严谨,各个章节都有相关领域的专家进行评价和反馈。
✉️ zjuvis@cad.zju.edu.cn