7 月 30 日至 31 日,在浙江大学紫金港校区国际会议中心,第八届可视化暑期学校拉开了帷幕。本次暑期学校侧重于数据可视化与可视分析系统设计与开发中的基础原理与关键技术,邀请到了国内外可视化研究领域资深学者和资深可视化工程师进行原理性教学和实战分享。
暑期学校伊始,本次暑期学校的学术顾问——浙江大学陈为教授主持了开幕式,对在场的 400 余位来自各个领域,对可视化抱有热忱的学员表示欢迎。中国计算机学会常务理事、浙江大学软件学院副院长卜佳俊及阿里巴巴研究员、阿里云大数据业务负责人徐常亮分别代表学术界及企业界对学员表达了期望。
课程正式开始。两天的可视化课程从理论出发,技术入手,深入浅出地讲解了如何将数据可视化和可视分析技术落地。第一课由来自 DataV 团队的宁朗介绍了阿里巴巴可视化 datav 团队在近年来的发展历程及阿里巴巴可视化大屏。震撼的大屏实时地承载淘宝交易数据可视化,令人叹为观止。
蚂蚁金服团队的再飞介绍了数据编码和图形语法的概念,并引出以此为基构建可视化框架和数据处理流程的 G2 可视化引擎。报告中运用丰富的样例展示了 G2 如何进行各种视觉属性的映射方法,展现了如何通过 G2 简单快捷地构建各种可视化图表。
美国普渡大学的钱振宇教授向大家介绍了如何利用认知学和设计美学来提升可视化设计。在对传统美学、格式塔心理学等设计原则和常见的认知学模型进行介绍后,钱教授给大家展示了若干信息图结合数据雕塑的作品与 2013 年电气工程师学会可视化设计比赛获奖作品,并最终提出了“以人为本”的可视化设计准则和“不忘初心,方得始终”的八字箴言,为大家带来了一场舒爽心神的杏花春雨。
同样来自美国普渡大学的陈英杰老师,给我们带来了一场关于“可视化分析系统设计与实现过程”的学术报告。他对比了工程类学生与设计/艺术类学生的特点:大多数工程和技术专业学生容易快速地专注于解决项目中的技术难题;而设计/艺术类的学生往往倾向关注设计中的实用性、创新性以及产品美学上的细节。将两者的优势相结合对可视化有很大意义,陈老师通过实例,生动形象地向我们介绍了“可视化设计的合作模型”。本次报告的亮点之一是陈老师对设计草图的描述。陈老师认为,很多设计过程都缺少头脑风暴和绘制草图两个环节。在工业设计项目中,设计师动辄几十张草图。这些点子不一定完善,但是每张草图都要有自身独特的部分。随后,将每张草图都付诸实践是不现实的,我们可以通过将草图转化为认知学中的 external cognition 来对它们进行评估。
中科院软件所的时磊老师,在第一天下午的课程讲了网络可视化。时磊老师开始演示了几个经典的网络可视化的例子。随后时磊老师重点说了图布局的规则,那就是最小化边交叉的数目。对于各种布局算法,和非节点边的网络可视化进行了讲解。最后时磊老师讲了大型网络和动态网络的可视化。现场提问踊跃,几位学员相继问了时磊老师关于实例,大型网络,动态网络等的问题。
浙江大学的马昱欣分享了常用的多维数据可视化技术,包括各种常见的可视化布局类型、常用方法优缺点,以及多维数据可视分析的综合案例等。除了大量介绍方法内容外,该报告还介绍了一整套多维数据可视化方法的分类框架,用于辅导初学者尽快掌握各种可视化方案的特点和使用场景等。
浙江大学的陶煜波教授,讲了科学计算可视化,也就是对科学计算产生的大规模数据以图形图像等更直观的形式展示出来。科学计算可视化,可应用于生物,医学,地质勘探,气象,模拟仿真等诸多领域。陶老师之后讲了二维和三维的标量场可视化,以及向量场可视化,对于常用的科学可视化工具和方法都进行了介绍。
来自浙江大学的梅鸿辉对可视化工具库 D3.js 做了简单的介绍。通过实际案例简单地阐述了使用 D3.js 逐步构建可视化图表的方法,从布置编程环境、D3.js 的基本使用思路以及程序调试方法等方面进行了详细的阐述。报告最后还将 D3.js 与其他现有可视化工具做了简单地比较分析。
浙江大学的巫英才老师分享了关于他在社交媒体数据可视分析方面的经验。微信、微博这些软件让社交媒体数据无时无处不在。这些数据兼具信息属性和社会属性,数据量大且应用广泛。巫老师不仅介绍了一个实战案例应该具备的流程,还详细其每一步以及这一步中所用到的一些使用工具或是范式告诉大家,听众无不觉得受益匪浅。
浙江大学的夏菁博士带来了应用场景下的数据分析流程和数据方法。她提出了一个数据分析流程,包括数据收集、数据清洗、数据初探、任务整理、数据建模、数据整理和存储、数据可视化。她详细解释了数据质量问题,以及这些质量问题的清洗方法。在一些案例和工具的介绍之后,她向大家传达两个信息:数据清洗和数据初探是数据分析至关重要的步骤,而可视化可以大大降低数据分析的成本。
来自浙江大学的翁荻博士分享了基于 MEAN.js 的可视化系统研发。可视化系统现在最流行的便是通过 Web 技术实现,他的讲座满满的都是干货:利用 MEAN.js,从后台到前端的每一个环节的入门知识和对初学者的使用建议、注意事项,以及他们今年在可视化顶级会议 VIS 中投稿的作品构架的完整步骤。
浙江大学的王叙萌
mail: wangxumeng@zju.edu.cn博士通过三个经典可视化流程介绍了交互再可视化中的位置。之后,讲者通过“先从进行概览,再放大或者过滤,最后根据需求分析具体信息”这一可视化名言引出对交互的具体介绍。基于大量实例,依次对选择、浏览、重构、编码、抽象/具象、过滤和关联七种常见交互做了详细的介绍。最后,王老师通过一个比较完备的交互系统——#Fluxflow 讲解了如何将多种交互结合到一个系统中去。
来自浙江大学的黄兆嵩
mail: zhaosong_huang@zju.edu.cn博士通过四个部分介绍了城市数据的可视分析:首先追本溯源,讲述了城市数据的基本定义以及应用的领域,介绍了城市数据的三大挑战,数据量大,多源异构和理解困难。然后介绍了城市数据在数据展示,城市规划,交通管理和社交分析领域不同的相关工作。最后结合城市数据实战案例介绍了处理可视分析系统的设计流程。包括数据清洗,数据存储与处理及数据的可视分析。
由于海量信息的涌现,人们的阅读和检索速度远远无法跟上信息出现的速度。采用文本可视化的方法可以帮助我们分析浩瀚如烟,从中快速发现知识。曹楠老师用精彩的报告向我们介绍了文本可视化的基本任务和研究方法,包括用词云展示文档内容,用实体关系模型建模文档间的联系。最后曹楠老师用实际案例向我们介绍了对于文本可视化从内容提取到可视化设计的整个流程。
地理空间数据在地理测绘、人类生活社会发展和国防军事方面都有着重要大作用。浙江财经大学的周志光老师为我们讲解了地理信息的编码方法,以及针对时空数据的可视化方法。周志光老师用交通数据的案例展示了地理空间数据可视化的流程,让我们看到数据可视化在分析理解城市交通运行规律并且提供决策依据方面的潜力。
来自中南大学的赵颖老师分享了网络安全数据可视化的数据及任务分类,并对每种数据和任务类型所对应的常见可视化方案进行介绍和比较。同时,报告还分享了讲者在 VAST Challenge 2013 上的获奖系统的设计和实现,以及整个数据分析过程等,为学院现场展示了数据中的真实网络安全案例。
本次暑期学校,除了来自阿里云天池可视化大赛的近百位选手,还包括 100 位来自阿里公益基金会、中国气象局、阿里集团的近百位特邀学员、浙大软件工程硕士班 60 名学员和来自高校和企事业单位的 150 名学员。本次暑期课程的全部内容都经暑期学校老师精心组织和准备。通过本次暑期学校,既可以培训可视化比赛选手,也可以向大众揭开数据可视化的面纱,让对可视化感兴趣的人有机会接触实践这门艺术。
✉️ zjuvis@cad.zju.edu.cn