tableau数据可视化方案(大数据可视化系统项目)

本文从大数据应用出发,讨论数据可视化在大数据时代所面临的一系列挑战,并重点介绍AutoVis针对这些挑战所做尝试及其体系架构、关键技术和功能特点。

简介:AutoVis是清华大学“大数据系统软件国家工程实验室”自主研发的大数据可视化设计框架。面向大数据应用,特别是工业场景,此框架提供了一种新的数据生成图表和看板的方式,具有表达能力丰富、简单易用、高可扩展、高效率等特点,已应用于中车四方车辆有限公司、石家庄天远科技集团有限公司等工业企业。

前言

“看见”是人类的基本需求,也是人类探索未知的重要途径。2019年,多个机构通过捕捉射电波,收集大量数据,帮助人类第一次“看见”黑洞。数据可视化使得人们透过数据“见所不见”,成为人与数据之间的“桥梁”。作为第四范式“数据密集型科学发现”的组成部分,数据可视化已广泛应用于不同的科学研究领域。伴随着计算机通用化、信息时代、互联网时代的发展,数据可视化逐渐应用于人们生活的各个领域。在大数据时代,数据可视化应用更加广泛,并面临诸多新的挑战。

挑战

大数据时代,数据应用需求多种多样,数据特点亦发生本质上的变化。智能硬件的丰富与普及,互联网、物联网、移动化、智能化的浪潮,给数据可视化带来新的机遇与挑战。如下图所示,我们简要梳理了数据可视化(系统)在大数据应用中所面临的一些关键问题,例如数据规模增加,屏幕像素空间有限,数据可视化系统的数据采样能力与绘制效率问题突出。数据多样的特点要求数据可视化系统不仅需要支持更多的可视化方法,也要具有良好的系统可扩展性以适应不断出现的新数据、新需求。数据快速变化的特点要求数据可视化系统能够快速构建新的图表,及时捕捉数据变化。由于不同使用者所关注数据特征的差异及数据探索的需求,可视化图表的交互性在大数据时代将更加重要。

tableau数据可视化方案(大数据可视化系统项目)

数据可视化编程工具与系统

梳理大数据可视化所面临的挑战与相关进展,可见其中有许多问题亟待解决,例如系统数据采样能力、表达能力、可扩展性、图表快速构建能力以及交互能力。下面介绍我们的相关工作。

AutoVis

AutoVis是清华大学 “大数据系统软件国家工程实验室”针对大数据场景自主研发的数据可视化设计框架。如下图所示,围绕大数据所带来的挑战,采用可视化设计的技术路线,基于平台化架构思想,我们尝试设计新的大数据可视化工具,其定位是成为一个开放平台,目标是支持数据驱动的交互和设计过程,构建人与数、人与人沟通的桥梁。

tableau数据可视化方案(大数据可视化系统项目)

AutoVis在应对大数据可视化挑战中的探索动态数据采样与可视化:针对大数据场景中数据更新频繁和数据规模较大的挑战,我们提出了一种动态分桶与层级采样相结合的流式数据采样框架,实现了百万点的毫秒级查询,满足高频数据的可视分析与监控需求。如下图所示,其中数据写入与图表刷新速度均达到了100次/秒。

tableau数据可视化方案(大数据可视化系统项目)

图表模板编辑与管理技术:针对已有可视化软件中图表模板有限,可扩展性弱,以及通过编码方式定义新的图表模板需要大量的人力资源和时间成本,复用性弱等挑战,我们设计了一种新的可扩展图表模板分类与管理技术以及交互式编辑工具。我们选择使用可视化编程语言Vega和Vega-Lite,并在其示例的基础上进行扩展,目前形成了267种图表模板。另外,提供了选项配置、参数扩展与自由配置三种自由度从低到高的图表目标交互式编辑方式,着力同时满足图表易用性、表达能力与可扩展性的需求。

图表参数自动填充技术:AutoVis提供了一种自动填充图表参数快速生成图表的技术。使用者在打开数据后,拖选图表模板,系统将根据数据信息及模板配置自动填充模板参数,实现可视化图表的一键生成。同时,AutoVis提供了即时响应的图表参数编辑技术,如果自动填充的结果不满足个性化需求,使用者可以很方便地修改图表参数,如下图所示。值得强调的是,AutoVis系统实现了参数推荐与自动补全,努力减少使用者修改参数所需的交互次数。

tableau数据可视化方案(大数据可视化系统项目)

AutoVis设计看板

运行时看板交互技术:大数据时代,使用者对于数据的关注多种多样,不再满足于单向呈现数据的图表,希望通过交互发掘所关注数据特征,满足特定需求,这时需要提供合理的交互方式。AutoVis对于单个图表提供了常用的交互手段,特别地,我们设计实现了一种多图表联动关系自动发现技术,使用者在定义看板时,不需要手工定义图表之间的联动关系,即可实现图表之间的联动与数据钻取。

图数据布局与可视化探索:现实生活中不同的关联关系越来越普遍,例如人与人、人与商品,知识图谱的应用亦越来越普遍。如何有效地与图数据进行交互,AutoVis实现了一种新的图布局算法MGLA以及可视化探索方法。MGLA算法实现了多子图情况下关键节点与边突出的保结构布局,使用者可以通过鼠标标记关注节点,系统亦能够根据不同的搜索条件自动解析所关注节点。

tableau数据可视化方案(大数据可视化系统项目)

AutoVis的跨平台、跨终端特性

tableau数据可视化方案(大数据可视化系统项目)

AutoVis移动端看板示例

结束语

大数据时代数据可视化作为人与数据的桥梁,将发挥越来越重要的作用,经过数十年发展的数据可视化如何迎接新的机遇与挑战,值得大家的共同探索。本文简介了我们在这方面的尝试,以希抛砖引玉。如果读者对于AutoVis有兴趣,

(0)
小多多的头像小多多创始人

相关推荐

发表回复

登录后才能评论