acm-header
登录

ACM通信

研究突出了

技术视角:可视化搜索:从素描到自然语言


双筒望远镜

来源:盖蒂图片社

可视化通过利用人类视觉皮层的更高带宽交互性,使有效的数据探索成为可能。但是可能的可视化空间是巨大的,因此创建(即发现)正确的可视化的一般抽象是难以捉摸的,尽管像织女星这样的系统最近取得了进展2和德拉科。1

下面的文章提供了一个通用的抽象,以及高级的接口,重点是可视化搜索。如果您曾经创建过一长串可视化,以寻找有趣的模式,那么您已经手动执行了一个可视化搜索任务。可视化搜索的问题是找到数据的子集,当适当地进行呈现时,这些子集将生成类似于所提供的模式规范的可视化。从直观上看,这项任务是困难的,至少需要一个可视化相似度的模型,一个大规模搜索空间的表示,一个导航搜索空间的策略,以及用户可以通过其表达规范的适当界面。作者通过设计由原语和操作符组成的形状查询代数来解决这些挑战;也就是“趋势线”。代数将简单的片段组合成复杂的模式,类似于工程和科学中用分段线性函数组合来逼近复杂的连续函数(例如,有限元模型)。

ShapeSearch代数的关键见解是,对函数上升、下降或下降区域的推理足够简单,可以捕捉用户的模式概念,但也足够表达,可以建模复杂的模式。例如,一个峰型上升然后下降,一个高原型上升然后平坦。通过包含可以引用前段或后段的表达式,语言可以捕捉到诸如“上升,然后急剧上升”这样的模式。除了通过连接进行排序外,还支持连接和分离;例如,该值应该在每个区域上升而不是下降。其他方便的扩展包括量词(值应该上升至少一次,最多两次)、嵌套(给定范围内的峰值)和迭代(在给定范围内的任何地方查找峰值);可以使用核心原语重写这些扩展。


Shapesearch表达式被设计为歧义匹配,在数据集中对歧义表达式进行评分是一个关键贡献。


Shapesearch表达式被设计为歧义匹配,并且根据数据集对歧义表达式进行评分是另一个关键贡献。每一段都使用逆切线表达式进行评分,以产生−1到1之间的值;然后将这些片段分数汇总,产生表达式分数。模糊匹配涉及到未指定的查询,其中一个区域的开始和/或结束点留给系统来查找—这可能是一个代价昂贵的搜索。动态规划算法提供了一个精确但昂贵的基线,而一个可证明最优的近似算法通过观察起点和终点通常会落在底层函数的临界点(即斜率改变方向的地方),然后根据它们的分数贪婪地匹配和合并查询段,从而显著减少了搜索空间。

Shapesearch支持面向新手用户的自然语言界面、语音到文本场景、与其他NL服务的集成、用于更复杂表达式的正则表达式界面以及用于手工绘制模式的草图界面。草图界面将可视化模式作为对数据子集进行推理的主要模型——而不是方程、复杂的查询或代码、不可靠的标签或元数据。正是这个想法将ShapeSearch与其他可视化搜索方案(包括Draco)区分开来1“航行者”号。3.

Shapesearch与传统的数据分析方法有很大的不同,它将近似的视觉模式提升为交互和计算的一级组件。这项工作有可能帮助开发支持这种观点的一类软件和方法,并且,正如作者指出的那样,立即为未来的工作提出了一些有趣的方向:更好的界面来支持混合草图和代码,自动完成功能来支持复杂查询的增量组合,并同时搜索不同的属性。

回到顶部

参考文献

1.Moritz, D.等。形式化可视化设计知识作为约束:在Draco中可操作和可扩展的模型。在IEEE反式。可视化和对比图形(2019)。

2.Satyanarayan, A., Moritz, D., Wongsuphasawat, K.和Heer, J. Vega-lite:互动图形的语法。IEEE反式。可视化和对比图形,2017年。

3.Wongsuphasawat, K.等。旅行者2号:用局部视图规范增强视觉分析。在2017年美国计算机学会计算系统人为因素学报。

回到顶部

作者

比尔豪现任华盛顿大学信息学院副教授,华盛顿大学计算机科学与工程系和电气工程系兼职副教授。

回到顶部

脚注

查看所附文件,请访问doi.acm.org/10.1145/3535337


版权归作者所有。
向所有者/作者请求(重新)发布许可

数字图书馆是由计算机协会出版的。版权所有©2022 ACM股份有限公司


没有发现记录

登录为完全访问
»忘记密码? *创建ACM Web帐户
文章内容:
Baidu
map