acm-header
登录

ACM通信

研究突出了

技术角度:3D图像编辑变得容易


每天都有大量的图像出现在智能手机屏幕、电脑显示器和印刷材料上。新闻文章和广告通过使用吸引人的图片来吸引观众的注意力。人们经常用智能手机拍下照片,并立即通过社交媒体与数百名观众分享。此外,用户在文档和演示文稿中包含图像来传达信息。这些图像通常经过编辑,以显得更美观或达到其他目的。因此,对高级图像编辑工具的需求越来越大。

在过去的几年中,图像编辑技术取得了显著的进步,以满足消费者的需求。颜色调整工具现在更容易实现更简单的图像锐化、软化、亮化和暗化。此外,先进的工具可以自动去除模糊和噪声。用户可以很容易地在图像中切割一个对象并将其粘贴到另一个背景上。此外,它很容易随时变形形状的需要和无缝融合两张图像。甚至可以通过自动合成合适的背景图像来删除场景中的物体,并填充空洞。

尽管有这些进步,大多数图像编辑技术都是二维的。三维(3D)图像编辑已强烈要求;然而,这仍然很困难。即使是目前最先进的图像编辑工具也缺乏3D编辑功能。这是因为对于3D编辑来说,计算机推断场景的3D结构是必要的,这仍然是一个困难的、不适定的问题。推断一个有意义的3D结构需要丰富的物理世界知识,这在目前的系统中仍然缺失。此外,3D编辑对用户来说很困难,因为用户必须使用2D输入设备(如触摸板或鼠标)向计算机提供3D控制信息。对于没有经验的用户来说,在场景中指定物体的3D形状并因此操作该物体是非常繁琐和困难的。

尽管如此,3D编辑的重要性是显而易见的。我们生活在一个3D世界,3D图像编辑打开了无数的可能性。随着三维信息的获取,我们可以很容易地从不同的角度观察物体,并通过三维结合物体组成新的场景。即使是一个对象的基本剪切和粘贴都不容易用纯2D编辑工具,因为如果对象移动,观察角度会改变。3D编辑功能将使剪切和粘贴的结果更有说服力。

以下论文的作者提出了实现3D编辑的重要步骤。为了解决这个难题,人类的感知和计算分析都是必需的。因此,作者设计了一种交互技术,称为3-sweep,由3次简单的鼠标点击组成。通过这种交互,用户引导计算机对场景中的物体进行分割,同时推断出物体的三维几何形状。然后,系统利用图像分析的方法通过推断细节来进行分割和三维重建。利用三维重建的结果,用户可以旋转物体,从多个角度观察物体。此外,用户可以在保持3D一致性的同时,将物体剪切粘贴到不同的场景中。我们强烈鼓励有兴趣的读者观看作者令人印象深刻的演示视频(https://www.youtube.com/watch?v=Oie1ZXWceqM).

与大多数技术一样,这种3D编辑技术并不是唯一的一种;先前的努力存在。一个值得注意的是郑等人提出的照片编辑工具。2类似地,它们结合了直观的用户交互和计算分析,以促进照片中物体的3D操作。然而,他们的工具是专门为长方体设计的,只适用于由盒子、矩形板和方柱制成的物体。另一方面,目前的技术可以通过引入复杂的手势交互来处理更大种类的曲面物体。

然而,应该指出的是,目前的技术目前只支持一种原始类型:通用柱体。这种表现是高度通用的,涵盖了许多人造物体;尽管如此,它还不足以代表自然界中感知到的复杂形状。需要工具来创建一组更多样化的形状基元来表示复杂的形状,这将使操纵在照片中看到的任意物体成为可能。一种可行的方法是使用大量已知的三维几何图形。1然而,本文提出的将人类感知与计算分析相结合的核心概念,利用巧妙的交互设计,对未来工具的开发具有广泛的应用价值。可以预见,受到这项工作启发的3D图像编辑工具将会迅速发展,即使是普通用户也会越来越容易地编辑照片。图像不再总是描绘一成不变的现实。这是好还是坏?答案可能不是不言而喻的;然而,这样的未来肯定会到来。

回到顶部

参考文献

1.Kholgade, N., Simon, T., Efros, A.和Sheikh, Y.使用股票3D模型在一张照片中的3D对象操作。ACM反式。图33。2014年7月,第127条。

2.郑艳,陈晓明,程敏敏,周坤,胡思敏,周凯,陈晓明,陈晓明。交互式图像处理的长方体代理。ACM反式。图31。, 4(2012), 99:199:11。

回到顶部

作者

Takeo Igarashi)是日本东京大学计算机科学系的一名教授。

回到顶部

脚注

查看所附文件,请访问doi.acm.org/10.1145/3007175


版权归作者所有。

数字图书馆是由计算机协会出版的。版权所有©2016 ACM股份有限公司


没有发现记录

登录为完全访问
»忘记密码? *创建ACM Web帐户
文章内容:
Baidu
map