acm-header
登录

ACM通信

研究突出了

技术视角:到处寻找模型的图像


每分钟大约有5000张照片上传到这个照片分享网站http://www.flickr.com/;每天超过700万。类似的数字也被上传到其他社交网站。这些图像通常是由业余摄影师在非理想条件下和使用低端数码相机(如移动电话上的相机)获得的。这样的图像通常看起来嘈杂、模糊、颜色或对比度错误。即使是由高端设备获得的图像,如MRI或显微镜,也会受到这些影响,因为设备的内在物理和被拍摄材料的结构。图像科学的一个关键挑战是如何从“低”质量的图像到高质量的图像,这是清晰的,有良好的对比度,并清除人工制品。根据Hadamard的定义,这是一个内在不适定逆问题。那么,我们该怎么做呢?

我们必须包含额外的假设,这个过程通常被称为正则化。根据一个人的研究或兴趣的特定领域,这些假设有不同的名称,通常被称为先知先觉模型。从数字图像处理的早期开始,推导适当的正则化项、先验或模型就一直占据着研究界,我们见证了一些奇妙的、非常鼓舞人心的模型,如线性和非线性扩散、小波和全变分。不同的图像模型可以适用于不同类型的图像;例如,MRI和自然图像应该有不同的模型。事实上,有些模型可能对某些逆问题有用,而对另一些则不然。

在他们里程碑式的论文中,Buades, Coll和Morel讨论了统一框架下的许多图像模型。让我们集中精力自相似性模型,由此引出重要非本地的意思作者提出的图像去噪算法及其在其他图像逆问题上的推广。基本的基本概念是局部图像信息在非局部图像中重复自身。另一方面,在许多情况下,噪声都是随机的。因此,通过在图像中收集这些相似的局部区域,可以在不同的噪声条件下对相同的底层信号进行多次观测,通过简单的估计方法消除噪声。这个简单而有力的自相似概念,为同时进行局部和非局部处理提供了一个独特的视角,至少可以追溯到香农在1950年的英语写作模型(“印刷英语的预测和熵”,贝尔系统。科技,J。5064),用于合成任务的图像处理。但直到2005年Buades等人发表了一篇优雅的论文,社区才有了它的“尤里卡时刻”,并清楚地意识到它也可以用于重建挑战。

这种自相似的思想引发了大量的问题。在实践层面,我们可以问如何定义局部区域的尺度,如何有效地找到图像中相似的区域,如何定义局部图像区域之间的距离,以确定它们是“相似的”,以及该模型可以处理什么样的图像处理任务。在理论层面,像估计量的一致性及其最优性这样的标准问题自然会被提出。图像处理社区正忙于解决这些问题。


在他们里程碑式的论文中,Buades, Coll和Morel讨论了统一框架下的许多图像模型。


下面的开创性工作清楚地说明了另一个关键方面,这是解决重叠局部图像区域的图像逆问题的想法,或重叠的图像补丁。在许多情况下,这成为了工作单元,取代了标准的单点或像素(有时也称为单点或像素)super-pixels)。虽然一些研究人员采用了与自相似模型不同的模型,但可以肯定的是,在他们最初的论文发表六年后的今天,最先进的图像重建技术以及图像分类技术都是基于这些超级像素或补丁的工作。这已经成为几乎所有图像模型的基本构建模块。

作者的工作也开始暗示这样一种想法:我们可以从数据本身学习模型,或者至少使其适应图像,而不是依赖于预定义的数学结构。这涉及到字典学习,在这里,图像被建模为通过学习字典来表示。自相似模型假设字典是图像本身,或者实际上是它的局部补丁。所有这些模型都表明,图像,特别是图像补丁,实际上并不存在于周围的高维空间中,而是存在于嵌入其中的一些低维分层中。

40多年来,图像处理社区一直在寻找图像模型。他们中最基本的人在社区中留下了重要的足迹。许多问题至今仍未解决,从生成模型和判别模型之间的永恒之争,到需要推导出计算上可行且从根本上有用的模型。所有这些工作都是为了我们求知欲的根源“什么是图像?”

回到顶部

作者

萨皮罗吉尔勒莫guille@umn.edu)是明尼苏达大学电子与计算机工程系的教授。

回到顶部

脚注

DOI:http://doi.acm.org/10.1145/1941487.1941512


©2011 acm 0001-0782/11/0500 $10.00

允许为个人或课堂使用部分或全部作品制作数字或硬拷贝,但不得为盈利或商业利益而复制或分发,且副本在首页上附有本通知和完整的引用。除ACM外,本作品的其他组件的版权必须受到尊重。允许有信用的文摘。以其他方式复制、重新发布、在服务器上发布或重新分发到列表,都需要事先获得特定的许可和/或费用。请求发布的权限permissions@acm.org传真(212)869-0481。

数字图书馆是由计算机协会出版的。版权所有©2011 ACM, Inc.

Baidu
map