acm-header
登录

ACM通信

ACM TechNews

像人类一样看世界的机器


机器人眼睛的插图。

新的用于分析场景的人工智能系统可以从一些图像中学习感知现实世界的物体,并根据这些学习到的物体来感知场景。

信贷:安德里亚Danti / Shutterstock.com

由麻省理工学院的研究人员开发的3D场景感知概率编程(3DP3)系统可以帮助机器以更像人类的方式感知世界。

概率编程框架使系统能够与输入数据交叉检查检测到的对象,以确定相机记录的图像是否可能与任何候选场景相关。

3DP3可以推断出不匹配是由噪声引起的,还是由需要进一步处理的场景解释错误引起的。

系统将场景表示为图形,其中每个对象是一个节点,连接节点的线表示哪些对象彼此接触;结果是对物体排列的更精确的估计。

3DP3几乎总是比其他深度学习模型生成更精确的姿势,并且在一些物体部分挡住另一些物体时表现明显更好。

麻省理工学院的新闻
查看全文


没有发现记录

Baidu
map