由麻省理工学院的研究人员开发的3D场景感知概率编程(3DP3)系统可以帮助机器以更像人类的方式感知世界。
概率编程框架使系统能够与输入数据交叉检查检测到的对象,以确定相机记录的图像是否可能与任何候选场景相关。
3DP3可以推断出不匹配是由噪声引起的,还是由需要进一步处理的场景解释错误引起的。
系统将场景表示为图形,其中每个对象是一个节点,连接节点的线表示哪些对象彼此接触;结果是对物体排列的更精确的估计。
3DP3几乎总是比其他深度学习模型生成更精确的姿势,并且在一些物体部分挡住另一些物体时表现明显更好。
从麻省理工学院的新闻
查看全文
没有发现记录