约翰霍普金斯大学的计算机科学家使用正强化的方法向机器人展示如何快速自学新任务。
这种训练技术通常用于改变狗的行为,它帮助机器人在几天内就提高了技能,而不是以前需要一个月。
研究人员使用了一种奖励系统来帮助机器人从错误中学习。
在堆叠积木方面,机器人很快就决定,如果行为正确,它将获得高分,如果抓不到积木或打翻一堆积木,它将获得零分。
约翰霍普金斯大学的安德鲁·亨特说:“机器人想要更高的分数。它很快就学会了正确的行为来获得最好的奖励。”
从约翰霍普金斯大学中心
查看全文
版权所有©2020SmithBucklin,美国华盛顿特区
没有发现记录