acm-header
登录

ACM通信

ACM的意见

建立一个会话代理,可以聊天…任何事情


谷歌AI博客logo。

谷歌大脑研究团队的成员提出了Meena,一个26亿参数的端到端训练神经对话模型。

信贷:谷歌

现代的对话代理(聊天机器人)趋向于高度专业化——只要用户不偏离预期的使用范围太远,它们就会表现良好。为了更好地处理各种各样的对话主题,开放域对话研究探索了一种补充方法,试图开发一个聊天机器人,它不是专门的,但仍然可以聊天用户想要的几乎任何事情。除了是一个令人着迷的研究问题外,这样的会话代理还可以带来许多有趣的应用,比如进一步使计算机交互人性化,提高外语练习,以及制作可关联的交互式电影和电子游戏角色。

然而,目前的开放域聊天机器人有一个严重的缺陷——它们通常没有意义。他们有时会说一些与迄今为止所说的不一致的话,或者缺乏常识和对世界的基本知识。此外,聊天机器人通常会给出不特定于当前上下文的响应。例如,“我不知道”是对任何问题的合理回答,但它并不具体。目前的聊天机器人比人类更经常这样做,因为它涵盖了许多可能的用户输入。

在“面向类人开放域聊天机器人,我们给出了一个26亿参数端到端训练的Meena神经会话模型.我们证明,Meena可以进行比现有的最先进的聊天机器人更明智和具体的对话。这些改进通过我们为开放领域聊天机器人提出的一种新的人类评估指标反映出来,称为敏感性和特异性平均(SSA),它捕捉了人类对话的基本但重要的属性。值得注意的是,我们证明了困惑度,一个自动的度量,很容易得到任何神经会话模型,与SSA高度相关。

Meena之间的聊天()和一个人(正确的).

之一Meena

Meena是一个端到端的神经会话模型,它学会对给定的会话环境做出明智的响应。培训目标是最小化困惑即预测下一个符号(在本例中是对话中的下一个单词)的不确定性。它的核心是进化的变压器seq2seq架构,一个由进化发现的Transformer架构神经结构搜索改善困惑。

谷歌艾未未的博客
查看全文


没有发现记录

登录为完全访问
»忘记密码? »创建ACM Web帐号
Baidu
map