acm-header
登录

ACM通信

BLOG@CACM

从机器意志?


Robin K. Hill,怀俄明大学

认真对待奇点的计算机科学家应该解释它是如何在计算机中产生的。很少有评论员会将他们对奇点的预测扩展到计算机的实际“需求”,Omohundro是个罕见的例外。许多对奇点预言的批评,尤其是库兹韦尔所表达的,已经对他对加速技术进步的推动力的归因提出了挑战,而维基百科的文章[奇点集中在那方面。许多赞同库兹韦尔预测的人暗示,计算机在某种程度上可以做到想要某物说AI代理可能会“叛变”[菲茨杰拉德可能意味着它会背叛人类…或者它可能意味着开发了一些程序员没有预料到的不受欢迎的输出活动。这是两种截然不同的威胁,但有时会被混为一谈。尼克·博斯特罗姆(Nick Bostrom)在仔细阅读后认为,控球是一种意志(Bostrom,第7章和第9章)。但是它是如何到达那里的呢?当然,目标是事先设定好的;阿莫德伊说,虽然这种情况存在很大风险,但这不是问题所在。

快速发展的技术不足以解释明确的意志。其他机器的技术进步不会导致意志行为;即使是大型强子对撞机似乎也不准备接管世界。当您发现您的打印机正在打印一个又一个空白页时,您不会发出警告:行打印机守护进程被驱动以消耗所有可用资源。Alpha Go并不“想”赢(尽管人们确实是这么说的)。神经网络不会“想”了解斑马的长相;该代码只是基于一些数值比较对权重值进行加减。因为我们的表达能力很差,迫使我们依赖拟人化的语言[Hill2018,这听起来像是意志的锻炼。毋宁说,它们是意志的表现,必须在它们之前。

在计算机中,意志会是什么样子(根据丘奇-图灵的理论)?不管欲望或需要是否直接来自代码、复杂的处理或恶意的编程,关于V的实际实现,一个任性的概念、欲望或想要的相关问题是什么?我们可以,就像计算机科学家乐于做的那样,以各种方式正式地呈现动作部分——例如,像这样的原语意愿目标计划,或欲望作为函数或谓词,或旨意的(),或希望(A, P),程序员的意图是指某个人工代理A想要某个事件P持有的命题状态。但这些都是特别的公式;我们希望生成而不是假设这些衍生对象。这样的数学逻辑形式化可以广义地归为基本运算符、模态运算符或谓词。一个操作符把(某种东西)V变成一个目标,而一个谓词断言(某种东西)V是一个目标。但是…

我们需要的是V本身.它是怎么到那里的?让我们做一个明显的动作,定义一个意志的行为作为产生目标的东西,而不指定V是某个参数还是某个函数。问题不在于V的结构,类型或规格;它的存在。它会是一种涌现性吗一个图灵机吗?我们拒绝这种说法:涌现的属性是由我们从外部投射出来的。我们很好奇计算机本身是否真的可以想要某物

考虑一个图灵机,由通常的:

⟨Symbols S(带空格)
状态Q(带开始状态)
一个函数T(过渡)从{state × symbol}到{{state × symbol}∪{L, R}}⟩

有任何与tm兼容的目标概念吗?是的,很多。参见斯坦福哲学百科全书中的“行动逻辑”词条[SEP-LA,第四节]。有没有什么能告诉我们这个目标是从哪里来的,告诉我们V是什么样子的,这样它就能产生一个目标?不,没有。它会出现在哪里——在四重存储器上还是在磁带上,在算法上还是在数据上?意志是一种状态吗?不,如果它是数据,那就回避了问题,如果它是一种状态,我们仍然需要问是什么导致它被包含在q中,这也适用于t的过渡V可能是突变,一个随机的位翻转吗?这违背了意志的概念,意志是故意的。

还是动态的?当然,图灵机可以通过在纸带上写字来构造它们自己的程序;大概,这就是一个目标的形式化程序。我们可以从施罗德那里得到启示[分析安斯科姆,SEP-Desire]:“信念就像陈述句,世界是否符合它就满足了(使之成为真实),而欲望就像祈使句,世界的变化使世界与信念相符就满足了(实现了)。”我们知道如何建立或呈现信念(作为公式),但我们如何呈现欲望呢?让世界变得一致需要执行力。以我个人的观点[Hill2016],算法是命令式抽象,而图灵机(它们的实现)是声明式抽象。(图灵机定义动作,但不执行动作。)那么,意志可能是一个执行过程吗?如果是这样,它就不是TM。

这些都没有抓住问题的关键。我们计算机科学家想要一个答案,虽然不能用图灵计算,但可以Turing-compatible:一个TM是如何无法保持意志力的?我们能把性格孤立出来吗想要图计算?

参考文献

[Amodei]人工智能安全的具体问题。2016.达里奥·Amodei, Chris Olah, Jacob Steinhardt, Paul Christiano, John Schulman和Dan Mané。arXiv预印本arXiv: 1606.06565。

尼克·博斯特罗姆,2014。超智。

克里斯·菲茨杰拉德,2018。我们能阻止AI变得不听话吗?《福布斯》。

[Hill2016]李彦宏。“什么是算法”,哲学与技术29:1。

[Hill2018]李彦宏。2018。明确决策责任。Blog@CACM.2018年5月21日。

[库兹韦尔]雷·库兹韦尔。2005。奇点在这里.企鹅。

[Omohundro] Stephen M. Omohundro. 2018。基本的AI驱动。在人工智能安全与保障.查普曼和大厅/ CRC。

[SEP-Desire] Tim Schroeder, 2020。欲望。《斯坦福哲学百科全书》(夏季版),爱德华·n·扎尔塔主编。

[SEP-LA] Krister Segerberg, John-Jules Meyer和Marcus Kracht。行动的逻辑。《斯坦福哲学百科全书》(夏季版),爱德华·n·扎尔塔主编。

Singlularity维基贡献者。(2022年5月14日)。技术奇点。在维基百科,免费的百科全书。于2022年5月27日取回。

罗宾·k·希尔他是计算机科学系的讲师,也是哲学和宗教研究系以及怀俄明大学人文研究所的附属机构。她自1978年以来一直是ACM的成员。


没有发现记录

登录为完全访问
»忘记密码? *创建ACM Web帐户
Baidu
map