acm-header
登录gydF4y2Ba

ACM通信gydF4y2Ba

贡献的文章gydF4y2Ba

计算机作为通用技术的衰落gydF4y2Ba


芯片和电路板熔化,说明gydF4y2Ba

图片来源:The Image FoundationgydF4y2Ba

也许在其他技术中,没有一项像计算机技术那样,在几十年里每年都有巨大的改进。据估计,自1974年以来,美国三分之一的生产力增长来自信息技术,gydF4y2Ba一个gydF4y2Ba,gydF4y2Ba4gydF4y2Ba使其成为国家繁荣的最大贡献者之一。gydF4y2Ba

回到顶部gydF4y2Ba

关键的见解gydF4y2Ba

ins01.gifgydF4y2Ba

计算机的兴起得益于技术上的成功,但也得益于为其提供资金的经济力量。Bresnahan和TrajtenberggydF4y2Ba3.gydF4y2Ba创造了这个词gydF4y2Ba通用技术gydF4y2Ba(GPT)用于计算机等产品,这些产品具有广泛的技术适用性,产品改进和市场增长可以相互促进几十年。但是,他们也预测,GPT在其生命周期结束时可能会遇到挑战:随着进展放缓,其他技术可能会在特定的利基领域取代GPT,并破坏这种经济强化周期。我们今天正在观察这样的转变,中央处理器(cpu)的改进缓慢,因此应用程序转移到gydF4y2Ba专门的处理器gydF4y2Ba例如,图形处理单元(gpu),它能做的事情比传统通用处理器少,但性能更好。许多引人注目的应用程序已经在追随这一趋势,包括深度学习(机器学习的一种形式)和比特币挖矿。gydF4y2Ba

有了这样的背景,我们现在可以更准确地阐述我们的论文:“计算机作为通用技术的衰落”。我们所做的gydF4y2Ba不gydF4y2Ba这意味着所有计算机将失去技术能力,从而“忘记”如何进行一些计算。我们gydF4y2Ba做gydF4y2Ba这意味着,在快速改进的通用处理器的支持下,导致通用计算平台使用的经济周期正在让位于一个碎片周期,在这个周期中,经济将用户推向由特殊用途处理器驱动的不同计算平台。gydF4y2Ba

这种碎片化意味着计算的各个部分将以不同的速度进行。这对于那些走在“快车道”上的应用程序来说是好事,因为这些应用程序的改进仍然很快,但对于那些不再受益于领域领导者推动计算向前发展的应用程序来说,这就不好了,因为这些应用程序被置于计算改进的“慢车道”上。这种转变也可能减缓计算机改进的整体速度,危及这一经济繁荣的重要来源。gydF4y2Ba

回到顶部gydF4y2Ba

通用和专用计算gydF4y2Ba

早期——从专业到通用gydF4y2Ba.早期的电子产品不是可以执行多种不同计算的通用计算机,而是专门用于执行一项任务的设备,比如收音机或电视。这种专门的方法有优点:设计的复杂性是可控的,处理器效率高,工作速度快,耗电量少。但专用处理器也更“窄”,因为它们可以被更少的应用程序使用。gydF4y2Ba

早期的电子计算机,gydF4y2BabgydF4y2Ba即使是那些被设计为“通用”的算法,实际上也是为特定的算法量身定制的,很难适应其他算法。例如,尽管1946年的ENIAC理论上是一种通用计算机,但它主要用于计算火炮射程表。即使需要稍微不同的计算,计算机也必须手动重新布线以实现新的硬件设计。解决这个问题的关键是一种可以存储指令的新型计算机结构。gydF4y2Ba10gydF4y2Ba这种架构使计算机更加灵活,可以在通用硬件上执行许多不同的算法,而不是在专门的硬件上。这种“冯·诺依曼架构”非常成功,至今仍是几乎所有通用处理器的基础。gydF4y2Ba

通用处理器的崛起gydF4y2Ba.许多技术,当它们被引入市场时,经历了一个良性的强化循环,帮助它们发展(gydF4y2Ba图1一个gydF4y2Ba).早期采用者购买产品,这就为改善产品提供了资金投资。随着产品的改进,更多的消费者购买它,从而为下一轮的改进提供资金,以此类推。对于许多产品来说,随着产品改进变得过于困难或市场增长停滞,这个周期会在中短期内结束。gydF4y2Ba

f1.jpggydF4y2Ba
图1。通用处理器的历史良性循环(a)正在转变为碎片循环(b)。gydF4y2Ba

gpt的定义是,随着它们的增长,能够继续从这种良性经济循环中受益——就像通用处理器几十年来所做的那样。这个市场已经从军事、太空等领域的一些高价值应用发展到全球使用的个人电脑超过20亿台。gydF4y2Ba38gydF4y2Ba这一市场增长推动了对改进处理器的更大投资。例如,英特尔在过去十年中在研发和新的制造设施上花费了1830亿美元。gydF4y2BacgydF4y2Ba这带来了巨大的回报:据估计,自1971年以来,处理器性能提高了约40万倍。gydF4y2Ba8gydF4y2Ba

替代方案:专用处理器gydF4y2Ba.通用处理器必须能够很好地进行许多不同的计算。这导致设计妥协,使许多计算快速,但不是最优的。对于那些非常适合专门化的应用程序来说,这种妥协带来的性能损失是很高的,即:gydF4y2Ba

  • 大量的计算可以并行化gydF4y2Ba
  • 要完成的计算是稳定的,并且在一定的时间间隔内到达(“规律性”)gydF4y2Ba
  • 对于给定的计算量('locality'),需要相对较少的内存访问。gydF4y2Ba
  • 计算可以用更少的有效数字来完成。gydF4y2Ba15gydF4y2Ba

在每种情况下,专用处理器(例如,专用于应用的集成电路(asic))或异构芯片的专用部分(例如,ip块)可以执行得更好,因为定制硬件可以针对计算进行定制。gydF4y2Ba24gydF4y2Ba

专门化导致处理器设计变化的程度可以从典型cpu(占主导地位的通用处理器)和典型gpu(最常见的专门化处理器类型)的比较中看出gydF4y2Ba表格gydF4y2Ba).gydF4y2Ba

ut1.jpggydF4y2Ba
表格CPU相对于GPU的技术指标。gydF4y2Ba

GPU运行速度较慢,约为CPU频率的三分之一,但在每个时钟周期内,它可以执行比CPU多100倍的并行计算。这使得它在并行度高的任务上比CPU快得多,但在并行度低的任务上要慢得多。gydF4y2BadgydF4y2Ba

gpu通常有5 - 10倍多的内存带宽(决定一次可以移动多少数据),但访问数据的延迟要长得多(从最近的内存至少有6倍的时钟周期)。这使得gpu更擅长于可预测的计算(从内存中需要的数据可以被预测并在正确的时间被带到处理器中),而在不可预测的计算中则更糟糕。gydF4y2Ba

对于与专用硬件很好匹配的应用程序(并且编程模型(例如CUDA)可用于利用该硬件),性能的提高可能是巨大的。例如,在2017年,领先的GPU制造商NVIDIA估计,深度学习(AlexNet with Caffe)通过在GPU而不是cpu上运行,获得了35倍以上的加速。27今天,这种加速甚至更大。gydF4y2Ba26gydF4y2Ba

专用处理器的另一个重要好处gydF4y2BaegydF4y2Ba他们用更少的能量来做同样的计算。这对于受电池寿命限制的应用程序(手机、物联网设备)和那些进行大规模计算的应用程序(云计算/数据中心、超级计算)尤其有价值。gydF4y2Ba

截至2019年,十大最节能的超级计算机中有9台使用NVIDIA gpu。gydF4y2Ba37gydF4y2Ba

专用处理器也有重要的缺点:它们只能运行有限范围的程序,很难编程,通常需要一个运行操作系统的通用处理器来控制(一个或多个)它们。设计和创建专门的硬件也很昂贵。对于通用处理器,它们的固定成本(也称为非经常性工程成本(NRE))分布在大量的芯片上。相比之下,专用处理器的市场通常要小得多,因此每个芯片的固定成本更高。更具体地说,使用尖端技术制造带有专用处理器的芯片的总成本约为8000万美元gydF4y2BafgydF4y2Ba(截至2018年)。使用老一代的技术可以将成本降低到大约3000万美元。gydF4y2Ba23gydF4y2Ba

尽管专用处理器有这些优点,但它们的缺点非常重要,以至于在过去几十年里很少被采用(gpu除外)。确实发生的采用是在性能改进非常有价值的领域,包括军事应用、游戏和加密货币挖掘。但这种情况正在开始改变。gydF4y2Ba

目前专用处理器的状态gydF4y2Ba.所有主要的计算平台,pc、移动、物联网(IoT)和云/超级计算,都变得越来越专业化。其中,pc仍然是最普遍的。相比之下,由于电池寿命的关系,能源效率在移动和物联网中更为重要,因此,智能手机芯片上的大部分电路,gydF4y2Ba34gydF4y2Ba传感器,如rfid标签,使用专门的处理器。gydF4y2Ba5gydF4y2Ba,gydF4y2Ba7gydF4y2Ba

云计算/超级计算也变得更加专业化。例如,2018年最大的500台超级计算机首次从专用处理器获得比通用处理器更高的性能。gydF4y2Ba11gydF4y2Ba

国际半导体技术路线图(ITRS)的行业专家们在他们的最终报告中含蓄地支持了这种向专业化的转变。该组织协调了维持摩尔定律所需的技术改进。他们承认,缩小晶体管的传统“一刀切”方法不应再决定设计要求,而应针对特定应用量身定制。gydF4y2Ba16gydF4y2Ba

下一节将探讨所有主要计算平台向专用处理器的转移对生产通用处理器的经济效益的影响。gydF4y2Ba

回到顶部gydF4y2Ba

通用技术的碎片化gydF4y2Ba

支撑全球通用技术的良性循环来自一系列相互加强的技术和经济力量。不幸的是,这种相互强化也适用于相反的方向:如果在周期的一个部分改善缓慢,那么周期的其他部分的改善也会缓慢。我们称这种对位为“分段循环”,因为它有可能将计算分割成一组以不同速度推进的松散相关的筒仓。gydF4y2Ba

作为gydF4y2Ba图1 (b)gydF4y2Ba可见,分段循环分为三个部分:gydF4y2Ba

  • 科技进步缓慢gydF4y2Ba
  • 较少的新用户采用gydF4y2Ba
  • 为创新融资更加困难gydF4y2Ba

这个周期背后的直觉很简单:如果技术进步缓慢,那么接受技术的新用户就会减少。但是,如果没有这些用户提供的市场增长,改进技术所需的成本上升可能会变得令人望而却步,从而减缓进步。因此,这种协同反应的每一部分都进一步加强了碎片化。gydF4y2Ba

在这里,我们描述了计算周期的这三个部分的每一个部分的状态,并表明碎片化已经开始。gydF4y2Ba

技术进步缓慢gydF4y2Ba.为了衡量处理器的改进速度,我们考虑两个关键指标:gydF4y2Ba性能gydF4y2BaggydF4y2Ba而且gydF4y2Baperformance-per-dollargydF4y2Ba.从历史上看,这两个指标都迅速提高,主要是因为晶体管小型化导致每个芯片上的晶体管密度更大(摩尔定律)和更快的晶体管开关速度(通过登纳德缩放)。gydF4y2Ba24gydF4y2Ba不幸的是,由于技术挑战,登纳德缩放在2004/2005年结束,而摩尔定律也即将结束,因为制造商已经达到了现有材料和设计的物理极限。gydF4y2Ba33gydF4y2Ba而这些限制需要付出更多努力才能克服。gydF4y2Ba2gydF4y2Ba小型化带来的好处的丧失可以从性能和每美元性能改善的放缓中生动地看到。gydF4y2Ba

图2 (a)gydF4y2Ba,基于Hennessy和Patterson对SPECInt进展的描述,以及gydF4y2Ba图2 (b)gydF4y2Ba根据美国劳工统计局(Bureau of Labor Statistics)的生产者价格指数(生产者价格指数)得出的数据显示,通用计算机性能提升的放缓幅度有多大。从这个角度来看,如果每美元的表现每年提高48%,那么10年后就会提高50倍。相比之下,如果它每年只提高8%,那么在10年内它只会好2倍。gydF4y2Ba

f2.jpggydF4y2Ba
图2。微处理器的改进速度,通过以下方式衡量:(a) SPECint基准的年度性能改进;gydF4y2Ba7附录gydF4y2Ba(b)经质量调整的年度价格下降。gydF4y2Ba1附录gydF4y2Ba

较少的新用户采用gydF4y2Ba.随着通用处理器的改进速度放缓,将会有更少的具有新功能的程序被创造出来,因此客户将没有动力更换他们的计算设备。英特尔首席执行官科再奇在2016年证实了这一点,他说个人电脑的更换率已经从每4年上升到每5-6年。gydF4y2Ba22gydF4y2Ba有时,客户甚至在值得更新之前跳过了多代处理器的改进。gydF4y2Ba28gydF4y2Ba在其他平台上也是如此,例如,2014年美国智能手机平均每23个月升级一次,但到2018年,这一周期已延长至31个月。gydF4y2Ba25gydF4y2Ba


gpt的定义是,随着它们的增长,能够继续从这种良性经济循环中受益——就像通用处理器几十年来所做的那样。gydF4y2Ba


用户从通用处理器到专用处理器的迁移是我们关于计算碎片化的论点的核心,因此我们将详细讨论它。考虑这样一个用户,他既可以使用通用处理器,也可以使用专用处理器,但是他想要的是以最低的成本提供最佳性能的处理器。gydF4y2BahgydF4y2Ba图3(一个)gydF4y2Ba而且gydF4y2Ba3 (b)gydF4y2Ba提出我们分析的直觉。每个面板显示了通用处理器和专用处理器的性能随时间的变化,但通用处理器的改进速度不同。在所有情况下,我们假设时间,gydF4y2BaTgydF4y2Ba之所以选择这种处理器,是因为专用处理器的高价恰好被一系列(不断改进的)通用处理器的成本抵消了。这意味着两条曲线的成本是相等的,因此优越的性能也意味着优越的每美元性能。这也是为什么我们将专用处理器描述为在这段时间内具有恒定性能的原因。(当专用处理器升级时,它也会从通用处理器的进程改进中获益,用户将再次重复相同的决策过程。)gydF4y2Ba

f3.jpggydF4y2Ba
图3。最优的处理器选择取决于专用处理器提供的性能加速,以及通用技术的改进速度。gydF4y2Ba

如果专用处理器能够提供更大的初始性能增益,则它更有吸引力。但是,如果通用处理器的改进速度从快速(如面板(a))到较慢(如面板(b)),它也会变得更有吸引力。我们通过考虑两条时间路径中哪一条提供更多的好处来正式建模。也就是说,专用处理器更有吸引力,如果gydF4y2Ba

ueq01.gifgydF4y2Ba

通用和专用处理器在哪里提供性能gydF4y2Ba我gydF4y2BaPgydF4y2BaugydF4y2Ba,gydF4y2BaPgydF4y2Ba年代gydF4y2Ba随着时间的推移gydF4y2BaTgydF4y2Ba,而通用处理器提高到gydF4y2BargydF4y2Ba.gydF4y2BajgydF4y2Ba我们在在线附录(gydF4y2Bahttps://doi.org/10.1145/3430936gydF4y2Ba).该推导使我们能够从数字上估计专门化优势所需要的数量,以超过更高的成本(如gydF4y2Ba图3 (c)gydF4y2Bacpu的年改进率从48%下降到8%)。gydF4y2Ba

不足为奇的是,当专用处理器提供更大的速度或当其成本可以在更大的容量上摊销时,它们更有吸引力。然而,这些专门化变得有吸引力的截止时间会根据通用处理器的改进速度而变化。重要的是,这种影响不会出现,因为我们假设专用处理器和通用处理器之间的总体进展速度不同——假设所有处理器都能够使用当前最前沿的制造技术。相反,它的出现是因为专用处理器的更高的单位NRE必须平摊,以及这与在此期间升级通用处理器相比如何。gydF4y2Ba

一个数值例子说明了这种变化的重要性。在摩尔定律的巅峰时期,每年的改进速度为48%,即使专用处理器比通用处理器快100倍,也就是说,gydF4y2Bacacm6403_a.gifgydF4y2Ba(差距很大),那么要想收回投资,需要建造约8.3万户。在另一个极端,如果性能收益只有2倍,则需要构建~ 1,000,000以使专业化具有吸引力。这些结果清楚地说明了为什么在摩尔定律的全盛时期,专业处理器很难打入市场。gydF4y2Ba

然而,如果我们使用8%的改进率(2008-2013年的改进率)重复我们的处理器选择计算,这些结果会发生显著变化:对于加速100倍的应用程序,所需处理器数量从83,000个下降到15,000个,而对于加速2倍的应用程序,所需处理器数量从1,000,000个下降到81,000个。因此,在通用处理器的进程放缓之后,更多的应用程序变得可以专门化。gydF4y2BakgydF4y2Ba

为创新融资更加困难gydF4y2Ba.2017年,半导体行业协会估计,为下一代芯片建造和装备一个制造设施(“fab”)的成本约为70亿美元。gydF4y2Ba35gydF4y2Ba所谓“下一代”,我们指的是芯片组件(或工艺“节点”)的下一个小型化。gydF4y2Ba

投资于芯片制造设施的成本必须与它们所产生的收入相匹配。可能多达30%gydF4y2BalgydF4y2Ba该行业3430亿美元的年收入(2016年)来自尖端芯片。因此,收入是可观的,但成本却在增长。在过去的25年里,建立领先晶圆厂的投资(如图所示)gydF4y2Ba图4一gydF4y2Ba)每年增长11%(!),主要是由光刻成本驱动。将工艺开发成本纳入这一估算,进一步加速了每年13%的成本增长(根据Santhanam等人从2001年到2014年的测量结果)。gydF4y2Ba32gydF4y2Ba).芯片制造商们都知道这一点,他们调侃摩尔“第二定律”:芯片工厂的成本每四年翻一番。gydF4y2Ba9gydF4y2Ba

f4.jpggydF4y2Ba
图4。芯片制造业经济状况恶化。gydF4y2Ba

从历史上看,固定成本如此快速增长对单位成本的影响仅被强劲的整体半导体市场增长部分抵消(1996-2016年复合年增长率为5%)gydF4y2Ba米gydF4y2Ba,gydF4y2Ba35gydF4y2Ba),这使得半导体制造商可以在更大的产量上摊销固定成本。固定成本年增长率为13%,市场年增长率为5%,这一巨大差距的剩余部分预计将导致竞争力较弱的厂商退出市场,剩下的厂商将固定成本摊销到更多的芯片上。gydF4y2Ba

作为gydF4y2Ba图4 (b)gydF4y2Ba这表明,该行业确实出现了大规模的整合,生产尖端芯片的公司越来越少。从2002/2003年到2014/2015/2016年,拥有领先晶圆厂的半导体制造商数量从25家下降到仅4家:英特尔、台积电、三星和GlobalFoundries。GlobalFoundries最近宣布,他们不会继续开发下一个节点。gydF4y2Ba6gydF4y2Ba

我们发现,这种整合很有可能是由快速上升的固定成本和温和的市场规模增长所导致的经济恶化造成的。市场整合在多大程度上改善了这些经济状况,可以通过一些粗略的计算来看出。如果市场在不同的公司之间平均分配,这将意味着平均市场份额的增长gydF4y2Bacacm6403_b.gifgydF4y2Ba2002/2003年至gydF4y2Bacacm6403_c.gifgydF4y2Ba在2014/2015/2016。如果以年复合增长率计算,这一数字将为14%。这意味着制造商可以通过市场增长来抵消晶圆厂建设经济状况的恶化,并从退出的晶圆厂获得市场份额(13%<5%+14%)。gydF4y2Ba

在实践中,市场并不是均分的,英特尔占有主导地位的份额。因此,英特尔无法通过这种方式抵消固定成本的增长。gydF4y2BangydF4y2Ba事实上,在过去的十年中,英特尔的固定成本与可变成本的比率已经从60%上升到100%以上。gydF4y2BaogydF4y2Ba这一点尤其引人注目,因为近年来英特尔已经放慢了他们发布新节点大小的步伐,这是预期的gydF4y2Ba减少gydF4y2Ba他们需要进行固定成本投资的速度。gydF4y2Ba

市场整合抵消固定成本增加的能力只能持续这么长时间。如果我们预测当前的趋势,那么到2026年至2032年(取决于市场增长率),领先的半导体制造业将只能支持一家垄断性制造商,并且每年为每个节点规模建造一个新设施的固定成本将等于每年的行业收入(详情见尾注)gydF4y2BapgydF4y2Ba).我们提出这一点,并不是说这将在21世纪20年代末成为现实,而是说目前的趋势gydF4y2Ba不能gydF4y2Ba继续下去,在大约10年内,制造商将被迫大幅减缓新技术节点的发布,并寻找其他方法来控制成本,这两种情况都将进一步减缓通用处理器的进展。gydF4y2Ba

碎片周期gydF4y2Ba.随着碎片化周期的三个部分已经相互加强,我们预计将看到越来越多的用户面临通用处理器的微薄改进,从而对转向专用处理器产生兴趣。对于那些有足够需求和非常适合专业化的计算(例如深度学习)的人来说,这将意味着数量级的改进。对于其他的,专门化将不是一个选择,他们将继续在通用处理器上改进得越来越慢。gydF4y2Ba

回到顶部gydF4y2Ba

影响gydF4y2Ba

谁会专门研究gydF4y2Ba.如gydF4y2Ba图3 (c)gydF4y2Ba在美国,专门的处理器将被那些从转换中获得较大加速的公司所采用,并且需要足够多的处理器来证明固定成本是合理的。基于这些标准,大型科技公司是第一批投资专用处理器的公司,例如谷歌,gydF4y2Ba19gydF4y2Ba微软,gydF4y2Ba31gydF4y2Ba百度,gydF4y2Ba14gydF4y2Ba和阿里巴巴。gydF4y2Ba29gydF4y2Ba与gpu的专门化不同,gpu的专门化仍然有利于广泛的应用,而加密电路的专门化对大多数用户来说都很有价值,我们预计未来的专门化将会更窄,因为只需要少量的处理器就可以使经济具有吸引力。gydF4y2Ba

我们也希望那些不是专门处理器的最初设计者,而是重新设计算法以利用新硬件的人会大量使用这种处理器,就像深度学习用户对gpu所做的那样。gydF4y2Ba


据估计,小型化的最终收益将以溢价的价格出现,而且只有在重要的商业应用中才有可能为此付出代价。gydF4y2Ba


谁会被落下gydF4y2Ba.不迁移到专用处理器的应用程序可能会失败,因为它们:gydF4y2Ba

  • 获得很少的性能收益,gydF4y2Ba
  • 难道市场不够大,不足以证明前期固定成本是合理的吗gydF4y2Ba
  • 不能协调他们的需求。gydF4y2Ba

前面,我们描述了使用专用处理器加速计算的四个特性。如果没有这些特性,专门化只能获得极少的性能提升(如果有的话)。一个重要的例子是数据库。正如我们采访的一位专家告诉我们的那样:在过去的几十年里,用于数据库的专用处理器显然非常有用,但是数据库所需的计算不适合在专用处理器上进行。gydF4y2Ba

第二种无法获得专门处理器的群体是那些需求不足,无法证明前期固定成本是合理的。正如我们从模型中推导出来的,需要数以千计的处理器市场来证明专业化的合理性。这可能会影响那些在小范围内进行密集计算的人(例如,从事罕见计算的研究科学家),或者那些计算随着时间的推移而迅速变化,因此需求很快消失的人。gydF4y2Ba

第三种可能被淘汰的群体是那些没有个人用户代表足够需求的群体,以及协调困难的群体。例如,即使成千上万的小用户共同拥有足够的需求,让他们共同为生产专门的处理器做出贡献也是非常困难的。云计算公司可以在减轻这种影响方面发挥重要作用,它们可以为创建专用处理器提供资金,然后将这些处理器出租出去。gydF4y2Ba问gydF4y2Ba

技术进步会拯救我们吗?gydF4y2Ba要让我们回到一个趋同的周期,即用户切换回通用处理器,就需要快速提高性能和/或每美元性能。但技术趋势却指向相反的方向。例如,在性能方面,小型化带来的最终好处预计会以较高的价格获得,而且只有重要的商业应用才有可能为此付出代价。甚至还有一个问题,那就是是否所有剩下的技术上可行的小型化都能完成。Gartner预测,到2026年,5nm节点尺寸将大规模生产,gydF4y2Ba18gydF4y2Ba台积电最近宣布计划在2022年投资195亿美元建设3nm工厂。gydF4y2Ba17gydF4y2Ba但我们为这项研究联系的许多受访者都怀疑是否值得将其小型化更长的时间。gydF4y2Ba

另一项技术改进是否会恢复通用处理器改进的步伐?当然,这类技术有很多讨论:量子计算、碳纳米管、光学计算。不幸的是,专家们预计,至少还需要10年时间,工业界才能设计出更广泛的量子计算机,从而有可能取代经典的通用计算机。gydF4y2Ba30.gydF4y2Ba其他可能拥有更广阔前景的技术可能仍需要大量资金来开发和推向市场。gydF4y2Ba20.gydF4y2Ba

回到顶部gydF4y2Ba

结论gydF4y2Ba

传统上,计算经济学是由通用技术模型驱动的,通用处理器变得越来越好,市场增长推动了不断增加的投资,以改进和改进它们。几十年来,这种良性的GPT循环使计算成为经济增长最重要的驱动力之一。gydF4y2Ba

本文提供的证据表明,GPT周期正在被分割周期所取代,在分割周期中,这些力量会减慢计算速度并划分用户。我们展示了碎片周期的三个部分中的每一个都已经开始:通用处理器的改进速度出现了戏剧性的和不断增长的放缓;购买通用处理器和专用处理器之间的经济权衡已经戏剧性地转向了专用处理器;而且,不断上升的制造更好处理器的固定成本已经无法再被市场增长率所覆盖。gydF4y2Ba

总的来说,这些发现清楚地表明,处理器的经济性已经发生了巨大的变化,将计算推向专门的领域,这些领域在很大程度上是不同的,彼此之间提供的好处将越来越少。此外,由于这种循环是自我强化的,它将自我延续,进一步分散通用计算。因此,更多的应用程序将被分离,通用处理器的改进速度将进一步放缓。gydF4y2Ba

因此,我们的文章强调了经济学推动计算方向的一个关键转变,并对那些想要抵制计算碎片化的人提出了挑战。gydF4y2Ba

uf1.jpggydF4y2Ba
数字请在独家报道中观看作者对这项工作的讨论gydF4y2Ba通信gydF4y2Ba视频。gydF4y2Ba//www.eqigeno.com/videos/the-decline-of-computersgydF4y2Ba

回到顶部gydF4y2Ba

参考文献gydF4y2Ba

1.亚马逊网络服务:弹性图形处理器,2017;gydF4y2Bahttps://aws.amazon.com/de/ec2/elastic-gpus/gydF4y2Ba

2.布鲁姆,N,琼斯,C,范·里南,J.和韦伯,M.创意越来越难找了吗?剑桥,马萨诸塞州,2017;gydF4y2Bahttps://doi.org/10.3386/w23782gydF4y2Ba

3.布雷斯纳汉,T.F.和特拉滕贝格,M.通用技术“增长引擎”?gydF4y2Ba65 .经济学gydF4y2Ba, 1(1995年1月),83-108;gydF4y2Bahttps://doi.org/10.1016/0304 - 4076 (94) 01598 - tgydF4y2Ba

4.伯恩,d.m.,奥利纳,S.D.和西切尔,D.E.信息技术革命结束了吗?gydF4y2BaSSRN电子。JgydF4y2Ba.20-36 (2013);gydF4y2Bahttps://doi.org/10.2139/ssrn.2303780gydF4y2Ba

5.Cavin, r.k., Lugli, P.和Zhirnov, v.v.超越摩尔定律的科学与工程。在gydF4y2BaIEEE 100周年特刊论文集gydF4y2Ba(2012年5月),1720-1749;gydF4y2Bahttps://doi.org/10.1109/JPROC.2012.2190155gydF4y2Ba

6.AMD主要芯片供应商将不再生产下一代芯片,2018年;gydF4y2Bahttps://www.engadget.com/2018/08/28/global-foundries-stops-7-nanometer-chip-production/gydF4y2Ba

7.伊斯特伍德,G.芯片设计如何演变以应对物联网的发展。gydF4y2Ba网络世界gydF4y2Ba(2017);gydF4y2Bahttps://www.networkworld.com/article/3227786/internet-of-things/how-chip-design-is-evolving-in-response-to-iot-development.htmlgydF4y2Ba

8.gydF4y2Ba经济学家gydF4y2Ba.计算的未来——继摩尔定律之后(2016);gydF4y2Bahttps://www.economist.com/news/leaders/21694528-era-predictable-improvement-computer-hardware-ending-what-comes-next-futuregydF4y2Ba

9.gydF4y2Ba经济学家gydF4y2Ba.筹码落了:半导体产业和全球化的力量(2018);gydF4y2Bahttps://www.economist.com/briefing/2018/12/01/the-semiconductor-industry-and-the-power-of-globalisationgydF4y2Ba.gydF4y2Ba

10.ENIAC报告。摩尔电气工程学院,1946年。gydF4y2Ba

11.新型gpu加速超级计算机改变2018年TOP500的力量平衡;gydF4y2Bahttps://www.top500.org/news/new-gpu-accelerated-supercomputers-change-the-balance-of-power-on-the-top500/gydF4y2Ba

12.Gartner集团。Gartner称2017年全球半导体收入增长22.2%。三星占据了第一的位置。Gartner。2018;gydF4y2Bahttps://www.gartner.com/newsroom/id/3842666gydF4y2Ba

13.谷歌云。谷歌:2018年发行说明;gydF4y2Bahttps://cloud.google.com/tpu/docs/release-notesgydF4y2Ba

14.百度的自定义人工智能和分析处理器。下一个平台;gydF4y2Bahttps://www.nextplatform.com/2017/08/22/first-look-baidus-custom-ai-analytics-processor/gydF4y2Ba

15.轩尼诗,J.和帕特森,D.。gydF4y2Ba计算机体系结构:定量方法gydF4y2Ba(6gydF4y2BathgydF4y2Baed)。摩根·考夫曼出版社,剑桥,马萨诸塞州,2019年。gydF4y2Ba

16.半导体2.0国际技术路线图:执行报告。国际半导体技术路线图,79,2015;gydF4y2Bahttp://www.semiconductors.org/main/2015_international_technology_roadmap_for_semiconductors_itrs/gydF4y2Ba

17.台湾晶片制造商台积电将兴建全球首个3纳米晶片工厂。gydF4y2BaTechnodegydF4y2Ba, 2018;gydF4y2Bahttps://technode.com/2018/12/20/taiwanese-chip-maker-tsmc-to-build-the-worlds-first-3nm-chip-factory/gydF4y2Ba

18.约翰逊,B,段,S,布雷迪,W,吉姆,W和吉姆,B。gydF4y2BaGartner预测2017年:半导体技术在2026年gydF4y2Ba.gydF4y2Ba

19.朱皮,N.P.等人。张量处理单元的数据中心内性能分析。在gydF4y2Ba44届会议记录gydF4y2BathgydF4y2Ba年度Int。计算机协会。第一版。ArchitgydF4y2Ba.1 - 12 (2017);gydF4y2Bahttps://doi.org/10.1145/3079856.3080246gydF4y2Ba

20.汗,H.N,猎狗,D.A.和Fuchs, E.R.H.摩尔定律的科学和研究政策。gydF4y2Ba1 .电子gydF4y2Ba, 1 (2018), 14-21;gydF4y2Bahttps://doi.org/10.1038/s41928-017-0005-9gydF4y2Ba

21.哈兹雷,M,张,L,维加,L,泰勒,M.B.太空步?ASIC云或加速器中的NRE优化将使用旧的硅。在gydF4y2BaACM ASPLOS 2017论文集gydF4y2Ba硕士论文;gydF4y2Bahttps://doi.org/http://dx.doi.org/10.1145/3037697.3037749gydF4y2Ba

22.科再奇,B.英特尔公司在桑福德-伯恩斯坦战略决策会议上的演讲,2016年。gydF4y2Ba

23.2018年铸造挑战。半导体工程,2017;gydF4y2Bahttps://semiengineering.com/foundry-challenges-in-2018/gydF4y2Ba

24.雷瑟森,c.e.,汤普森,N., Emer, J.,库兹摩尔,b.c.,兰普森,b.w.,桑切斯,D.和夏德尔,T.B.,在顶端有足够的空间:摩尔定律结束后,什么将推动计算机性能的增长?gydF4y2Ba科学gydF4y2Ba(2020)。gydF4y2Ba

25.马丁,T.W.和菲茨杰拉德,D.你对旧智能手机的热爱对苹果和三星来说是一个问题。《华尔街日报》(2018年);gydF4y2Bahttps://www.wsj.com/articles/your-love-of-your-old-smartphone-is-a-problem-for-apple-and-samsung-1519822801gydF4y2Ba

26.Mims, C. Huang的定律是新的摩尔定律,并解释了为什么英伟达想要arm。gydF4y2Ba《华尔街日报》gydF4y2Ba(2020);gydF4y2Bahttps://www.wsj.com/articles/huangs-law-is-the-new-moores-law-and-explains-why-nvidia-wants-arm-11600488001gydF4y2Ba

27.NVIDIA公司。Tesla P100性能指南。高性能计算与深度学习应用,2017。gydF4y2Ba

28.在数字时代锻造智能系统。MTL研讨会,2017;gydF4y2Bahttps://www-mtl.mit.edu/mtlseminar/garypatton.html#simple3gydF4y2Ba

29.范,S. 2018。谁需要美国?阿里巴巴将生产自己的电脑芯片。CNN商业,2018;gydF4y2Bahttps://edition.cnn.com/2018/10/01/tech/alibaba-chip-company/index.htmlgydF4y2Ba

30.英特尔向通用量子计算迈出第一步。下一个平台,2017;gydF4y2Bahttps://www.nextplatform.com/2017/10/11/intel-takes-first-steps-universal-quantum-computing/gydF4y2Ba

31.普特南,A.等。用于加速大规模数据中心服务的可重构结构。gydF4y2BaCommun。ACM 59gydF4y2Ba, 11(2016年10月),114-122;gydF4y2Bahttps://doi.org/10.1145/2996868gydF4y2Ba

32.Santhanam, N, Wiseman, B, Campbell, H, Gold, A. and Javetski, B. McKinsey on Semiconductors, 2015。gydF4y2Ba

33.沙夫,J.M.,利兰。超越摩尔定律的计算。gydF4y2Ba电脑48gydF4y2Ba, 12(2015年12月),14-23;gydF4y2Bahttps://doi.org/10.1109/MC.2015.374gydF4y2Ba

34.Shao, y.s., Reagen, B., Wei, g.y., and Brooks, D. Aladdin: pre-RTL,功率性能加速器模拟器,可用于定制架构的大设计空间探索。在gydF4y2Ba国际会议记录。计算机协会。第一版。ArchitgydF4y2Ba.(2014), 97 - 108;DOI:gydF4y2Bahttps://doi.org/10.1109/ISCA.2014.6853196gydF4y2Ba

35.半导体行业协会:2017年概况;gydF4y2Bahttp://go.semiconductors.org/2017-sia-factbook-0-0-0gydF4y2Ba

36.史密斯,S.J.英特尔:战略概述,2017;gydF4y2Bahttps://doi.org/10.1016/B978-0-240-52168-8.10001-XgydF4y2Ba

37.的外企。绿色500强榜单(2019年6月);gydF4y2Bahttps://www.top500.org/green500/lists/2019/06/gydF4y2Ba

38.Worldometers。2018年全球电脑销量;gydF4y2Bahttp://www.worldometers.info/computers/gydF4y2Ba

回到顶部gydF4y2Ba

作者gydF4y2Ba

尼尔·c·汤普森gydF4y2Ba(gydF4y2Baneil_t@mit.edugydF4y2Ba)是美国马萨诸塞州剑桥市麻省理工学院计算机科学与人工智能实验室和数字经济计划的创新学者。gydF4y2Ba

Svenja SpanuthgydF4y2Ba(gydF4y2Basspanuth@ethz.chgydF4y2Ba)是瑞士苏黎世联邦理工学院管理、技术和经济系的博士研究生。gydF4y2Ba

回到顶部gydF4y2Ba

脚注gydF4y2Ba

他们的分析不包括农业部门。gydF4y2Ba

b.在本文中,术语“计算机”既指仅具有通用处理器的设备,也指同时包含专用功能的设备。gydF4y2Ba

c.按2008-2017年研发和个人防护装备支出的增加计算。gydF4y2Ba

d.当然,许多任务都有多个部分,有些是可并行的,有些则不是。在这种情况下,加速将受到阿姆达尔定律的约束。gydF4y2Ba

e.为简洁起见,我们将在本文中使用术语“专用处理器”,既指独立处理器,也指异构芯片(例如,ip块)上的专用功能。gydF4y2Ba

f.这适用于16/14nm节点尺寸。到目前为止,光刻成本是制造NRE的最大成本组成部分。gydF4y2Ba21gydF4y2Ba其他成本包括劳动力和设计工具,以及知识产权许可。gydF4y2Ba

虽然我们考虑的是基于计算能力/速度的性能度量,但这个模型实际上更一般,可以指其他特征(例如,能源效率)。gydF4y2Ba

h.更大规模的计算(包括当前深度学习模型的大规模并行)是同一问题的放大版本,我们分析的逻辑(因此我们的结果)也适用于它们。gydF4y2Ba

i.这里我们假设运行操作系统和控制专用处理器的CPU成本对这个计算没有实质性的影响。放松这一假设并不会改变我们的模型,但需要将这些成本纳入专门的处理器参数估计中。gydF4y2Ba

j.在实践中,制造商在发布新设计时并不是不断地更新,而是大步地更新。然而,用户可能会更频繁地体验这些跳转,因为他们倾向于不断刷新计算机的某些部分。连续形式在数学上也更容易处理。gydF4y2Ba

k.在网上附录(gydF4y2Bahttps://doi.org/10.1145/3430936gydF4y2Ba)我们还考虑这些值如何随着代码开发成本的变化而变化。gydF4y2Ba

l. 230亿美元的代工收入(台积电和GlobalFoundries)可以归因于领先的节点。gydF4y2Ba36gydF4y2Ba假设英特尔(540亿美元)和三星(400亿美元)总收入的大部分(90%)gydF4y2Ba12gydF4y2Ba源自前沿节点,收益率上限为1080亿美元/ 3430亿美元≈30%。gydF4y2Ba

m.我们隐含地假设这也是前沿节点的增长率。实际上可能会低一些,这只会强调我们的观点。gydF4y2Ba

n.尽管他们的变化速度不太有利,英特尔的大市场份额意味着他们从一个较低的基础开始,所以他们仍然具有很强的竞争力。gydF4y2Ba

o.根据英特尔财务报表计算,固定成本为研发+财产、工厂和设备,可变成本为销售货物的成本。gydF4y2Ba

p.假设每两年需要新的设施;30%的市场销售流向了领先的芯片;固定成本每年增长13%。2026年:0%市场增长/ 2032年:5%市场增长。我们(保守地)认为,一个设施就能满足所有的市场需求。如果需要更多,日期将提前。gydF4y2Ba

q.谷歌已经在其云上提供tpu,gydF4y2Ba13gydF4y2Ba和亚马逊网络服务(以及其他)提供图形处理器。gydF4y2Ba1gydF4y2Ba

两位作者对这项工作的贡献相同。gydF4y2Ba


版权归作者所有。gydF4y2Ba
向所有者/作者请求(重新)发布的许可gydF4y2Ba

数字图书馆是由计算机协会出版的。版权所有©2021 ACM, Inc.gydF4y2Ba


没有找到条目gydF4y2Ba

Baidu
map