acm-header
登录gydF4y2Ba

ACM通信gydF4y2Ba

贡献的文章gydF4y2Ba

计算机作为通用技术的衰落gydF4y2Ba


芯片和电路板熔化,插图gydF4y2Ba

图片来源:美国形象基金会gydF4y2Ba

也许没有任何一项技术能像计算机技术那样,在几十年里每年都有如此大的进步。据估计,自1974年以来,美国三分之一的生产力增长来自信息技术,gydF4y2Ba一个gydF4y2Ba,gydF4y2Ba4gydF4y2Ba使它成为国家繁荣的最大贡献者之一。gydF4y2Ba

回到顶部gydF4y2Ba

关键的见解gydF4y2Ba

ins01.gifgydF4y2Ba

计算机的崛起是由于技术上的成功,但也要归功于为它们提供资金的经济力量。Bresnahan和TrajtenberggydF4y2Ba3.gydF4y2Ba创造了这个术语gydF4y2Ba通用技术gydF4y2Ba(GPT)适用于计算机等具有广泛技术适用性、产品改进和市场增长可以相互促进几十年的产品。但是,他们也预测GPT在其生命周期的末尾可能会遇到挑战:随着进展放缓,其他技术可能会在特定的利基领域取代GPT,并破坏这种经济强化周期。我们今天正在观察这样的转变:中央处理器(cpu)的改进缓慢,因此应用程序转移到gydF4y2Ba专门的处理器gydF4y2Ba例如,图形处理单元(gpu),它能做的事情比传统的通用处理器少,但这些功能的表现更好。许多高调的应用程序已经在顺应这一趋势,包括深度学习(一种机器学习形式)和比特币挖矿。gydF4y2Ba

有了这个背景,我们现在可以更精确地阐述我们的论文:“计算机作为一种通用技术的衰落”。我们所做的gydF4y2Ba不gydF4y2Ba这意味着,计算机综合起来将失去技术能力,从而“忘记”如何进行一些计算。我们gydF4y2Ba做gydF4y2Ba这意味着,由快速改进的通用处理器支撑的导致通用计算平台使用的经济周期正在让位于碎片化周期,在碎片化周期中,经济将用户推向由特殊用途处理器驱动的不同计算平台。gydF4y2Ba

这种碎片化意味着计算的各个部分将以不同的速度进行。这对于进入“快车道”的应用程序来说是好事,因为在“快车道”中,改进将继续快速进行,但对于那些不再从领域领导者推动计算向前发展中获益的应用程序来说,就不妙了,因为这些应用程序因此陷入了计算改进的“慢车道”。这种转变也可能减缓计算机改进的总体速度,危及这一重要的经济繁荣来源。gydF4y2Ba

回到顶部gydF4y2Ba

通用和专业计算gydF4y2Ba

早期——从专业到通用gydF4y2Ba.早期的电子产品并不是能够进行多种不同计算的通用计算机,而是专门设计用于且仅用于一项任务的专用设备,如收音机或电视。这种专门的方法有优点:设计的复杂性是可控的,处理器效率高,工作速度快,耗电量少。但专用处理器也“更窄”,可以用于更少的应用程序。gydF4y2Ba

早期的电子计算机,gydF4y2BabgydF4y2Ba即使是那些被设计为“通用”的算法,实际上也是为特定算法量身定制的,很难适应其他算法。例如,虽然1946年的ENIAC是理论上的通用计算机,但它主要用于计算火炮射程表。即使需要稍微不同的计算,计算机也必须手动重新连接以实现新的硬件设计。解决这个问题的关键是一种新的可以存储指令的计算机架构。gydF4y2Ba10gydF4y2Ba这种架构使计算机更加灵活,使它能够在通用硬件上执行许多不同的算法,而不是在专门的硬件上。这种“冯·诺依曼体系结构”非常成功,它仍然是当今几乎所有通用处理器的基础。gydF4y2Ba

通用处理器的崛起gydF4y2Ba.许多技术,当它们被引入市场时,经历了一个良性的强化循环,帮助它们发展(gydF4y2Ba图1一个gydF4y2Ba).早期采用者购买产品,然后投资使产品更好。随着产品的改进,更多的消费者会购买它,从而为下一轮的开发提供资金,以此类推。对于许多产品来说,随着产品改进变得过于困难或市场增长停滞,这个周期会在中短期结束。gydF4y2Ba

f1.jpggydF4y2Ba
图1。通用处理器的历史良性循环(a)正在转变为碎片化循环(b)。gydF4y2Ba

GPTs的定义是在其增长过程中继续从这种良性经济循环中获益的能力——就像通用处理器几十年来所做的那样。这个市场已经从军事、太空等少数高价值应用发展到全球使用的个人电脑超过20亿台。gydF4y2Ba38gydF4y2Ba这种市场增长推动了越来越多的投资来改进处理器。例如,英特尔在过去10年里在研发和新的制造设施上花费了1830亿美元。gydF4y2BacgydF4y2Ba这带来了巨大的收益:据估计,自1971年以来,处理器性能提高了约40万倍。gydF4y2Ba8gydF4y2Ba

另一种选择是:专用处理器gydF4y2Ba.通用处理器必须能够很好地进行许多不同的计算。这导致了设计上的妥协,使许多计算更快,但不是最优的。对于非常适合专门化的应用程序,这种折衷带来的性能损失是很高的,即:gydF4y2Ba

  • 大量的计算可以并行化gydF4y2Ba
  • 要完成的计算是稳定的,并且每隔一定的时间到达(“规律性”)gydF4y2Ba
  • 对于给定的计算量('局部性'),需要相对较少的内存访问gydF4y2Ba
  • 计算可以用更少的有效位数来完成。gydF4y2Ba15gydF4y2Ba

在每种情况下,专门的处理器(例如,特定于应用程序的集成电路(asic))或异构芯片的专门部件(例如,ip块)可以执行得更好,因为定制硬件可以根据计算进行定制。gydF4y2Ba24gydF4y2Ba

专门化导致处理器设计变化的程度可以从典型cpu(占主导地位的通用处理器)和典型gpu(最常见的专门化处理器类型)的比较中看到gydF4y2Ba表格gydF4y2Ba).gydF4y2Ba

ut1.jpggydF4y2Ba
表格CPU相对于GPU的技术指标。gydF4y2Ba

GPU的运行速度较慢,大约是CPU频率的三分之一,但在每个时钟周期内,它可以执行比CPU多100倍的并行计算。这使得它在处理具有大量并行性的任务时比CPU快得多,但在处理并行性很少的任务时却比CPU慢。gydF4y2BadgydF4y2Ba

gpu通常有5 - 10倍的内存带宽(决定一次可以移动多少数据),但在访问数据时有更长的延迟(从最近的内存至少有6倍的时钟周期)。这使得gpu更擅长于可预测的计算(需要的数据可以从内存中预测出来,并在正确的时间被带到处理器中),而在不可预测的计算中则更糟糕。gydF4y2Ba

对于与专用硬件很好匹配的应用程序(以及可以使用编程模型(例如CUDA)来利用该硬件),性能方面的收益是可观的。例如,在2017年,领先的GPU制造商NVIDIA估计,深度学习(AlexNet with Caffe)通过在GPU而不是cpu上运行得到了35倍以上的加速。27今天,这种加速甚至更大。gydF4y2Ba26gydF4y2Ba

专用处理器的另一个重要好处gydF4y2BaegydF4y2Ba它们用更少的能量来做同样的计算。这对于受电池寿命限制的应用(手机、物联网设备)和那些进行大规模计算的应用(云计算/数据中心、超级计算)尤其有价值。gydF4y2Ba

截至2019年,十大能效最高的超级计算机中有9台都在使用NVIDIA gpu。gydF4y2Ba37gydF4y2Ba

专用处理器也有重要的缺点:它们只能运行有限范围的程序,很难编程,而且通常需要运行操作系统的通用处理器来控制(一个或多个)它们。设计和制造专门的硬件也很昂贵。对于通用处理器,它们的固定成本(也称为非经常性工程成本(NRE))分布在大量的芯片上。相比之下,专业处理器的市场通常要小得多,因此每个芯片的固定成本更高。更具体地说,使用尖端技术制造一个具有专门处理器的芯片的总成本约为8000万美元gydF4y2BafgydF4y2Ba(截至2018年)。使用较老一代的技术可以将成本降低到约3000万美元。gydF4y2Ba23gydF4y2Ba

尽管专业处理器有很多优点,但它们的缺点非常重要,以至于在过去的几十年里很少有人采用(除了gpu)。确实发生的采用是在性能改进非常有价值的领域,包括军事应用、游戏和加密货币挖矿。但这种情况正在开始改变。gydF4y2Ba

今天专业处理器的状态gydF4y2Ba.所有主要的计算平台,pc、移动、物联网(IoT)和云/超级计算,都在变得越来越专业化。在这些设备中,个人电脑仍然是最普遍的。相比之下,能源效率在移动和物联网中更重要,因为电池寿命,因此,智能手机芯片上的很多电路,gydF4y2Ba34gydF4y2Ba而像rfid标签这样的传感器则使用专门的处理器。gydF4y2Ba5gydF4y2Ba,gydF4y2Ba7gydF4y2Ba

云计算/超级计算也变得更加专业化。例如,2018年是最大的500台超级计算机的新成员首次从专门处理器获得比通用处理器更多的性能。gydF4y2Ba11gydF4y2Ba

国际半导体技术路线图(ITRS)的行业专家在他们的最终报告中含蓄地支持了这种向专业化的转变,该组织协调了维持摩尔定律所需的技术改进。他们承认,传统的缩小晶体管的一刀切方法不应再决定设计要求,而应根据具体应用进行定制。gydF4y2Ba16gydF4y2Ba

下一节将探讨所有主要计算平台向专用处理器的转移对生产通用处理器的经济效益的影响。gydF4y2Ba

回到顶部gydF4y2Ba

通用技术的碎片化gydF4y2Ba

支撑GPTs的良性循环来自一组相互加强的技术和经济力量。不幸的是,这种相互强化也适用于相反的方向:如果改善在循环的一个部分缓慢,那么在循环的其他部分也会如此。我们称这种对位为“分割周期”,因为它有可能将计算分割成一组以不同速度前进的松散相关的筒仓。gydF4y2Ba

作为gydF4y2Ba图1 (b)gydF4y2Ba可见,破碎循环有三个部分:gydF4y2Ba

  • 科技进步缓慢gydF4y2Ba
  • 更少的新用户采用gydF4y2Ba
  • 为创新融资则更为困难gydF4y2Ba

这种循环背后的直觉很直接:如果技术发展缓慢,那么采用技术的新用户就会减少。但是,如果没有这些用户带来的市场增长,改进技术所需的成本上升可能会令人望而却步,从而减缓技术的进步。因此,这种协同反应的每一部分都进一步加强了碎片化。gydF4y2Ba

在这里,我们将描述计算周期的这三个部分的每个状态,并表明碎片化已经开始。gydF4y2Ba

科技进步缓慢gydF4y2Ba.为了衡量处理器的改进速度,我们考虑两个关键指标:gydF4y2Ba性能gydF4y2BaggydF4y2Ba而且gydF4y2Baperformance-per-dollargydF4y2Ba.从历史上看,这两个指标都得到了迅速的改善,很大程度上是因为晶体管小型化导致了每个芯片的晶体管密度更大(摩尔定律)和更快的晶体管切换速度(通过登纳德缩放)。gydF4y2Ba24gydF4y2Ba不幸的是,由于技术上的挑战,登纳德比例法在2004/2005年结束,摩尔定律也即将结束,因为制造商已经达到了现有材料和设计的物理极限,gydF4y2Ba33gydF4y2Ba这些限制需要付出更多的努力才能克服。gydF4y2Ba2gydF4y2Ba小型化带来的好处的丧失可以从性能和每美元性能改善的放缓中生动地看到。gydF4y2Ba

图2 (a)gydF4y2Ba,基于Hennessy和Patterson对SPECInt进展的描述,以及gydF4y2Ba图2 (b)gydF4y2Ba从美国劳工统计局(Bureau of Labor Statistics)的生产者价格指数(ppi)来看,通用电脑的性能提升速度有多慢。从这个角度来看,如果每美元的性能每年提高48%,那么在10年里它将提高50倍。相比之下,如果每年只提高8%,那么10年只提高2倍。gydF4y2Ba

f2.jpggydF4y2Ba
图2。微处理器的改进率,用(a) SPECint基准的年度性能改进,gydF4y2Ba7附录gydF4y2Ba(b)每年经质量调整的价格下降。gydF4y2Ba1附录gydF4y2Ba

更少的新用户采用gydF4y2Ba.随着通用处理器的改进速度放缓,将会有更少的程序具有新的功能,因此客户将没有动力更换他们的计算设备。英特尔首席执行官科再奇在2016年证实了这一点,他说个人电脑的更换率已经从每4年上升到每5-6年。gydF4y2Ba22gydF4y2Ba有时,客户甚至在值得更新之前跳过多代处理器改进。gydF4y2Ba28gydF4y2Ba在其他平台上也是如此,例如,美国智能手机在2014年平均每23个月升级一次,但到2018年,这一周期延长到31个月。gydF4y2Ba25gydF4y2Ba


GPTs的定义是在其增长过程中继续从这种良性经济循环中获益的能力——就像通用处理器几十年来所做的那样。gydF4y2Ba


用户从通用处理器向专门处理器的转移是我们关于计算碎片化的论点的中心,因此我们将对此进行详细讨论。考虑这样一个用户,他既可以使用通用处理器,也可以使用专用处理器,但又希望使用能够以最低成本提供最佳性能的处理器。gydF4y2BahgydF4y2Ba图3(一个)gydF4y2Ba而且gydF4y2Ba3 (b)gydF4y2Ba给出我们分析的直觉。每个面板显示了通用处理器和专用处理器随时间变化的性能,但通用处理器的改进速度不同。在所有情况下,我们假设时间,gydF4y2BaTgydF4y2Ba选择通用处理器的原因是,专业处理器的较高价格恰好被一系列(改进的)通用处理器的成本所抵消。这意味着两条曲线的成本是相等的,因此优越的性能也意味着优越的每美元性能。这也是为什么我们将专用处理器描述为在此期间具有恒定性能的原因。(在升级专用处理器的时候,它也会从通用处理器受益的过程改进中获益,用户将再次重复相同的决策过程。)gydF4y2Ba

f3.jpggydF4y2Ba
图3。最佳处理器的选择取决于专用处理器提供的性能加速,以及通用技术的改进速度。gydF4y2Ba

如果专用处理器在初始性能上提供较大的增益,则它更有吸引力。但是,如果通用处理器的改进速度从快速(如面板(a))到较慢(如面板(b)),它也会变得更有吸引力。我们通过考虑两种时间路径中哪一种提供了更多的好处来正式建模。也就是说,专业处理器更有吸引力,如果gydF4y2Ba

ueq01.gifgydF4y2Ba

通用和专用处理器在哪里提供性能gydF4y2Ba我gydF4y2BaPgydF4y2BaugydF4y2Ba,gydF4y2BaPgydF4y2Ba年代gydF4y2Ba,随着时间的推移gydF4y2BaTgydF4y2Ba,而通用处理器改进在gydF4y2BargydF4y2Ba.gydF4y2BajgydF4y2Ba我们在在线附录中给出了这个模型的完整推导(gydF4y2Bahttps://doi.org/10.1145/3430936gydF4y2Ba).这一推导使我们能够从数字上估计专业化的优势所需要的数量,以超过更高的成本(见gydF4y2Ba图3 (c)gydF4y2Bacpu每年的改进率从48%下降到8%)。gydF4y2Ba

不足为奇的是,当专用处理器提供更大的加速或当其成本可以分摊到更大的容量上时,它们就更有吸引力。但是,根据通用处理器的改进速度,专门化何时变得有吸引力的界限会发生变化。重要的是,这种效应不会出现,因为我们假设专业处理器和通用处理器之间有不同的进展速度——总体而言,所有处理器都假设能够使用当前最前沿的制造技术。相反,它的出现是因为专业处理器的更高的单位NRE必须被摊销,以及这与同一时期升级通用处理器相比有多好。gydF4y2Ba

一个数值例子表明了这一变化的重要性。在摩尔定律的峰值,即每年改进48%,即使专业处理器比通用处理器快100倍,也就是说,gydF4y2Bacacm6403_a.gifgydF4y2Ba(巨大的差异),那么需要建造~ 8.3万美元的投资才能获得回报。在另一个极端,如果性能效益只有2倍,则需要建立~ 1,000,000以使专业化具有吸引力。这些结果清楚地说明了为什么在摩尔定律的全盛时期,专业加工商很难打入市场。gydF4y2Ba

然而,如果我们使用2008-2013年8%的改进率重复我们的处理器选择计算,这些结果会发生显著变化:对于具有100倍加速的应用程序,所需处理器数量从83,000下降到15,000,而对于具有2倍加速的应用程序,所需处理器数量从1,000,000下降到81,000。因此,在通用处理器进展放缓之后,更多的应用程序可以用于专门化。gydF4y2BakgydF4y2Ba

为创新融资更难gydF4y2Ba.2017年,半导体行业协会估计,为下一代芯片建造和装备制造设施(“fab”)的成本约为70亿美元。gydF4y2Ba35gydF4y2Ba所谓“下一代”,我们指的是芯片组件(或进程“节点”)的下一个小型化。gydF4y2Ba

投资在芯片制造设施上的成本必须与它们产生的收入相匹配。可能高达30%gydF4y2BalgydF4y2Ba该行业3430亿美元的年收入(2016年)来自尖端芯片。因此,收入是可观的,但成本却在增长。在过去的25年里,投资建立领先的晶圆厂(如图所示)gydF4y2Ba图4一gydF4y2Ba)每年上涨11%(!),主要是受光刻成本的推动。在这一估算中包括工艺开发成本,将进一步加速成本增长至每年13%(根据Santhanam等人在2001年至2014年的测算)。gydF4y2Ba32gydF4y2Ba).这一点在芯片制造商中是众所周知的,他们嘲笑摩尔的“第二定律”:芯片工厂的成本每四年翻一番。gydF4y2Ba9gydF4y2Ba

f4.jpggydF4y2Ba
图4。芯片制造经济恶化。gydF4y2Ba

从历史上看,固定成本如此快速增长对单位成本的影响仅被强劲的整体半导体市场增长(1996-2016年复合年增长率为5%)部分抵消gydF4y2Ba米gydF4y2Ba,gydF4y2Ba35gydF4y2Ba),这使得半导体制造商可以在更大的产量上摊销固定成本。固定成本每年增长13%和市场每年增长5%之间的巨大差距,预计将导致竞争力较弱的企业离开市场,剩下的企业将在更多的芯片上摊销固定成本。gydF4y2Ba

作为gydF4y2Ba图4 (b)gydF4y2Ba这表明,该行业确实出现了大规模的整合,生产尖端芯片的公司越来越少。从2002/2003年到2014/2015/2016年,拥有前沿晶圆厂的半导体制造商数量从25家下降到只有4家:英特尔、台积电、三星和GlobalFoundries。GlobalFoundries最近宣布,他们不会继续开发下一个节点。gydF4y2Ba6gydF4y2Ba

我们认为,这种整合很有可能是由快速上升的固定成本和温和的市场规模增长导致的经济恶化造成的。市场整合在多大程度上改善了这些经济状况,可以通过一些粗略的计算看出。如果市场被平均分配给不同的公司,这将意味着平均市场份额的增长gydF4y2Bacacm6403_b.gifgydF4y2Ba2002/2003年至gydF4y2Bacacm6403_c.gifgydF4y2Ba在2014/2015/2016。以复合年增长率表示,这将是14%。这意味着生产商可以通过市场增长来抵消晶圆厂建设的经济恶化,并夺取现有晶圆厂的市场份额(13%<5%+14%)。gydF4y2Ba

在实践中,市场并不是平均分配的,英特尔占据了主导份额。因此,英特尔无法通过这种方式抵消固定成本的增长。gydF4y2BangydF4y2Ba事实上,在过去的十年中,英特尔的固定成本与可变成本之比已经从60%上升到100%以上。gydF4y2BaogydF4y2Ba这是特别引人注目的,因为近年来英特尔已经放慢了发布新节点大小的速度,而这是预期的gydF4y2Ba减少gydF4y2Ba他们需要进行固定成本投资的速度。gydF4y2Ba

通过市场整合来抵消固定成本增加的能力只能持续这么长时间。如果我们预测当前的趋势,那么到2026年到2032年(取决于市场增长率),尖端半导体制造将只能支持一个垄断制造商,每年为每个节点规模建设一个新设施的固定成本将等于每年的行业收入(详见尾注)gydF4y2BapgydF4y2Ba).我们提出这一点并不是说在21世纪20年代末这将成为现实,而是确切地说,当前的趋势gydF4y2Ba不能gydF4y2Ba如果继续下去,在大约10年内(!)制造商将被迫大幅放缓新技术节点的发布,并寻找其他方法来控制成本,这两种情况都将进一步减缓通用处理器的进展。gydF4y2Ba

碎片化周期gydF4y2Ba.由于碎片化周期的三个部分已经相互加强,我们预计将看到越来越多的用户面临通用处理器的微薄改进,从而有兴趣切换到专门的处理器。对于那些有足够的需求和非常适合专业化的计算(例如,深度学习),这将意味着数量级的改进。对于其他公司来说,专业化将不是一个选择,它们将继续使用改进得越来越慢的通用处理器。gydF4y2Ba

回到顶部gydF4y2Ba

影响gydF4y2Ba

谁会专攻gydF4y2Ba.如gydF4y2Ba图3 (c)gydF4y2Ba在美国,那些从转换中获得较大加速的公司,以及那些需要足够多的处理器来证明固定成本是合理的公司,将采用专门的处理器。基于这些标准,大型科技公司是第一批投资专门处理器的公司,例如谷歌,gydF4y2Ba19gydF4y2Ba微软,gydF4y2Ba31gydF4y2Ba百度,gydF4y2Ba14gydF4y2Ba和阿里巴巴。gydF4y2Ba29gydF4y2Ba与gpu的专门化不同,gpu的专门化仍然受益于广泛的应用,也不像密码电路的专门化,对大多数用户都很有价值,我们预计未来的专门化会更窄,因为只需要少量的处理器就可以使经济更具吸引力。gydF4y2Ba

我们也希望那些不是专门处理器的最初设计者,而是重新设计算法以利用新硬件的人能够大量使用,就像深度学习用户使用gpu一样。gydF4y2Ba


预计小型化的最终好处将以溢价的价格出现,而且只有重要的商业应用才可能为其买单。gydF4y2Ba


谁会被抛弃gydF4y2Ba.没有移动到专用处理器的应用程序可能会失败,因为:gydF4y2Ba

  • 获得的性能收益很小,gydF4y2Ba
  • 难道一个足够大的市场不足以证明前期的固定成本是合理的吗gydF4y2Ba
  • 不能协调他们的需求。gydF4y2Ba

在前面,我们描述了使用专用处理器加速计算的四个特征。如果没有这些特性,专门化只会带来最小的性能提升(如果有的话)。这方面的一个重要例子是数据库。正如我们采访的一位专家告诉我们的那样:在过去的几十年里,用于数据库的专门处理器显然非常有用,但数据库所需的计算不太适合在专门的处理器上进行。gydF4y2Ba

第二种无法获得专业处理器的企业是那些需求不足,无法证明前期固定成本的合理性的企业。正如我们用我们的模型推导出的那样,需要一个数千个处理器的市场来证明专业化是合理的。这可能会影响到那些在小范围内进行密集计算的人(例如,从事罕见计算的研究科学家),或者那些计算量随时间变化很快,因此需求很快消失的人。gydF4y2Ba

第三种可能被抛在后面的群体是那些没有单个用户代表足够的需求,而且协调困难的群体。例如,即使成千上万的小用户共同拥有足够的需求,让他们共同参与生产专用处理器也会非常困难。云计算公司可以通过为专门处理器的创建提供资金,然后将其出租,在缓解这种影响方面发挥重要作用。gydF4y2Ba问gydF4y2Ba

技术进步会拯救我们吗?gydF4y2Ba要让我们回到一个收敛的周期,即用户切换回通用处理器,就需要快速提高性能和/或每美元性能。但技术趋势却指向相反的方向。例如,在性能方面,预计小型化的最终好处将以溢价的价格获得,而且只有重要的商业应用程序才可能为此付出代价。甚至还有一个问题是,是否所有剩下的技术上可行的小型化都将完成。Gartner预测未来还会有更多的研究,到2026年,5nm尺寸的节点将会大规模生产,gydF4y2Ba18gydF4y2Ba台积电最近宣布,计划在2022年投资195亿美元建设3纳米工厂。gydF4y2Ba17gydF4y2Ba但我们为这项研究联系到的许多受访者都怀疑,这种微型化是否值得持续太久。gydF4y2Ba

另一项技术改进是否会恢复通用处理器的改进速度?当然,有很多关于这类技术的讨论:量子计算,碳纳米管,光学计算。不幸的是,专家们预计,至少还需要10年的时间,工业界才能设计出更广泛的量子计算机,从而有可能取代经典的通用计算机。gydF4y2Ba30.gydF4y2Ba其他可能具有更广泛前景的技术可能仍需要多得多的资金来开发和进入市场。gydF4y2Ba20.gydF4y2Ba

回到顶部gydF4y2Ba

结论gydF4y2Ba

传统上,计算经济是由通用技术模型驱动的,通用处理器不断发展,市场增长推动了不断增加的投资,以完善和改进它们。几十年来,这种良性的GPT循环使计算成为经济增长最重要的推动力之一。gydF4y2Ba

本文提供的证据表明,这种GPT周期正在被碎片化周期所取代,在碎片化周期中,这些力量会减慢计算速度并划分用户。我们展示了碎片化周期的三个部分:通用处理器的改进速度出现了显著的、不断增长的放缓;购买通用处理器和专门处理器之间的经济权衡已经戏剧性地转向专门处理器;制造越来越好的处理器所增加的固定成本已经无法用市场增长率来弥补了。gydF4y2Ba

总的来说,这些发现清楚地表明,处理器的经济已经发生了巨大的变化,将计算推向了各不相同的专门领域,彼此之间提供的好处将越来越少。此外,因为这个循环是自我强化的,它将会持续下去,进一步分裂通用计算。因此,更多的应用程序将被分离,通用处理器的改进速度将进一步放缓。gydF4y2Ba

因此,我们的文章强调了经济学推动计算方向的一个关键转变,并对那些想要抵制计算碎片化的人提出了挑战。gydF4y2Ba

uf1.jpggydF4y2Ba
数字观看作者在独家报道中讨论这项工作gydF4y2Ba通信gydF4y2Ba视频。gydF4y2Ba//www.eqigeno.com/videos/the-decline-of-computersgydF4y2Ba

回到顶部gydF4y2Ba

参考文献gydF4y2Ba

1.亚马逊网络服务:弹性图形处理器,2017;gydF4y2Bahttps://aws.amazon.com/de/ec2/elastic-gpus/gydF4y2Ba

2.布鲁姆,N,琼斯,C,范·里南,j和韦伯,m。创意越来越难找到了吗?剑桥,MA, 2017;gydF4y2Bahttps://doi.org/10.3386/w23782gydF4y2Ba

3.布雷斯纳汉,T.F.和特拉滕贝格,M.通用技术“增长的引擎”?gydF4y2Ba经济学gydF4y2Ba, 1(1995年1月),83-108;gydF4y2Bahttps://doi.org/10.1016/0304 - 4076 (94) 01598 - tgydF4y2Ba

4.伯恩,d.m.,奥利纳,S.D.和西切尔,D.E.信息技术革命结束了吗?gydF4y2BaSSRN电子。JgydF4y2Ba.20-36 (2013);gydF4y2Bahttps://doi.org/10.2139/ssrn.2303780gydF4y2Ba

5.Cavin, r.k., Lugli, P.和Zhirnov, V. V.摩尔定律之外的科学和工程。在gydF4y2BaIEEE 100会议录,百年特刊gydF4y2Ba(2012年5月),1720-1749;gydF4y2Bahttps://doi.org/10.1109/JPROC.2012.2190155gydF4y2Ba

6.AMD主要芯片供应商将不再生产下一代芯片,2018年;gydF4y2Bahttps://www.engadget.com/2018/08/28/global-foundries-stops-7-nanometer-chip-production/gydF4y2Ba

7.芯片设计如何适应物联网发展。gydF4y2Ba网络世界gydF4y2Ba(2017);gydF4y2Bahttps://www.networkworld.com/article/3227786/internet-of-things/how-chip-design-is-evolving-in-response-to-iot-development.htmlgydF4y2Ba

8.gydF4y2Ba经济学家gydF4y2Ba.未来的计算-后摩尔定律(2016);gydF4y2Bahttps://www.economist.com/news/leaders/21694528-era-predictable-improvement-computer-hardware-ending-what-comes-next-futuregydF4y2Ba

9.gydF4y2Ba经济学家gydF4y2Ba.《半导体产业和全球化的力量》(2018年);gydF4y2Bahttps://www.economist.com/briefing/2018/12/01/the-semiconductor-industry-and-the-power-of-globalisationgydF4y2Ba.gydF4y2Ba

10.ENIAC报告。摩尔电气工程学院,1946年。gydF4y2Ba

11.新的gpu加速超级计算机改变了TOP500上的力量平衡,2018;gydF4y2Bahttps://www.top500.org/news/new-gpu-accelerated-supercomputers-change-the-balance-of-power-on-the-top500/gydF4y2Ba

12.Gartner集团。Gartner称2017年全球半导体收入增长了22.2%。三星取代第一的位置。Gartner。2018;gydF4y2Bahttps://www.gartner.com/newsroom/id/3842666gydF4y2Ba

13.谷歌云。谷歌:发行说明,2018;gydF4y2Bahttps://cloud.google.com/tpu/docs/release-notesgydF4y2Ba

14.百度的自定义AI和分析处理器的早期观察。下一个平台;gydF4y2Bahttps://www.nextplatform.com/2017/08/22/first-look-baidus-custom-ai-analytics-processor/gydF4y2Ba

15.亨尼斯和帕特森。gydF4y2Ba计算机体系结构:定量方法gydF4y2Ba(6gydF4y2BathgydF4y2Baed)。摩根·考夫曼出版社,剑桥,马萨诸塞州,2019年。gydF4y2Ba

16.半导体2.0国际技术路线图:执行报告。国际半导体技术路线图,79,2015;gydF4y2Bahttp://www.semiconductors.org/main/2015_international_technology_roadmap_for_semiconductors_itrs/gydF4y2Ba

17.台湾芯片制造商台积电将建立世界上第一个3纳米芯片工厂。gydF4y2BaTechnodegydF4y2Ba, 2018;gydF4y2Bahttps://technode.com/2018/12/20/taiwanese-chip-maker-tsmc-to-build-the-worlds-first-3nm-chip-factory/gydF4y2Ba

18.约翰逊,B.,团,S.,布雷迪,W.,吉姆,W.和吉姆,B.。gydF4y2BaGartner预测2017年:2026年半导体技术gydF4y2Ba.gydF4y2Ba

19.Jouppi, N.P.等。张量处理单元的数据中心内性能分析。在gydF4y2Ba44人会议记录gydF4y2BathgydF4y2Ba年度Int。计算机协会。第一版。ArchitgydF4y2Ba.1 - 12 (2017);gydF4y2Bahttps://doi.org/10.1145/3079856.3080246gydF4y2Ba

20.汗,h.n.,汉谢尔,D.A.和富克斯,E.R.H.摩尔定律结束时的科学和研究政策。gydF4y2BaNat.电子gydF4y2Ba, 1 (2018), 14-21;gydF4y2Bahttps://doi.org/10.1038/s41928-017-0005-9gydF4y2Ba

21.卡兹雷,M,张,L,维加,L,泰勒,M。太空漫步?ASIC云或加速器中的NRE优化将使用旧硅。在gydF4y2BaACM ASPLOS 2017论文集gydF4y2Ba硕士论文;gydF4y2Bahttps://doi.org/http://dx.doi.org/10.1145/3037697.3037749gydF4y2Ba

22.2016年,Intel公司在Sanford C Berstein战略决策会议上的演讲。gydF4y2Ba

23.2018年铸造挑战。半导体工程,2017;gydF4y2Bahttps://semiengineering.com/foundry-challenges-in-2018/gydF4y2Ba

24.雷瑟森,c.e.,汤普森,N,艾默,J.,库兹莫尔,b.c.,兰普森,b.w.,桑切斯,D.和沙德尔,T.B.顶端还有很大的空间:摩尔定律结束后,什么将驱动计算机性能的增长?gydF4y2Ba科学gydF4y2Ba(2020)。gydF4y2Ba

25.马丁,T.W.和菲茨杰拉德,D.你对旧智能手机的喜爱是苹果和三星的一个问题。《华尔街日报》(2018年);gydF4y2Bahttps://www.wsj.com/articles/your-love-of-your-old-smartphone-is-a-problem-for-apple-and-samsung-1519822801gydF4y2Ba

26.黄的定律就是新的摩尔定律,它解释了为什么英伟达想要arm。gydF4y2Ba《华尔街日报》gydF4y2Ba(2020);gydF4y2Bahttps://www.wsj.com/articles/huangs-law-is-the-new-moores-law-and-explains-why-nvidia-wants-arm-11600488001gydF4y2Ba

27.NVIDIA公司。特斯拉P100性能指南。高性能计算与深度学习应用,2017。gydF4y2Ba

28.在数字时代锻造智能系统。MTL研讨会,2017;gydF4y2Bahttps://www-mtl.mit.edu/mtlseminar/garypatton.html#simple3gydF4y2Ba

29.范,S. 2018。谁需要美国?阿里巴巴将生产自己的电脑芯片。CNN商业,2018;gydF4y2Bahttps://edition.cnn.com/2018/10/01/tech/alibaba-chip-company/index.htmlgydF4y2Ba

30.英特尔向通用量子计算迈出第一步。《下一个平台》,2017;gydF4y2Bahttps://www.nextplatform.com/2017/10/11/intel-takes-first-steps-universal-quantum-computing/gydF4y2Ba

31.普特南等人。加速大规模数据中心服务的可重构结构。gydF4y2BaCommun。ACM 59gydF4y2Ba, 11(2016年10月),114-122;gydF4y2Bahttps://doi.org/10.1145/2996868gydF4y2Ba

32.Santhanam, N, Wiseman, B, Campbell, H, Gold, a和Javetski, B.麦肯锡半导体,2015。gydF4y2Ba

33.超越摩尔定律的计算。gydF4y2Ba电脑48gydF4y2Ba, 12(2015年12月),14-23;gydF4y2Bahttps://doi.org/10.1109/MC.2015.374gydF4y2Ba

34.Shao, Y.S, Reagen, B., Wei, G.Y,和Brooks, D. Aladdin:一个前rtl,功率性能加速器模拟器,可用于定制架构的大型设计空间探索。在gydF4y2Ba国际会议的议事录。计算机协会。第一版。ArchitgydF4y2Ba.(2014), 97 - 108;DOI:gydF4y2Bahttps://doi.org/10.1109/ISCA.2014.6853196gydF4y2Ba

35.半导体行业协会:2017概况;gydF4y2Bahttp://go.semiconductors.org/2017-sia-factbook-0-0-0gydF4y2Ba

36.《英特尔战略概述》,2017;gydF4y2Bahttps://doi.org/10.1016/B978-0-240-52168-8.10001-XgydF4y2Ba

37.的外企。绿色500榜单(2019年6月);gydF4y2Bahttps://www.top500.org/green500/lists/2019/06/gydF4y2Ba

38.Worldometers。2018年全球电脑销量;gydF4y2Bahttp://www.worldometers.info/computers/gydF4y2Ba

回到顶部gydF4y2Ba

作者gydF4y2Ba

尼尔·c·汤普森gydF4y2Ba(gydF4y2Baneil_t@mit.edugydF4y2Ba)是美国马萨诸塞州剑桥市麻省理工学院计算机科学与人工智能实验室和数字经济计划的创新学者。gydF4y2Ba

Svenja SpanuthgydF4y2Ba(gydF4y2Basspanuth@ethz.chgydF4y2Ba)是瑞士苏黎世联邦理工学院管理、技术和经济系的博士研究生。gydF4y2Ba

回到顶部gydF4y2Ba

脚注gydF4y2Ba

a.他们的分析不包括农业部门。gydF4y2Ba

b.在本文中,术语“计算机”既指只有通用处理器的设备,也指包含专门功能的设备。gydF4y2Ba

c.计算为2008-2017年研发和个人防护装备支出的增加。gydF4y2Ba

d.当然,许多任务会有多个部分,有些是可并行的,有些则不是。在这种情况下,加速将受到阿姆达尔定律的限制。gydF4y2Ba

e.为了简单起见,我们将在本文中使用术语“专用处理器”,既指独立处理器,也指异构芯片(例如ip块)上的专用功能。gydF4y2Ba

f.对于16/14nm节点尺寸,这是正确的。光刻成本是目前NRE制造中最大的成本组成部分。gydF4y2Ba21gydF4y2Ba其他成本包括劳动力和设计工具,以及知识产权许可。gydF4y2Ba

虽然我们心中有一个基于计算能力/速度的性能衡量标准,但这个模型实际上更通用,可以参考其他特征(例如,能源效率)。gydF4y2Ba

h.更大规模的计算(包括当前深度学习模型的大量并行性)是同一问题的放大版本,我们分析的逻辑(以及我们的结果)也适用于它们。gydF4y2Ba

i.在这里,我们假设运行操作系统和控制专用处理器的CPU成本不会显著影响这个计算。放松这个假设并不会改变我们的模型,但需要将这些成本合并到专门的处理器参数估计中。gydF4y2Ba

j.在实践中,制造商不会持续更新,而是在发布新设计时进行大步骤更新。然而,用户可能会更持续地体验这种跳跃,因为他们倾向于不断刷新电脑的某些部分。连续形式在数学上也更容易处理。gydF4y2Ba

k.在在线附录(gydF4y2Bahttps://doi.org/10.1145/3430936gydF4y2Ba),我们还会考虑这些值如何随着代码开发成本的变化而变化。gydF4y2Ba

l. 230亿美元的代工收入(台积电和GlobalFoundries)可归因于前沿节点。gydF4y2Ba36gydF4y2Ba假设英特尔(540亿美元)和三星(400亿美元)总收入的大部分(90%)gydF4y2Ba12gydF4y2Ba源自前沿节点,收益率上限为1080亿美元/ 3430亿美元≈30%。gydF4y2Ba

m.我们隐式地假设这也是前沿节点的增长率。实际上,它可能会略低一些,这只会突出我们的观点。gydF4y2Ba

n.尽管他们的变化速度不那么有利,但英特尔的巨大市场份额意味着他们的起点较低,因此他们仍然具有很强的竞争力。gydF4y2Ba

o.根据英特尔财务报表计算,固定成本为研发+物业、工厂和设备,可变成本为销售商品成本。gydF4y2Ba

p.假定每两年需要新的设施;30%的市场销售额来自领先芯片;固定成本每年增长13%。2026年:0%市场增长/ 2032年:5%市场增长。我们(保守地)假设一个设施就能满足所有的市场需求。如果需要更多,日期就提前。gydF4y2Ba

q.谷歌已经在其云上提供tpu,gydF4y2Ba13gydF4y2Ba以及亚马逊网络服务(Amazon Web Services)等提供图形处理器。gydF4y2Ba1gydF4y2Ba

两位作者对这项工作作出了同样的贡献。gydF4y2Ba


版权归作者所有。gydF4y2Ba
向所有者/作者请求(重新)发布权限gydF4y2Ba

数字图书馆是由计算机协会出版的。版权所有©2021 ACM, Inc.gydF4y2Ba


没有找到条目gydF4y2Ba

登录gydF4y2Ba全面访问gydF4y2Ba
忘记密码?gydF4y2Ba »创建ACM Web帐号gydF4y2Ba
文章内容:gydF4y2Ba
Baidu
map