ACM

ACM通信

研究突出了

近期捕获离子量子计算机的系统架构设计

普拉卡什·穆拉利，德布罗伊，肯尼斯·r·布朗，玛格丽特·马托诺西
ACM通信，2022年3月，第65卷第3期，第101-109页
10.1145 / 3511064
评论

认为: 打印手机应用程序 ACM数字图书馆全文(PDF) 数码版分享: 通过电子邮件发送在reddit上分享在StumbleUpon上分享在黑客新闻上分享在推特上分享在Facebook上分享

捕获离子(TIs)是构建噪声中等尺度量子(NISQ)硬件的主要候选离子。TI量子比特与其他技术相比具有较高的量子比特质量、相干时间和量子比特连通性等基本优势。然而，目前的TI系统规模较小，通常使用单一的陷阱架构，这具有基本的可伸缩性限制。为了向50-100个量子比特TI器件的下一个重要里程碑迈进，一种称为量子电荷耦合器件(QCCD)的模块化架构被提出。在基于qccd的TI器件中，小阱通过离子穿梭连接。虽然这类设备的基本硬件组件已经演示过了，但是构建一个50-100量子位系统是具有挑战性的，因为陷阱大小、通信拓扑和门实现的设计可能性非常广泛，需要匹配不同的应用程序资源需求。

为了实现具有50-100个量子位的基于qccd的TI系统，我们进行了广泛的应用驱动体系结构研究，评估陷阱大小、通信拓扑和操作实现方法的关键设计选择。为了支持我们的研究，我们构建了一个设计工具流，它将QCCD体系结构的参数作为输入，以及一组应用程序和现实的硬件性能模型。我们的工具流将应用程序映射到目标设备上，并模拟它们的执行，以计算诸如应用程序运行时、可靠性和设备噪声率等指标。通过六个应用程序和几个硬件设计点，我们展示了陷阱大小和通信拓扑选择对应用程序可靠性的影响可以达到三个数量级。微架构门实现的选择对可靠性的影响是另一个数量级的。从这些研究中，我们提供了优化这些选择的具体建议，以实现高可靠性和高性能的应用程序执行。随着工业界和学术界正在努力构建具有50-100量子位的TI设备，我们的见解有可能在不久的将来影响QC硬件，并加速迈向实际QC系统的进展。

回到顶部

1.简介

捕获离子(TIs)是一种主要的候选离子量子比特(量子比特的简称)。图1展示了一个例子系统，其中离子被隔离和捕获使用电磁保持。为了实现计算，使用离子的内部原子状态表示量子位的0和1基态，并使用激光控制脉冲实现盖茨(指令)。像IonQ和霍尼韦尔这样的行业供应商，以及全球近百家学术团体，正致力于使用这种技术构建量子计算(QC)系统。迄今为止，最大的TI系统有多达32个量子位(IonQ)，并已被用于展示有前途的近期QC应用，最近，一个里程碑式的量子纠错演示。⁵

图1。桑迪亚国家实验室设计和制造的HOA-2捕集器的扫描电子显微图。图由莫恩兹授权改编。¹⁵一个陷阱容纳了所有的离子。控制电极用于加载、移除和移动离子。由于长离子链中栅极实现的挑战，这种体系结构不能扩展到50-100个量子位以上。

为了证明量子优于经典计算，需要具有50-100个量子位的QC系统。然而，目前大多数TI设备都有一个基本的架构扩展瓶颈:它们基于一个所有离子都包含在同一捕获区中的架构。在这种单阱结构中，随着更多的离子加入阱中，离子间距和离子-离子相互作用强度减小。因此，随着量子位数量的增加，量子位控制和门实现变得越来越不可靠和耗时。

为了克服这一瓶颈，一种称为量子电荷耦合器件(QCCD)的模块化架构在近20年前被提出。¹¹图2 b给出了一个例子。QCCD系统避开了长离子链，而是采用了多个陷阱，每个陷阱都包含一个更小的离子链。与单阱结构类似，闸可以在同一个阱内的一个或多个离子上执行。为了使栅极跨越陷阱，QCCD使用离子穿梭。也就是说，在涉及来自不同陷阱的离子的栅极之前，其中一个离子从一个陷阱移动到另一个陷阱。图2 c而且二维展示一个穿梭操作示例。虽然理论上还有其他一些扩展方案，但QCCD系统所需的所有基本组件都在过去十年中得到了开发和改进，并且有几个小组正在研究原型系统。^7，10，20.最近，霍尼韦尔演示了第一代10量子比特QCCD系统，该系统能够运行算法。^20.

图2。(a)具有单阱的5量子位TI系统。每个黑圆代表一个量子比特。双量子位门是通过激光脉冲所需要的量子位对来实现的，允许单个陷阱支持量子位之间的完全连接。(b)具有4个阱的模块化量子电荷耦合器件(QCCD)。每个阱初始有3个离子，最大容量为4个离子。这些陷阱通过穿梭路径相互连接，将离子从一个陷阱转移到另一个陷阱。橙色的方格代表穿梭路径的交汇处。(c)示例程序中间表示(IR)。为了清晰起见，我们只展示两个量子位的门。 Real program IR also includes single-qubit gates and qubit measurement operations. To execute the IR on the device in (a), each ion in the device can be used to represent one qubit from the IR, and gates can be executed using the laser controller. (d) To execute the IR on the device in (b),p₀，p₁,p₂映射到一个陷阱上，然后呢p_3.而且p₄映射到另一个。前两个门在左上角的陷阱中执行。因为那扇门p₂而且p_3.，量子位需要在同一个陷阱中共同定位，所以p₂被送到陷阱里了吗p_3.门是在左下角的陷阱中完成的。

为了将QCCD系统扩展到50-100个量子位的下一个重要里程碑，硬件设计师必须在每个阱离子量子位的数量、通信拓扑、门和穿梭实现方法等各种冲突的设计选择中导航。虽然已经进行了一些实验来理解一些设计选择，但是目前的硬件在很大程度上是仅从物理考虑来设计的，而没有考虑到软件堆栈的其他功能、体系结构或应用程序特性。我们的工作是系统地探索这些设计选项的第一次努力，使用经典计算机架构中经过验证的设计方法。为了配合应用需求共同设计下一代中型TI系统，我们开发了如图所示的设计工具流程图3．使用这个工具流，我们执行广泛的应用程序驱动的设计分析，并为未来的硬件设计提出建议。

图3。我们评估一个基于qccd的候选TI系统的框架。将一个候选架构、一组NISQ应用程序和实际的性能模型作为输入，工具流计算应用程序度量(如运行时和可靠性(保真度))和设备度量(如加热速率)。

我们的贡献包括:

首先，虽然最近的工作集中在超导质量控制系统的体系结构上，^6，8，14尽管TI系统技术非常有前途，但人们对它的关注却很少。我们的工作执行了针对50-100量子位系统的第一个体系结构研究，这是TI系统的下一个主要里程碑。我们的模拟强调了优化架构的重要性;在整个硬件设计领域中，应用程序可靠性的变化可以达到五个数量级，这取决于陷阱容量、连接性和门实现的选择。

其次，我们的工作为设备设计者在构建更大系统时提供了具体的指导。我们发现，在应用程序和设备拓扑结构中，每个陷阱的容量为15-25个量子位是理想的。这个容量范围将离子加热、激光束不稳定和整个设备的运动能量热点的影响最小化，同时仍然提供非常好的应用性能。此外，为了实现高可靠性，还需要根据应用的需求进行设备拓扑的协同设计。对于近期的应用，如QAOA，线性设备拓扑工作良好，并简化硬件实现。

第三，我们的工作为最佳微架构选择提供了见解。我们评估了四种纠缠门实现和两种链重排序方法，并表明最可靠的实现根据应用程序的特点而不同。也就是说，微架构必须根据应用程序的需求进行可重构。

回到顶部

2.量子计算背景

2.1.量子计算原理

量子位。质量控制体系的组成部分是量子位(量子比特)。量子位有两个基态，|0ñ和|1ñ。利用叠加，一个量子比特可以是基态的复杂线性组合，用一个|0ñ+|1ñ，对于α， β∈ℂ。这允许n-量子比特系统潜在地表示所有2ⁿ基态同时发生，不像经典的n-bit寄存器，它可以恰好位于2ⁿ州。

盖茨。为了操纵信息，QC系统使用盖茨修改量子位振幅。盖茨一次作用于一个或多个量子位元。与经典计算中的通用门类似，QC系统通常支持一组通用单量子位门和双量子位门。QC应用程序使用这些门集表示。要运行一个程序，在一组适当初始化的量子位上执行一系列门。栅极变换量子位振幅，使状态空间朝着期望的输出方向演化。为了在算法结束时获得经典输出，测量一个量子比特，将其状态折叠为|0ñ或|1ñ。

2.2.俘获离子QC系统概述

量子比特寄存器(离子链)。在TI量子计算机中，信息存储在离子的内部状态中，这些离子被困在振荡电位中。捕集器两端的直流电极沿捕集器轴线提供屏障，射频振荡电场在另外两个方向上波动，使离子排列成间距均匀的线性链。

量子位。为了存储QC所需的|0ñ和|1ñ状态，有各种各样的离子内部状态，如超细态和塞曼态，可以选择它们各自具有不同的优缺点。在我们的工作中使用的性能模型假设量子位定义在超精细状态，这是当前设备的标准选择。然而，我们工作的见解也适用于其他量子位态。

门的实现使用激光。栅极是用激光激发离子来实现的。单量子比特门使用单一激光与所需离子相互作用，而双量子比特门使用多个激光，以激发离子的内部状态和链的振动运动。双量子比特门使用这些联合振荡运动，也称为运动模式，作为总线，允许远距离离子内部状态之间的通信。²¹典型的双量子比特门是Mølmer-Sørensen门(MS)，这是一种在ising型哈密顿量下时间演化的纠缠门;它对离子的运动状态不敏感。这种运动状态会导致离子的激光寻址问题，并在我们的错误模型中捕捉到。

忠诚。在真实的质量控制系统中，错误的发生是由于不完善的量子位控制、脉冲实现中的错误和外部干扰。门的忠诚指使用随机基准测试等方法测量的栅极质量。

回到顶部

3.基于qccd的TI系统的背景

3.1.单一陷阱架构的挑战

为了激励基于qccd的系统设计，我们考虑了将单个陷阱系统扩展到50-100个量子位的挑战。首先，在单个陷阱中，离子间的间距由陷阱场和离子间库仑斥力之间的平衡决定。当离子数增加时，离子间间距减小，使得使用激光控制器难以选择性地脉冲一个量子位。其次，双量子比特门的实现也具有挑战性。在阱内，一对离子在距离上的离子-离子耦合强度d比例为1/d^αα从1到3。¹²这增加了在任意一对量子位上执行纠缠门所需的时间。此外，利用离子链的集体运动模式(振动模式)来调节两个量子比特的相互作用。模式密度随着离子数的增加而增加，使模式之间的串扰机会恶化，降低栅极保真度。综上所述，这些挑战使得单阱TI器件难以扩展到数十个量子位以上。

3.2.QCCD体系结构的组件

QCCD器件利用模块化设计克服了单阱系统的挑战，该系统拥有一组小离子链，每个离子链位于单个阱中。在图2 b，该体系有12个离子，被分离到4个大小为3的阱中。通过限制容量，该设计在每个陷阱中实现了快速和高保真的双量子比特操作。为了使双量子比特门跨陷阱，QCCD使用离子穿梭，在纠缠操作之前将离子从一个陷阱物理移动到另一个陷阱。

图2 d说明了穿梭的三个步骤。首先，需要的离子是分裂从源链。为了移动这个离子，穿梭路径被实现为一组由结连接的段。在图2 b，系统有5段(蓝色)，用2个结点(橙色)连接。分裂的离子从阱中通过节段和结移动到所需的阱中。这些移动操作还包括在路口所需的任何转弯。最后，梭子离子合并后的进入目标链。在实验上，这些操作是通过附在阱段上的控制电极上的时变波形来实现的。^3.

回到顶部

4.基于qccd的TI系统的设计权衡

4.1.Trap容量选择

QCCD体系结构中的单个陷阱与单个陷阱TI系统相同;因此，如果单链中的离子数量过高，它们将面临同样的量子位寻址和栅极实现挑战。因此，trap容量低有利于应用，因为它可以在trap中实现快速和可靠的双量子位门。然而，低容量是有害的，因为它牺牲了量子比特连通性，这是TI系统相对于其他技术的一个关键优势。满足一个算法的两个量子比特门的要求和低陷阱容量需要更多的穿梭，包括更多的分裂，移动和合并。这些操作增加了执行时间，降低了可靠性。此外，穿梭操作通过捕获势引入量子比特运动，并引起离子链振动模式的加热。这影响了使用激光的量子位可寻址性，并降低了门的保真度。

我们的工作研究:陷阱大小如何影响基于qccd的50-100量子位TI系统?什么样的大小适合NISQ应用程序?应用程序特征(如双量子位门模式)在多大程度上影响大小?

4.2.通信拓扑选择

QCCD系统有不同的拓扑选项来编排穿梭操作。要理解这种权衡，请考虑中所示的线性拓扑图4．这种拓扑是最容易构建的，并且对所需段的数量施加了最小的要求。由于没有结点，移动操作简化了。但是，线性拓扑限制了远距离通信的路径。为了将一个离子移动到一个不相邻的阱中，需要在中间阱中进行几次分裂和合并操作。与移动相比，拆分和合并更加困难，可能会对应用程序产生潜在影响。此外，分裂和合并操作要求离子被定位在链的正确末端。在我们的例子中，黄色离子在第二个阱中合并后，需要使用a将其重新定位到第二个阱的右端链重新排序操作。这些操作还会影响应用程序指标。相比之下，网格拓扑，如图2 b，以牺牲更多硬件为代价提供更好的通信路径。在这种特殊的2 × 2拓扑中，穿梭不会遇到中间陷阱，因此避免了线性拓扑中额外的分裂、合并操作。然而，网格需要3路和4路结点转弯，这与通过直线段的简单移动操作相比是不平凡的。

图4。在具有线性设备拓扑结构的qccd系统中穿梭。当离子通过中间陷阱移动时，需要额外的分裂和合并操作。

我们问:QCCD设备拓扑在多大程度上影响应用程序的可靠性和性能?在线性拓扑中额外的拆分和合并操作的开销是禁止的吗?什么样的通信拓扑能最好地支持具有50-100个量子位的NISQ应用程序?

4.3.闸门和梭式装置的选择

陷阱中的两个量子比特门。要实现双量子位栅极，可以以不同的方式利用离子链的共享运动。两种主要的门方法是基于振幅调制(AM)^4，22，25和调频(FM)^12，13激光控制脉冲。我们还考虑了一个基于相位调制(PM)的最新提议。¹⁶

为了理解栅极选择的影响，考虑一个陷阱n离子，假设我们希望在两个离子之间执行一个门，这两个离子被d陷阱内的位置。在图2一个，n= 5和d= 3。对于AM和PM闸，闸时线性增加d，即假设激光强度恒定，附近离子对之间的栅极比远处离子对之间的栅极快。这是远距离量子位对之间相互作用强度较弱的直接结果。另一方面，对于调频门，持续时间是独立的d，但它随。线性增加n即，对于阱内的任何量子位对，栅极时间是恒定的，但随着栅极时间随着链的增加而变长。这些权衡不仅仅体现在门的持续时间上。栅极可靠性随着栅极时间的增加而线性恶化，在AM、PM和FM方法中有所不同。栅极可靠性还取决于加热速率，加热速率是阱容量和通信拓扑的函数。最重要的是，由于QC应用程序具有不同的门模式，这些权衡在不同的应用程序中可能会有不同的表现。值得注意的是，这些趋势都没有构成根本的限制。虽然有方法可以消除门时间的距离依赖性和具有不同缩放行为的实现，但我们考虑最常用的脉冲调制技术，并基于该领域广泛接受的实验观察进行研究。

陷阱内的链重排序。另一个重要的微架构选择是链重构方法。在分裂操作之前，这些操作将离子定位在链的正确末端图4)．进行重配置的两种标准方法，基于门的交换和物理离子交换，显示在图5．在基于门的交换(GS)中，SWAP门(使用3个MS门和一些单量子比特门实现)用于交换所需离子的量子态。因此，双量子比特门的实现方法直接影响GS的性能和可靠性。第二种方法，离子交换(IS)，物理交换相邻的离子，最近被证实。⁹每一次1跳的IS交换都需要分裂操作来隔离两个交换离子，然后两个离子的物理旋转180度(如图所示)图5)，然后是一个合并来重建链(拆分和合并没有显示)。与通信类似，IS操作的拆分和合并操作有性能和可靠性开销。

图5。选择链式重新排序。GS使用SWAP门(由3个MS双量子比特门实现)来交换陷阱中任意一对离子的量子态。IS需要逐跳物理交换。

我们问，在近期QCCD器件中实现双量子位MS门和链重排序的最佳方法是什么?应用程序之间最可靠的实现是否不同?如何使用应用程序特征来告知微架构的选择?

回到顶部

5.我们的设计工具流程

为了评估这些设计问题，我们构建了如图所示的工具流图3．我们的框架以一个基于qccd的TI系统设计配置为输入，包括陷阱大小、连通性、双量子比特门实现和链重排序方法。它使用一组NISQ应用程序基准测试来评估候选体系结构。为了进行准确的评估，我们的工具流程对QCCD体系结构的各个组件使用了真实的性能模型，包括在实验工作中报告的真实系统测量和已知的物理模型。我们的模拟器使用这些模型来计算应用程序级指标，如执行时间、可靠性和操作计数，以及设备级指标，如陷阱加热速率。

5.1.基于qccd的TI系统编译器

为了评估一系列体系结构，我们需要针对每个目标体系结构进行优化的应用程序执行，理想情况下是通过自动化编译器工具流。当前的QC编译器，如IBM Qiskit或Rigetti Quilc，不支持基于QCCD的TI系统，因此我们构建了一个后端编译器，用于映射和优化QCCD系统的应用程序。编译器的输入是一个应用程序中间表示(IR)，由门序列组成，门之间具有数据(量子位)依赖性。这样的IR可以从普通QC编译器的语言前端获得。使用IR，我们的编译器首先使用启发式技术将程序量子位映射到不同的硬件量子位上，目的是减少通信。接下来，我们通过硬件中的最短路径路由穿梭操作，并自动插入必要的链重排序操作。由于允许在QCCD设备上并行执行多个穿梭器，我们实现了一些策略，以避免在连接处阻塞，并在路由并行穿梭器时避免死锁。编译器的输出是一个带有基本QCCD指令的可执行文件。关于编译器和优化通道的更多细节可以在全文中找到。¹⁸

5.2.模拟器使用现实的性能模型

接下来，我们构建了一个模拟器来在候选体系结构上运行应用程序。模拟器的输入是已编译的可执行文件、目标QCCD设备架构和QCCD硬件的物理性能模型。模拟器的目标是估计应用程序运行时、可靠性和设备级指标(如陷阱加热速率)。

为了测量应用程序的运行时间，我们的模拟器考虑了已知的门性能模型、穿梭时间模型和QCCD系统中的并行约束。栅极和穿梭性能模型来源于真实的器件特性研究，并允许我们准确地模拟QCCD体系结构中所有基本操作的性能。在TI系统中，单个陷阱中的门通常是串行执行的。^19，24但是，独立的离子梭可以相互平行运行，也可以与其他阱中的栅极平行运行。考虑到这些约束，模拟器遍历编译后可执行文件中的指令，并安排它们在设备上的执行。根据可执行文件指定的初始量子位布局，模拟从每个量子位布局开始。对于穿梭操作，模拟器将离子从一个陷阱移动到另一个可执行文件指定的陷阱。对于每条指令，模拟器跟踪开始和结束时间，允许它在程序结束时估计总的应用程序运行时。

为了测量应用程序的可靠性，理想情况下我们需要一个量子噪声模拟器。虽然已经开发了这样的噪声模拟器，但它们的计算需求随着量子位数呈指数级增长，超过50-60个量子位就难以处理了。此外，电流模拟器是针对超导量子位的，不包括QCCD系统模型。因此，我们为QCCD系统建立了一个自定义模拟器。我们的模拟器使用已知的物理模型和来自实际系统实验的估计，从操作和背景噪声源模拟栅极保真度和陷阱加热速率。

模拟开始时，每个链都处于零运动模式能量状态。当执行穿梭操作时，离子链的运动能量增加(离子振动更多，因为系统添加了能量来移动它们)。模拟器使用物理模型的估算来跟踪这些能量变化。对于每个栅极，模拟器使用模型计算保真度，其中包括链温度和背景加热的误差。为了测量应用程序的可靠性(保真度)，模拟器计算程序中每个操作的保真度的乘积。该模型非常接近实际执行情况，并已在目前的TI和超导系统上进行了实验验证。

回到顶部

6.实验装置

6.1.应用程序

表1列出我们研究中使用的六个应用程序。这包括近期的应用，如量子近似优化算法(QAOA)，经典的应用，如格罗弗搜索(SquareRoot)，以及重要的内核，如量子傅里叶变换(QFT)。谷歌最近的霸权演示使用了在真正的超导硬件上具有53个量子位和430个双量子位门的电路。¹使用这个作为50-100个量子位NISQ系统的基线能力，我们选择了60-80个量子位和500-4000个双量子位门的应用实例。关于应用程序实例的更多细节可以在完整版本中找到。¹⁸

表1。在我们的研究中使用的应用。

6.2.设备配置

QCCD系统设计在50-200量子位的范围内运行。除此之外，光学互连和其他缩放技术还需要构建具有数千个量子位的非常大的系统。¹⁷我们评估了50-200量子位的体系结构，并考虑了每个阱15-35个离子范围内的单个阱容量。为了探索通信拓扑，我们使用两个设备拓扑:L6，一个类似于图46个陷阱以线性方式连接(这是霍尼韦尔QCCD系统的拓扑结构^20.)和G2X3，一种类似于图2 b6个陷阱排列在两行三列。¹¹为了测试门的实现，我们考虑了MS门的4种变体:AM1，²⁵AM2,²²点,¹⁶和调频。¹³我们还测试了两种变体的链重排序:GS和IS。

所有编译和模拟都使用Python 3.7在Intel Sky-lake处理器(2.6GHz, 12GB RAM)上运行。

回到顶部

7.建筑设计探索

7.1.Trap容量选择

图6显示了trap大小调整对应用程序和设备级指标的影响。图6显示六个应用程序的执行时间(性能)(越低越好)。对于SquareRoot、Supremacy和BV，随着容量的增加，性能相对稳定。这是因为计算和通信的相对数量以及这些组件的不同伸缩趋势。trap容量越大，通信量越小。然而，栅极时间增加了，因为在大型阱中进行纠缠栅极需要更长的时间。因此，总体时间保持相对恒定，与陷阱大小无关。图6 b分析了QFT的计算性能和通信性能。在这种情况下，计算时间是主要因素，总时间随着陷阱的大小而增加。因此，虽然普遍认为穿梭时间将是QCCD系统的主要性能瓶颈，但我们的工作表明，计算和通信性能取决于应用程序特征和设备架构。

图6。陷阱尺寸选择:实验采用L6器件，FM双量子位栅极和GS链重排序。容量表示单个陷阱中离子的最大数量。(a)应用程序运行时(越低越好)。运行时间取决于trap容量，但也受应用程序特性的影响。(b) QFT的计算和通信时间趋势。trap容量越大，通信时间越短，而在大的trap中，栅极时间越长，计算时间越长。(c-e)应用保真度(门保真度的乘积，越高越好)。根据单个陷阱容量的不同，应用的保真度差别很大。每个阱15-25个离子适用于各种应用，超过35个离子时保真度下降严重。 (f) Maximum motional mode energy across the device (unwanted vibrational energy in ion chains, lower is better). Motional mode energy decreases at higher capacity because of reduced communication. (g) Contribution of background heating and motional mode energy to two-qubit gate error rate (error rate is 1—gate fidelity, lower is better). Motional mode energy is the major contributor to heating error. The trend is explained in Section 7.1.

图6 c-6e显示六个应用程序的保真度(越高越好)。对于BV、Adder和QAOA，即使在非常低的陷阱容量下，保真度也很高，因为它们对通信的要求很低。对于Supremacy, SquareRoot和QFT，保真度在较小的trap容量(<15个离子)时较低，此后达到最大值，当trap容量为30或更多时显著下降。对于Supremacy，最好的保真度是最差保真度的15倍，这表明了优化陷阱大小的重要性。要分析趋势，图6 f显示了设备中所有陷阱的最大运动模式(运动模式量化了离子链中累积的多余能量，越高越差)。由于需要更多的通信操作，在小容量下的运动能量很高。每一次穿梭操作都会给i增加能量