acm-header
登录

ACM通信

ACM新闻

持久、密集和高效:DNA数据存储的承诺


DNA。

DNA是数据存储的未来吗?

资料来源:CC0公共领域

Yaniv Erlich设计他是纽约基因组中心的核心成员,也是哥伦比亚大学计算机科学和计算生物学的副教授。他在自己的网络摄像头前抱着一个3D打印的小兔子。他说,这个玩具实际上是一个存储设备。“兔子体内的塑料纤维含有二氧化硅珠,”他说,“在这些二氧化硅珠内部,DNA编码了一个文件,该文件指示如何打印出这个兔子的精确复制品。”

和真兔子一样,3d打印的玩具,与化学工程师Robert Grass在ETH Zürich共同开发它的DNA中有自己的蓝图。埃利希解释说:“你可以切掉兔子的任何一部分,每一部分都有DNA,你可以放大它,打印出一个新的兔子。我们认为可以复制到10个左右21或者世界上所有人都有足够的兔子,直到人类灭亡。”

这个项目与其说是关于玩具制造,不如说是关于DNA数据存储的变革潜力。

DNA拥有罕见的持久性、低能耗和惊人的密度。计算机科学家说:“我们估计一个DNA系统每立方英寸可以存储1艾字节。卡琳·施特劳斯他是微软的主要研究经理。她说,通过使用DNA数据存储系统,“今天需要整个数据中心存储的东西,只需要你的手掌大小。”

在基本层面上,DNA存储包括取DNA中的四种基本分子——腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤或a、T、C和g,并将它们映射到比特序列中,因此“a”可能对应00,“T”对应01。科学家获取一个比特序列,合成并储存代表这些比特的DNA。

施特劳斯,计算机科学家Luis Ceze和他们的跨学科团队最近开发了一个完全自动化的端到端系统。以前的系统需要化学家和其他科学家的帮助,但新的原型自动编码比特,制造DNA,存储DNA,检索和读取它,然后返回数据。

在第一次迭代中,他们存储了“hello”这个词。“这绝不是一个高性能的系统,”施特劳斯说。“这是第一次证明DNA数据存储的自动化确实是可能的,端到端。但成熟度会提高。最终,我们可以看到DNA存储设备看起来像架子,但有流体元件,在数据中心内。”

施特劳斯和塞泽最近被提名分享2020年莫里斯·威尔克斯奖他们在基于dna的数字数据存储方面的工作。

最近的另一项突破专注于有效读取和检索dna存储数据。计算机工程师James M. Tuck,化学工程师Albert Keung和他们在北卡罗莱纳州立大学的同事发表这篇论文详细介绍了他们的新方法,他们称之为动态操作和可重用信息存储,简称DORIS。该技术采用了一种他们称之为“立足点系统”的方法,将单链DNA片段连接到存储数据的双链片段上。单链或支撑点有效地携带文件名或识别信息,这使他们能够有效地搜索特定的DNA数据。一旦它们检索到一个文件,它们就会对DNA及其存储的数据进行RNA复制,然后将原始DNA完好无损地返回到存储介质中。

以前的系统依赖于更复杂的化学或分子操作,从长远来看,这些操作可能会降低存储的数据。

塔克说,这个系统拥有巨大的潜力,可以成为一个非常密集、有弹性的存储系统。他说:“在一个相对较小的空间里,我们可以存储大量的信息,用不同的地址标记它,并在对现有库的破坏最小的情况下取出我们想要的信息。”

至于应用,根据施特劳斯的说法,DNA的存储密度和持久性使其成为档案存储的理想选择,他怀疑第一次迭代可能出现在数据中心的受控环境中。

Erlich还考虑了其他的应用程序。未来,汽车零部件可能会嵌入DNA,该DNA保存着如何制造该部件的数据,以防该部件过时。人工膝盖或人工髋关节可能包含患者的相关医疗信息,因此医生在未来操作假肢时可以很容易地恢复重要的健康信息。

塔克补充说,如果不找到一种方法来计算dna存储的数据,那将是一种浪费。施特劳斯和塞泽在这一领域取得了进展。与此同时,Keung希望研究人员不要选择一个特定的系统,而是继续探索创造性的方法。

“我们现在正处于构建计算机的拐点上,摩尔定律的终结在即,在量子计算和分子计算方面也有不同的努力,”Ceze说。“越来越明显的是,这些方法都擅长不同的事情,我们需要开发这种新技术组合,以确保我们可以继续制造更好的计算机。”

格里高利局部激素是一位生活在波士顿的科学作家,作者是比尔奈的,《杰克和天才:在世界的尽头》


没有发现记录

登录为完全访问
»忘记密码? »创建ACM Web帐号
Baidu
map