DNA存储,拯救人类数据危机的良方?

作者&投稿:别凭 (若有异议请与网页底部的电邮联系)
~ 开一个脑洞:如果地球正在面临一场马上到来的毁灭性星际灾害,人类又想尽可能地保存地球的生命和文明,在现有条件下,该怎么办?

像大刘一样让地球停止自转然后逃离太阳系,这恐怕来不及了。而如果像诺亚方舟一样,一股脑把人类、动植物和人类的知识搬运到飞船上,现有的火箭运载能力,恐怕也装不下这些物质的亿万分之一。

如果想尽可能多、尽可能长久地保存地球的生物,我们只需要把所有物种的DNA序列信息收集打包,在飞船的低温环境下便可以保存长达数十万年;而人类文明的信息呢?我们知道这些信息最高效的形式就是数据,而这些数据主要存储在硬盘和光盘当中的。

想想这些硬盘储存器的重量和数据密度,我们不得不再一次气馁。更何况,可能飞船还没逃出太阳系,这些数据就会因为硬盘或光盘的寿终正寝而丢失。

那么DNA能不能当做硬盘来存储数据信息呢?答案是,可以的。

DNA绝对是这个星球上最古老的生命信息存储工具,同样也可以作为数据信息的存储介质,且存储密度和使用寿命要远远超出现有的磁盘式的存储方案。因此,DNA存储,正在被人类视为数据存储的未来,成为拯救人类数据存储危机的最好的替代方案。

DNA存储具体是怎么做到的呢?现在发展到那一阶段?商用的话还有哪些阻碍?这需要我们一一解答。

在了解DNA存储是如何工作的之前,我们简单了解下磁存储和光存储这两种现有的解决方案的原理。

磁存储的原理就是在金属材料上涂上磁性介质,在通电的情况下形成电磁效应,可以进行存储和表达0101的二进制信息。磁存储的硬盘的优点是录入和读取的速度快,缺点是与体积重量相比,数据密度较低。经过60年发展,大概可以在3.5英寸大小的硬盘驱动上存储3TB数据。

光存储的原理是将数字编码的视频和音频储刻录在光盘表面的凹槽中,再通过激光将这些凹槽中的数据读取出来,进行转存或播放。当前,光存储也正在经历存储的极限。因为想要存下更多的数据,凹槽就必须越小、越紧凑,要求激光的精度也越高。目前,单层蓝光光盘能够保存 25GB 以上的信息,另一种紫外线激光如果研制成功,其光盘容量可以达到500GB的容量。

相对于磁存储和光存储而言,DNA存储有哪些优势?

首先,就是节约空间。但这些单层平铺式的存储方式,比起DNA的双螺旋立体结构来说,其存储量就有了多个数量级的差距。DAN本身的物理体积极小且又是立体结构,单位空间的数据密度非常高。举个简单的例子,1克DNA不到指尖上一滴露珠大小,却能够储存700TB的数据,相当于1.4万张50GB容量的蓝光光盘,或233个3TB的硬盘(差不多151KG重)。

再则,非常节能。现有存储方式,比如说一个数据中心,要消耗大量的单晶硅,还要消耗大量的电。而DNA物质只需保存在阴凉、干燥的地方就可以,基本不需要额外的人工维护。就算需要把DNA冷冻起来,消耗的资源和能源也几乎可以忽略不计。

此外,最重要的一点就是,保存时间非常久。现在高密度的存储器都会随着时间推移而衰减,能存储时间最长的工具是磁带,其寿命也就50年,其他的存储器寿命更短。比较而言,DNA则保质期就以百年计算了,如果将其冷冻起来,能保存几千甚至上万年。

看来人类文明的拯救方案有了,但DNA存储到底是如何做到的呢?

众所周知,DNA由四种含氮碱基——A、T、C和G互补配对构成,科学家将腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)分别赋予二进制值(A和C=0 ,G和T=1),随后通过微流体芯片对基因序列进行合成,从而使该序列的位置与相关数据集相匹配。这样就把这些碱基对编码成1和0的组合,就可以用DNA的序列信息来表达二进制的语言了。

当每次将二进制语言写进DNA序列当中,就可以把“DNA硬盘”放到低温环境中进行保存。而需要读取数据的时候,只用对目标DNA进行测序,将碱基对还原成二进制编码,再完成解码,就可以还原为我们常见的数据了。

原理是非常简单,但科学家是如何做到的呢?这就要简单回顾下DNA存储技术的发展史了。

最先想到这一方法的是一位艺术家Joe Davis,他在1988年与哈佛研究人员合作,把一个取名为Microvenus(小维纳斯)的7*5像素矩阵的照片,转化成35个碱基的DNA序列,插入到大肠杆菌里,第一次把不属于自然演化的信息写进了在DNA当中。

(Microvenus代表女性和地球)

2010年,美国合成生物学家克雷格•文特尔((Craig Venter)带领研究团队化学合成了整个支原体基因组DNA,取名为“辛西娅(Synthia)”,并以“自娱自乐”的方式将课题研究者的名字、研究所网址和爱尔兰诗人詹姆斯的诗句等信息编码进新合成的DNA中。

2011年,哈佛大学的合成生物学家乔治·丘奇(George Church)和加州大学的瑟里·库苏里(Sriram Kosuri)领导的团队以及约翰•霍普金斯大学的基因组专家高原(Yuan Gao)首次进行了概念证明性实验。团队使用短DNA片段编码了一本丘奇的659KB数据的书。

2013年,欧洲生物信息研究所(EBI)的尼克•高德曼(Nick Goldman)和他的研究团队也成功地将包括莎士比亚十四行诗和马丁•路德•金“我有一个梦想”的演讲片段、一篇沃森和克里克DNA双螺旋论文副本等5个文件编写进了DNA片段里当中。739KB数据成为当时最大的DNA存储文件。

2016年,微软和华盛顿大学又利用DNA存储技术完成了约200MB数据的存储,成为DNA信息存储技术的一个飞跃。

2017年7月,《自然》杂志发表了哈佛大学医学院的赛斯•希普曼(Seth Shipman)和乔治·丘奇合作的一项活体DNA存储的研究。他们把一部130年前的黑白电影《奔跑中的马》存在了大肠杆菌的DNA上。虽然大肠杆菌体内有一段“奇怪的DNA”,不仅能够正常生存,还可以正常遗传,每次繁衍都是一次数据复制。而且存储在基因组中的电影,在每一代大肠杆菌中也都完整无缺地保存下来了。

但因为细胞的复制、分裂以及死亡,会造成信息出错的风险,未来数据安全,大多数情况下存储信息的DNA都是以DNA干粉的形式存在,活体细胞存储的研究转向合成DNA存储。

同一年,哥伦比亚大学和纽约基因组中心在《科学》杂志发表了一项称为“DNA喷泉”算法高效的DNA存储策略。这项技术展示了最大化利用DNA的存储潜力,成功将海量信息压缩至DNA的四个碱基,即为每个DNA编码1.6比特(bits)的数据,比之前多存储了60%的信息,逼近理论极限(1.8比特)。该方法能够将215PB数据存储在一克DNA中,相当于2.2亿部电影。

2018年,爱尔兰沃特福德理工学院(WIT)研究人员开发出一种新型DNA存储方法,可在1克大肠杆菌DNA中存储1ZB的数据。

2019年,丘奇团队又在《科学》期刊上发表了一项实验结果。他们将丘奇的一本大约5.34万个单词《再生:合成生物学将如何改变未来的自然和自己》的书,以及11张图片和一段Java程序,编码进不到亿万分之一克的DNA微芯片,再成功利用 DNA 测序来阅读这本书。

这些科研的快速发展也意味着DNA合成技术(数据写入)和DNA测序技术(数据读取)正走向成熟。但同时,DNA编码过程仍然存在着存储/读取速度和成本等问题,DNA存储离商业化还在路上。

在实验室里,看起来DNA存储并不复杂,但是在商业化上面,仍然还面临着一些问题。

首先,存储和读取的速度都很慢。DNA存储设备的访问速度很慢,存取也很费时间。相比较磁盘存储的电磁信号,DNA合成却要依赖于一系列化学反应。用磁盘写入200MB数据,不用1秒,用DNA合成差不多得需要3周的时间。

其次,DNA介质不能覆盖和重写。在DNA里,一旦把信息存进去,一般来说不能修改。想读取这个文档,需要把全部信息完全测序出来再转码。

第三,数据存储的准确性有待提高。目前DNA测序时的重复读取导致读错概率较大。

第四,随机读写困难。目前DNA合成技术无法一次性产生较长的DNA分子,只能合成众多的短片段。这使得在众多DNA小片段组成的混合物当中,快速调取特定数据存在困难。

最后,也是最重要的,DNA存储成本太高了。比如目前DNA存储200MB数据,需要耗资80万美元,而用电子设备,成本连1美元都不到。

但正如上面所说,如果放到更长的时间尺度上和数据存储空间压力下,DNA具有的大存储密度、高节能环保、超长稳定性的独特优势就显现出来了。只要随着存储和读取技术的发展,DNA编码和测序的效率提升,成本大幅下降,DNA存储离商业化应用也就不远了。

那么,现在在商业化上有哪些进展呢?

在2015年,微软公司和华盛顿大学合作发表了一个成果,采用定点读取信息,也就是给一个长长的DNA链里加入一些追踪标记。这些类似索引机制的标记,可以不用每次等测序完整DNA长链,就能选取合适的标记进行读取。

2018年,读取技术又实现突破,微软研发了“纳米孔”读取技术,让 DNA 介质列能挤过一个很小的纳米孔而读取其中每个 DNA 碱基。这一技术让大大缩小了读取设备的空间开支,一个手掌大小的 USB 设备就能进行读取,但读取速度在每秒几KB左右,可以说仍然相当慢。

2019年3月,微软团队在《自然》杂志发表一项新的进展,他们开发了世界上第一个自动DNA存储介质。相比较于手动操作进行DNA的合成和测序,能够自动化方式进行DNA编解码才是未来商业化的出路。

另外,关于DNA存储和读取时长以及成本的问题,一家2016年成立的美国初创公司Catalog也正试图尝试解决。

去年,Catalog将一共16G的维基百科英文版文本存储在了一个DNA分子上。他们使用了一台DNA书写器设备,以4Mbps的速度在DNA中记录这些数据。这意味着在一天内可以记录125GB,大约相当于高端手机可以存储的容量。这一速度已经是之前研究所存储速度的三倍。

目前,Catalog使用了由20到30个碱基对长预制合成DNA链,通过酶嵌套在一起,可以存储更多的数据。这些片段的排列就像英语使用26个字母一样,理论上可以创造出无数的组合。据Catalog估计,未来进行1MB数据DNA存储成本将不到0.001美分。

当然,如果未来这家创业公司真的能够将成本大幅降下来,那么确实有可能为DNA数据存储的商业化铺平道路。

在2019年,《科学美国人》与世界经济论坛联合发布的当年全球十大新兴技术中, DNA数据储存技术名列其中。

可以预见,磁存储和光存储方式在未来一段时间仍将占据数据存储方式的主流。不过,即使我们不会出现地球末日这种极端情况,因为近几年数据激增,人类也正面临数据存储空间不足的严峻问题。同时,数据存储需求激增,带来的是硅晶片使用量的激增,以及由此引发的环境污染问题、水资源和能源消耗等问题。

DNA存储技术的实现,一定程度将缓解传统存储的容量问题,并大幅减少电子元件和能源的消耗。


最终幻想问题(电影)
到处颓垣败瓦、人又死伤无数。人虽然在防卫城暂避,但异种势力逼人,唯一能拯救人类的就只有结合美貌与智慧的亚纪。她掌握歼灭异种的秘密钥匙,就是要找八个「精神」,借着施博士及队长格莱领导的防卫队「红眼睛」之协助,与异种死战。亚纪还要跟时间和异种感染竞赛,以及抵抗总司令的阻挠......

电影最终幻想总的有几部啊?
温明娜 Ming-Na 佩里·吉尔宾 Peri Gilpin 颜色:彩色 声音:英语LPCM,AC3,增加DTS,448K国配 时长:...人虽然在防卫城暂避,但异种势力逼人,唯一能拯救人类的就只有结合美貌与智慧的亚纪。她掌握歼灭异种的

关于最终幻想
与此同时,面对外星球武装力量的入侵和大屠杀,一位勇敢的地球战士格瑞和一名破译了外星人语言的女科学家带领着一群勇敢的人展开了壮烈的拯救人类与地球的战斗。他们要做的,不仅是战胜外星人保卫地球;发现和证明生命的奥秘所在才是他们的终极目的。在战斗中,格瑞和他的同伴更多地了解了人类和地球的秘密...

请鉴赏电影《千与千寻》,谢谢!
导演最终把拯救人类的希望寄托于千寻身上。是她的勇敢和无私换回了白龙、蒙面人、宝宝和父母的新生。因为爱情,人类才可以生生不息、充满希望。 &kng({?'v.m 考察宫崎峻一系列的动画电影作品,其显著的风格是不言而喻的。第一,神话背景不可或缺。不论《龙猫》、《小魔女速递》,还是《幽灵公主》、《天空...

求一篇观后感~~400以上
期间,认识了拥有蓝横纹皮肤的星球族人Na‘vi公主(佐伊-萨尔达娜饰),并因而在一场人类与族人的战争中陷入两难。由于当年特技所限,詹姆斯只好将心爱剧本搁置...传说中,智慧女神雅典娜为了拯救人类而偷偷放到魔匣底层的“希望”还没有来得及飞出来,潘多拉就把盒子扣上了。事实并非如此,“希望”飞出来了,始终飘在我们...

求侦探柯南经典语录!!!
对……这是对于没有翅膀的我们人类来说做不到的犯罪……不可能的犯罪……(土井塔克树) 我们还会再见面的、名侦探……在宣告世纪末来临的钟声停止之前(怪盗基德) 我们医生本来的使命并不是通过验尸来查找凶手,而是拯救被害者的性命,使凶手不再存在……(新出医生) 设计陷阱让人中计,这是什么办案!开什么玩笑!(...

最终幻想电影现在有几部啊
最终幻想系列 是游戏 到目前为止正统作品已经出了13部了 还有大概20多部外传作品但是也是游戏 电影作品一共有两部 分别是 最终幻想:灵魂深处 和最终幻想7降临之子 动画作品有 最终幻想U 最终幻想7最终密令 最终幻想7On the way to smile 还有最终幻想系列1-13之间的作品是没有任何剧情关系的 目前...

有关地球的能源破坏的数据和资料,急用!!!
一、 人类今天已处在巨大的危险之中物种灭绝、气候反常、两极冰雪消融、水污染、荒漠化、沙尘暴、全球水荒、森林火灾、洪涝水灾、破坏性地震、河湖断水、酸雨、臭氧洞、太空垃圾、特大飓风、太阳耀斑活跃、城市上空弥漫着有毒气体、母乳中检测到致癌的化学合成剂、动物与人种种莫名其妙的怪病等等,尤其是2004年12月...

关于暗黑2情节的
而位于世界边缘的野蛮人高地就成为了守卫世界之石最后的阵地,当然它也是拯救人类世界的唯一希望。 三魔神的最终衰亡使游戏终于有个较完满的结局。然而,大家都清楚“DIABLO永不灭”这一永恒的真理,且让我们期待DIABLOIII,看BLIZZARD如何“自圆其说”。 ACT3,暗黑的征程——回顾DIABLO发展历程及影响 也许在96年之前没...

《最终幻想》的电影一共有几部
与此同时,面对外星球武装力量的入侵和大屠杀,一位勇敢的地球战士格瑞和一名破译了外星人语言的女科学家带领着一群勇敢的人展开了壮烈的拯救人类与地球的战斗。他们要做的,不仅是战胜外星人保卫地球;发现和证明生命的奥秘所在才是他们的终极目的。在战斗中,格瑞和他的同伴更多地了解了人类和地球的秘密,找到了制服侵略...

通河县14770546106: DNA作为数据存储介质存在哪些优点和局限性 -
戎质乳宁: DNA作为储存介质的优点有︰体积校一个碱基只有几个原子大小,人们以此为基础进行数据存储,整体的体积将大大领先于传统硬盘.密度大.一个DNA片段就含有无数个碱基.1克DNA不到指尖上一滴露珠大小,却能够储存700TB的数据

通河县14770546106: 量子计算机和生物计算机各自的优缺点 -
戎质乳宁: 一、生物计算机. 优点: 1、体积小,功效高. 生物计算机的面积上可容纳数亿个电路,比目前的电子计算机提高了上百倍.同时,生物计算机,已经不再具有计算机的形状,可以隐藏在桌角、墙壁或地板等地方,同时发热和电磁干扰都大大...

通河县14770546106: DNA计算机的特点是什么? -
戎质乳宁: DNA计算机的特点是:第一,DNA是分子,所以它是分子水平的计算机,因而体积非常小;第二,在相同体积下,它的存储容量、运算量都异乎寻常地大,例如1立方米的DNA计算机,可存储1万亿亿二进制位的数据,超过现在全世界所有计算机的存储容量的总和,它几天的运算量便相当于计算机面世以来全部计算机的总运算量;第三,耗能少,因为它的工作过程是一种生物化学反应,所以耗能量仅为一般计算机的10亿分之一;第四,智能水平高,因为它具有生物体特点,有生物活性,有自我复制和自我组合的能力;第五,能够植于生物体内工作. DNA计算机目前还处于实验阶段,离实现仍有很长距离,因此还谈不上实用和普及.

通河县14770546106: 遗传基因的运用 -
戎质乳宁: DNA序列存储数据 日本庆应义塾大学尖端生命科学研究所近日发布新闻公报说,该研究所和相关部门研究人员通过向细菌天然DNA(脱氧核糖核酸)序列的不同位置插入相同的人造DNA序列,开发出了用细菌长期保存数据的技术. 一切生物...

通河县14770546106: 基因芯片概念上市公司有哪些? -
戎质乳宁: 基因芯片概念上市公司据外媒报道,欧洲生物信息研究所(EMBL)的研究人员开创了一个新途径,可以将数据资料存储在DNA里,而DNA是一种可以存放数万年的材料.利用该存储法,有可能将至少1亿小时的高清录像存储在大约一茶杯的...

通河县14770546106: GTA基因链项目怎么样? -
戎质乳宁: GTA打造了一座以基因数据存储为核心,并具有广泛应用价值的基因数据存储与应用金矿,撬动了万亿美金基因科技的蓝海市场.因其商业模式的创新性和技术的颠覆性,吸引了各方强势关注.

通河县14770546106: 2013年5月6日央视网报道:欧洲生物信息研究所的专家们日前开发出了一项利用DNA存储数据的技术 - DNA粉末存储技术,由DNA的4种碱基进行编码,将编... -
戎质乳宁:[选项] A. DNA是脱氧核糖核酸的简称.是所有生物存储遗传信息的物质 B. 由4种2000个脱氧核苷酸组成的DNA分子有多达41000种排列顺序 C. DNA的一条单链上相邻的两个碱基之间通过氢键连接 D. 嘌呤碱基与嘧啶碱基的结合保证了DNA空间结构的相对稳定

通河县14770546106: 对计算机发展的评价 - 未来的计算机会发展成什么?未来的计算机会发展成什么样
戎质乳宁: 基于集成电路的计算机短期内还不会退出历史舞台.但一些新的计算机正在跃跃欲试地加紧研究,这些计算机是:超导计算机、纳米计算机、光计算机、DNA计算机和量子...

通河县14770546106: DNA双螺旋结构存储信息有什么优势 -
戎质乳宁: DNA双螺旋结构对于遗传上的意义主要在于:结构稳定,不会发生较为严重的基因突变(基因突变大多数是有害的).而在存储信息方面并无太大的意义.DNA存储的优势在于:四种碱基的排列和DNA高度螺旋化能存储大量信息.当然,也可以说由于双螺旋结构稳定,整体式闭合的,而不像RNA有一端是开放的,所以DNA高度螺旋化后不会发生太大的改变,以至于能存储大量遗传信息.

通河县14770546106: 基因存储的好处有哪些?
戎质乳宁: 推荐一篇文章,你就可以了解基因存储的好处. 欧洲欲在月球建基因库存储地球物种基因 2007年09月02日 08:36 新京报 欧洲希望在月球上建立一个“诺亚方舟”,将地球...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网