跟大多数事物一样,自然界的数据存储系统--DNA远远超过了我们所创造的任何东西。现在,伊利诺伊大学厄巴纳-香槟分校的研究人员通过在其“字母表”上增加额外的字母来将其令人难以置信的存储能力提高了一倍并开发了一种新的方法来读取它。
DNA是由四个核碱基的自然组合组成:腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。这些碱基以字母A、G、C和T表示,以不同的序列组合在一起进而形成每个生物体的蓝图。而这种信息存储系统的密度令人难以置信,一克DNA能存储多达215PB(2.15亿GB)的数据。
这当然使它成为现代社会每天产生的大量数据的一个非常具有吸引力的潜在存储解决方案--互联网的全部内容都可以装在一个装满DNA的鞋盒里。并且,如果这种存储还不够密集的话,新研究的研究人员已经找到了一种将其加倍的方法。
除了通常的A、G、C和T之外,研究小组在DNA字母表中有效地增加了七个“字母”。这些字母采取化学改性核苷酸的形式开辟了更多不同的组并允许在相同数量的物理空间内存储更多的信息。
“想象一下英语字母表,”该研究的论文共同作者Kasra Tabatabaei说道,“如果你只有四个字母可以使用,那么你只能创造出这么多单词。如果你有完整的字母表,你可以产生无限的单词组合。这跟DNA是一样的。我们可以将零和一转换为A、G、C和T,而不是将零和一转换为A、G、C、T及存储字母表中的七个新字母。”
当然,增加额外的核苷酸意味着现有的读取数据系统不会识别它们,所以该团队还开发了一个能识别的新系统。DNA链通过一个专门设计的蛋白质中的纳米孔来检测各个单元--无论它们是天然的还是合成的。然后机器学习算法对储存在其中的信息进行解码。
“我们尝试了11种核苷酸的77种不同组合,我们的方法能完美区分每一种,”该研究的论文共同作者Chao Pan说道,“作为我们识别不同核苷酸的方法的一部分的深度学习框架是通用的,这使得我们的方法可以通用于许多其他应用。”
除了密度,新方法还提高了数据的写入速度,这通常是一个相当迟缓的DNA过程。这个系统约将向DNA写入信息所需的时间减半。
这项工作可能有助于使DNA成为一个可行的数据存储系统,当然在实现之前仍有大量的工作要做。
-
视焦点讯!登记地址无法联系,乐视网被列为经营异常天眼查App显示,近日,乐视网信息技术(北京)股份有限公司因...
-
每日视点!TikTok澳大利亚月活用户达850万,相当于澳大利亚总人口的30%据Tech时代消息,日前,TikTok首次公布了其在澳大利亚的用户...
-
世界速递!日本可口可乐售货机已支持支付宝和微信付款据电商报消息,可口可乐日本分公司在近日开业的EDION难波总店...
-
“表演服”用完就退?不能放任后悔权被滥用 世界短讯“七天无理由退货”本是为了保护消费者合法权益,但有人利用...
-
周大生:去年电商业务收入同比增35%,今年目标超去年增速_全球看点周大生在机构调研时表示,2022年电商业务收入同比增长34 65%...
-
视频号运费险正式上线,首次投保根据经营类目有5档选择 环球播报据亿邦动力消息,腾讯发布“视频号小店运费险”服务指南,视...
-
淘宝发布中小商家造星计划,推出最高2000元广告补贴券淘宝宣布启动中小商家的造星计划,推出包含最高2000元广告补...
-
OpenAI CEO:OpenAI还没有开始训练GPT-5大模型 天天播报据外媒报道,OpenAI首席执行官SamAltman在印度经济时报主办的一场会议
-
亚马逊与Hexa达成协作,支持卖家创建3D图像据亿邦动力消息,亚马逊和3D可视化公司Hexa达成一项新举措,...
-
属于王亚伟的时代一去不返近日屡有传闻称,昔日“公募一哥”王亚伟已被监管部门带走调...
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34