“数据”、“存储”,这是一个非常大的概念,从最早人类诞生之初的结绳记事到千年来最常用到的竹帛、纸张,从近现代的打孔卡、磁带到如今的硬盘、半导体,人类一直在探寻数据存储的最佳方式。随着我们人类的文明程度越高,我们对于自身文化和历史的传承和保存就越来越迫切,随着数据的膨胀,我们一直在寻找着一种保存时间长、无需维护、体积尽量小的数据存储介质。
从打孔卡到闪存,技术力的爆炸式增长
1725年,法国人Basile Bouchon发明了在编织机上使用的打孔卡,通过绘制图案进行“图案程序”的存储,打孔卡在1801年经由法国人Joseph Marie Jdakacquard升级,他将打孔卡按一定顺序捆绑,创造出了穿孔纸带;1846年,传真机和电报机的发明人Alexander Bain将穿孔纸带引入了电报机;1890年,德裔美国人Herman Hollerith发明了打孔卡制表机,用于统计人口,美国1880年的人口普查在纯手工的情况下历时7年才完成,而打孔卡制表机的发明使得在1890年的人口普查中仅用时6周就完成了统计。如今,打孔卡依然被广泛使用,考试时的答题卡就是使用了打孔卡的原理。
打孔卡制表机
在19世纪末期到20世纪,人类也在慢慢寻找着新的存储方案,先后出现了“磁存储”与“静电记忆管存储”,直到1956年,IBM发布了人类历史上第一个硬盘——IBM 350 RAMAC,这是一个高两米、近一吨的机柜,机柜中有多层直径61cm的盘片,其存储空间仅有5MB,读写效率也只有97.5Kb/S,不过至此,人类正式开启了硬盘存储时代,并且影响至今。
再之后,软盘、光盘先后兴起,机械硬盘的存储技术也逐渐提升,如今单块机械硬盘的容量已经可以达到22TB。
近两年,SSD固态硬盘价格接连走低,其具有读写速度高、小体积、无噪音的特点,内部结构也十分简单,主要由PCB板、主控芯片、缓存颗粒、闪存芯片组成,随着价格走低,SSD成为了目前个人用户最常见的存储介质之一,但也有着寿命较短的缺点。
玻璃硬盘,人类对存储介质的又一次探索
早在2009年,科学家就提出了可以使用光学写入透明材料的方式来存储数据,也就是玻璃。玻璃硬盘通过激光在玻璃不同的深度和角度上创建三维纳米光栅和变形进行数据编码存储,相比于目前在冷存储中常用的光盘,CD光盘只能以平面上的凹凸来存储0和1,而玻璃的三维列阵可以在2mm的玻璃中凭借激光技术存储100多层的三维像素,极大提高了冷存储的数据量,也就是说,它实现了以极小的体积储存了更大的数据量。
图源:微软
此外,玻璃硬盘的稳定性也是当前其他存储介质无法比拟的,这里讲的稳定性包括寿命与耐用性。
微软研究员正将玻璃存储放入沸水中进行测试,图源:微软
CD、硬盘等都有着可预见的寿命,而玻璃硬盘的物理结构可以让数据完整保存千年之久。很多借助硬盘、胶片、CD等介质进行冷存储的数据,为了保证其不受到存储介质的损耗以及考虑到数据格式的更新,企业需要每隔3~5年就进行一次数据的迁移,数据迁移中会带来不小的时间成本、人力成本、物料成本,并且在这个过程中一旦出错将会带来不可逆的损失,而玻璃硬盘的结构使其可以达到千年的存储寿命,对比之前的存储介质而言,提升了百倍以上的寿命。
耐用性方面也是如此,目前的硬盘、胶片等需要存储在恒温恒湿的环境中,维护成本很高,说白了就是很娇气,一个环节做不好,数据就可能产生折损和丢失,但玻璃存储在这方面的表现要好得多,它具备耐高温性、耐腐蚀性、电绝缘性、膨胀系数低等等特点,哪怕是煮沸、刮擦等都不会破坏它的稳定性,也就是说,只要把它放在一个平常的环境中,不进行暴力破坏,那就无需担心它的数据安全。
微软与Cerebyte,玻璃存储的两大巨头
微软——Project Silica
在玻璃存储业界内,微软和来自德国的初创企业Cerebyte是目前的两大巨头。
早在2012年,日立公司就公布过一个由石英玻璃制作而成的存储介质,在一块边长2cm、厚度2cm的石英玻璃上,每平方英寸可以存储40mb的数据,但日立公司作为玻璃存储的先驱者仅仅是昙花一现,并没有一直处于领先地位。
日立石英玻璃存储技术原理
2019年,微软在Ignite 2019上宣布与华纳兄弟合作,将电影《超人》存储到了一块75mm*75mm*2mm的石英玻璃中,仅有一个杯垫大小,数据容量为75.6GB,这一将光学技术引入到存储领域的项目代号为Project Silica。
图源:微软
当时,华纳兄弟的全球档案和媒体工程高级副总裁Brad Collar与华纳兄弟首席技术官Vicky Colf还在华纳兄弟的胶片冷藏库中展示了一部电影在胶卷中存储和在玻璃中存储的大小对比。
图源:微软
就在刚刚过去的10月份,微软在SOSP 2023即第29届ACM操作系统原理大会中,公布了Project Silica的最新进展,微软在存储容量和耐用性上面进行了升级,在一块手掌大小的玻璃片中可存储7TB的数据,并且每块玻璃板可以将7TB的数据完整保存近万年。
图源:微软
微软Project Silica的技术是在一块方形玻璃板内进行编码,由飞秒激光脉冲产生偏振图案的区域,这些偏振图案点被称为“体素”,这些体素将在5个维度上实现信息编码,包括X、Y、Z轴以及光的偏振与波长,仅仅X、Y轴的平面就可形成超过10万个体素二维组,对应100KB的数据容量。
微软使用图书馆机柜的形式来放置和管理这些玻璃存储设备,数据的存储和检索包含4个步骤:
写入实验室:通过激光脉冲,将数据记录在玻璃中。
读取实验室:计算机控制的显微镜进行数据读取。
解码实验室:利用微软自家的Azure AI,将读取好的数据解码为计算机可读的标准格式。
机库实验室:机库中的机器人将自行获取请求调用的数据,并将其插入到读取驱动器中进行读取。
图源:微软
机柜中中有一套机器人穿梭机读取器,能够穿梭在机库间对存储介质进行垂直、上下反转进行读取和写入。微软表示这些读取器会以单向Z轴扫描扇区,对生成的图像进行解码,不同的读取器对应不同的数据吞吐量平衡成本和性能,让客户可以自由选择合适自己的数据吞吐量。
写入驱动器可以同时对多张玻璃进行写入,并且有一套系统可以防止玻璃片被覆写,由于玻璃介质的特性,数据一旦写入无法擦除,所以写入驱动器要保证不会覆写的同时保证单个玻璃片可以被用尽容量。
图源:微软
如果说微软是玻璃存储的传统巨头,那么来自德国的初创企业Cerebyte就是新晋巨头了。
Cerebyte——新晋巨头
Cerebyte最近展示出了一款玻璃存储的原型产品,并且发布了一段视频来展示这套存储系统的工作原理。Cerebyte使用了陶瓷镀膜玻璃技术作为存储介质,玻璃板上的陶瓷层涂在玻璃的两个表面,厚度在50~100个原子之间,同样使用飞秒激光脉冲技术在玻璃上面进行操作,激光在图层上烧制成纳米级别的孔,并且以二进制代码对数据进行编码。目前陶瓷中的每个激光孔宽度为100nm,Cerebyte的工作人员承诺这一数字将降低到3nm。
为了保障存储数据兼容主流的系统、操作环境、应用程序,数据的保存形式为普通的二维码。
和微软一样,Cerebyte也使用了图书馆机柜形式来进行管理,但不同的是,Cerebyte需要将玻璃存储载体放进一个个容器中储存和使用,读取和写入时,玻璃板只能向前和向后移动,飞秒激光在一次传递写入一行消息,反向传递时一个特殊的相机读取,从而验证记录;读取时则是相机在两个方向上工作。
在容量上,Cerebyte声称可以在几厘米的盘上,最高达到100PB的容量数据,数据记录为永久记录,无需特殊过程来保护数据的完整性。
Cerebyte正努力将其原型产品量产化并推向市场。
写在最后
八年前的2015年,有着互联网之父制程的Google公司副总裁Vint Cerf曾表示,由于软件和硬件的淘汰,人类保存在互联网上的一切信息都可能丢失,现有的数字信息最终将可能会丢失会失效,人类可能会进入一个“数字黑暗”的时代。
进入到21世纪后,科技爆炸式的发展,数据极度膨胀,“数据”,从个人角度来讲,可能是珍贵的回忆,可能是重要的的资料,而对于人类来讲,数据承载着文化、历史,人类对于存储方式的探求,就是对于自身的传承。而如今,我们找到了一个便于存储且能够达到千年以上的存储方式,但我相信玻璃并不是人类在探寻存储介质上的终点。
网友评论