常见档案数据存储载体介绍及特性比较
常见档案数据存储载体介绍及特性比较
编者按:兰台粉丝经常留言讨论移动硬盘、U盘、光盘、胶片等档案数据载体的使用情况,这些常见的档案数据载体有哪些特点和优缺点?一起来学习下@数字罗塞塔计划的解读。
一、载体概述
目前市面上常见的档案数据存储载体包括磁存储载体、光存储载体、电存储载体、胶片存储载体四大类(简称:磁、光、电、胶),每类存储载体又包含一些细分类型,如下表所示。
下面分别对各类存储载体的技术原理、分类和特点进行简要分析,并给出典型档案数据存储载体的特性比较。
二、磁存储载体
2.1 技术原理
磁存储技术的工作原理是通过改变磁粒子的极性在磁性载体上记录数据,是一种非易失性存储。在读取数据时,磁头将存储载体上的磁粒子极性转换成相应的电脉冲信号,并转换成计算机可以识别的数据形式,进行写操作的原理也是如此。
2.2 分类和特点
由于软磁盘已经退出市场,目前磁存储载体主要包括磁带和磁盘。
1)磁带
磁带是一种用于记录声音、图像、数字或其他信号的载有磁层的带状材料,比较常见的磁带有录音带、录像带、数据流磁带等。而存储市场上常说的磁带是指数据流磁带。磁带存储技术中用于记录数据的磁带载体与用于读写记录在磁带载体上数据信息的磁带驱动器是可分离的,磁带载体可脱机单独存放,执行读写操作时需要提前将磁带加载到磁带驱动器中。磁带载体通过涂布在磁带表面的磁性颗粒记录数据,数据读写方式为顺序记录和快速定位读取。磁带不易受颠簸、地震等震动的影响,具有良好的加密机制,对于需长期保存的海量静态归档数据存储有一定的优势。
在档案数据存储领域,磁带主要用于大容量档案数据的离线备份。磁带存储主要具有如下优缺点:
优点
成本低:磁带存储设备的购买、维护和存储成本较低,载体可重复利用;
能耗低:磁带的保存对电力的消耗较低,新的“绿色”磁带驱动器的功率大约为5瓦;
体积小、易携带:磁带有比较高的便携性,属于可移动的媒介,重量轻,占用空间小。
缺点
保存环境要求高:温度、湿度、磁场和灰尘会导致磁带变形、退化、粘连、发霉、磁化和磁层磨损,每间隔2-3年需要倒带一次;
读写速度慢:磁带库在读取数据时,是采用线性寻址方式定位数据位置,寻址速度慢,所需时间要用分钟来计量,不能满足数据非连续性快速访问的需求;
兼容性差:磁带格式不兼容,LTO最多只能向下兼容两代,这就造成如果老磁带设备被淘汰,磁带上的数据将无法读取。
2)磁盘
磁盘是指利用磁记录技术存储数据的存储器,目前使用的磁盘主要是硬磁盘,俗称硬盘或机械硬盘。磁盘是计算机主要的存储载体,可以存储大量的二进制数据,并且断电后也能保持数据不丢失。
磁盘主要由用于存储数据信息的磁盘片、用于读写数据信息的磁头、用于盘片转动的电机、磁头控制器、磁盘控制器和数据转换器、接口部件、数据缓存和磁盘控制软件等几个部分组成。一般磁盘内都有多个盘片,每个盘片的正反二面都能记录数据信息。一个磁盘内盘片越多、每个盘片上磁道越多或者每个磁道上磁载体密度越高,则数据信息存储容量就越大,数据记录速度就越快。
磁盘能实现档案数据的快速记录和读取,因此,在档案数据存储领域,磁盘主要用于大容量档案数据的在线存储。磁盘存储主要具有如下优缺点:
优点
读写速度快:磁盘对数据的存储、访问、检索等操作时非常迅速,读写速度可达到400MB/s;
存储容量大:随着硬盘的不断发展,单块硬盘的容量已经达到20TB。
缺点
载体寿命短:磁盘的寿命一般在5-8年,因此在一个较长时间内保存数据就需要不断迁移数据、更换硬盘;
环境要求高:硬盘工作过程中需要电力持续供给,同时需要冷却系统对环境进行降温,电力能源消耗大;
安全性较低:档案数据需要保持其原始性,但硬盘记录是可以被更改的,会面临黑客攻击或人为修改的风险。
三、光存储载体
3.1 技术原理
光存储技术是用激光照射载体,通过激光与载体的相互作用使载体发生物理、化学变化,从而将信息存储下来的技术。光存储技术以二进制数据的形式来存储信息,定义激光刻出的小坑代表二进制的“1”,而空白处则代表二进制的“0”。
光驱的主要部分就是激光发生器和光监测器。光驱上的激光发生器实际上就是一个激光二极管,可以产生对应波长的激光光束,然后经过一系列的处理后射到光盘上,经由光监测器捕捉反射回来的信号,从而识别实际数据。如果光盘不反射激光,则代表那里有一个小坑,从而识别出二进制的“1”,如果激光被反射回来,则识别出二进制的“0”。光盘在光驱中高速转动,激光头在电机的控制下前后移动,光盘中存储的数据就这样源源不断地被读取出来了。
3.2 分类和特点
光盘分为CD、DVD和BD蓝光光盘等几种类型,这几种类型的光盘,在结构上有所区别,但主要原理是一致的。CD光盘目前已经停产,但历史保有量较大;DVD光盘还在生产,但使用已经越来越少;BD光盘正处于推广应用期,在档案数据存储领域应用越来越多。以下主要对BD光盘进行介绍。
BD蓝光光盘可用于高品质影音存储以及高容量的数据存储。蓝光光盘的命名是由于其采用波长405纳米的蓝紫色激光光束来进行读写操作(传统DVD采用650纳米波长的红光读写器,CD则采用780纳米波长)。蓝光极大地提高了光盘的存储容量,单盘容量可达100GB以上,目前市场上已经在推广使用的最大单盘BD容量为200GB(8层,也即双面各4层)。对于光存储产品来说,蓝光提供了一个跨越式发展的机会。
在档案数据存储领域,蓝光光盘主要用于档案数据的近线存储和离线备份。
蓝光存储主要具有如下优缺点:
优点
载体寿命长:蓝光存储载体可靠、寿命长,高质量的光存储载体寿命至少可达 30年;
成本低:与电存储、硬盘、胶片等其他几种存储载体相比,光盘具有单位存储容量成本低的显著优势。光存储可通过多层、多阶、多维以及纳米超分辨等技术手段,存储密度会显著提高到TB级,单位存储容量的成本有望进一步降低;
环境要求低:蓝光存储在保存信息时几乎不消耗能量,仅在读写时耗能,而且无需空调散热。在长期保存情况下光存储的能耗只有硬盘存储的1/500;
安全性高:蓝光存储是典型的WORM(Write Once Read Many,一次写多次读)存储,并且具有抗自然灾害、抗磁暴、抗人为数据删除的优点。
缺点
访问速度较慢:光盘的读取,由于需要将光盘加载到光驱中,造成了数据读取时,访问速度要比硬盘慢得多;
载体不可重复利用:用于档案数据存储的蓝光光盘采用一次写入,不可擦写的记录方式,载体无法多次重复利用。
四、电存储载体
4.1 技术原理
电存储载体主要指用半导体集成电路工艺制成的存储数据信息的固态电子器件,简称半导体存储器。它由大量相同的存储单元和输入、输出电路等构成。每个存储单元有两个不同的表征态“0”和“1”,用以存储不同的信息。
同磁性存储器相比,半导体存储器具有存取速度快、存储容量大、体积小等优点,并且存储单元阵列和主要外围逻辑电路兼容,可制作在同一芯片上,使输入输出接口大为简化。因此,在计算机高速存储领域,磁性存储器已逐渐被半导体存储器所替代。
4.2 分类和特点
电存储载体的产品非常多,市场上常见的包括固态硬盘、闪存、U盘、CF卡、SD卡、MMC卡、SM卡、记忆棒(Memory Stick)、xD卡等。基于非易失闪存芯片的固态硬盘是半导体存储的主要类别,其内部构造比较简单,固态硬盘内主体其实就是一块PCB板,而这块PCB板上最基本的配件就是控制芯片,缓存芯片(部分低端硬盘无缓存芯片)、用于存储数据的闪存芯片和接口电路。
固态硬盘的优缺点如下:
优点
读写速度快:采用闪存作为存储载体,读取速度相对机械硬盘更快,持续读写速度超过了500MB/s。与之相关的还有极低的存取时间,最常见的7200转机械硬盘的寻道时间一般为12-14毫秒,而固态硬盘可以轻易达到0.1毫秒甚至更低;
防震抗摔:固态硬盘是使用闪存颗粒制作而成,所以固态硬盘内部不存在任何机械部件,这样即使在高速移动甚至伴随翻转倾斜的情况下也不会影响到正常使用,而且在发生碰撞和震荡时能够将数据丢失的可能性降到最小;
低功耗:固态硬盘的功耗上要低于传统硬盘。
缺点
寿命限制:固态硬盘使用的闪存芯片具有擦写次数限制的问题,虽然固态硬盘的每个扇区可以重复擦写100000次,但如果对某一扇区进行多次反复读写的情况下,固态硬盘的实际寿命尚未经考验;
成本高:每单位容量价格是传统硬盘的5~10倍(基于闪存),甚至200~300倍(基于DRAM)。
需要说明的是:由于固态硬盘的主要优点(处理速度快)对于档案数据长期保存而言意义不大,而其价格相对于同等容量的硬磁盘而言又很高,所以固态硬盘目前在档案数据长期保存领域基本没有应用。未来,随着固态硬盘成本的不断降低,性价比进一步提升,固态硬盘有望逐步取代硬磁盘,从而成为档案数据存储的一种重要载体。
五、胶片存储载体
5.1 技术原理
在常规的数据存储领域,一般不会将胶片作为一种载体纳入其中,但在档案数据存储领域,胶片却是重要的长期保存和异质备份载体。用于档案数据存储主要是银盐感光胶片,银盐感光胶片实际上是指涂覆在片基上的感光涂层采用明胶型银盐乳剂,由悬浮在明胶中对光敏感的卤化银颗粒组成,当光线射到胶片的乳剂层上并到达卤化银晶体时,这些晶体发生结构性变化,并与邻近也受到光线照射的卤化银晶体相互聚结起来。乳剂层接收到的光量愈多,就有愈多的晶体聚结在一起;光量愈少,晶体的变化和聚结也愈少;没有光落到上面,也就没有晶体的变化和聚结。胶片感光之后,再经过冲洗(显影、定影、清洗、晾干)即可完成信息记录过程。
5.2 分类和特点
感光胶片在档案数据存储上的应用主要包括两种方式:一种是是数转胶(缩微胶片),一种是数转胶转数(数字胶片)。
缩微胶片采用“数→胶”的方式来存储档案图像数据,以计算机输出缩微品( Computer Output Microform, COM)技术为特色,直接将计算机文件输出为可读的缩微影像记录在胶片上,一般处理对象为纸质档案扫描之后的图像文件。这种方式自动化程度和效率相对较高,但会导致文件信息丢失,破坏了文件的原始性,很多文件格式(比如数据库文件、三维CAD文件、音视频文件等)根本无法保存。
数字胶片采用“数→胶→数”的胶片应用新模式,将拟保存的档案数字资源(数据包)经编码处理之后生成高密度二维码图像打印到胶片上,未来可以通过光学仪器读取胶片上的编码图像进行解码处理之后还原成原始数据,这样就可以直接在胶片中保存任意格式的数字信息,确保了档案数据的真实性和完整性,突破了传统胶片的技术局限性,充分发挥了胶片作为长期保存载体和异质备份载体的独特价值。
胶片载体的优缺点如下:
优点
档案胶片具有法律凭证作用:《档案法实施办法》对档案缩微品的法律地位作了规定,“档案缩微品,载有档案收藏单位法定代表人的签名或者印章标记的,具有与档案原件同等的效力。”;
满足档案异质备份要求:所谓异质实际上指的是档案资源存储信息的形态差异(详见本公众号文章《档案异质备份的“异质”指的是“介质”吗?》),因此只有类似于“数→胶”这种数字形态与模拟形态之间的信息转换才是符合要求的异质备份;
保存时间长:在一定的保管条件下,胶片可以保存数百年,保存时间之长是其他存储载体无可比拟的。拍摄于1878年的第一组动图“The horse in motion”,其底片到现在依然可以冲洗,至今已超过140年。
缺点
制作成本高:档案胶片载体本身、冲洗液等耗材成本都很高,制作加工成本也不低,保管环境条件要求相对较高,一般只适合于珍贵和重要档案数字资源的长期保存与异质备份;
读取速度慢:和磁带一样,胶片的读取也是按照线性寻址方式定位数据位置,再加上胶片通常都是打卷之后装盒保存,读取速度慢。
六、典型档案存储载体特性比较
从前面的介绍和分析可知,目前在档案数据存储领域(特别是档案数字资源长期保存领域)应用的存储载体主要是磁带、硬盘、蓝光光盘和档案胶片(缩微胶片和数字胶片)。下面对这四种存储载体的特性进行对比分析,如下表所示:
从以上表格可以看出,每种存储载体都有各自的优劣势,单一的载体并不能很好的解决档案数据长期安全保存问题。在实际应用过程中,应充分发挥各种存储载体的优点进行组合应用,并结合完善的管理策略,才能满足档案数字资源长期安全保存的要求。