DOIT贵宾
就在几年前,磁盘到磁盘(D2D)的备份手段似乎还好得令人难以置信。受价格低廉的 ATA(以及后来的SATA)硬盘的影响,许多人把D2D当做虚拟磁带库或者软件备份到磁盘的方案来实施,这样做可以消除磁带驱动器和磁带库的机械故障,并简化了技术支持部门应对众多文件恢复请求的繁重事务。
但是如今,磁盘备份的设备容量趋于饱和,数据中心没有足够空间或者电力再添加1PB的备份空间,于是用户开始把原本想保留一个月的备份数据改为仅仅保存两三天。问题在于,备份设备中有太多的重复数据。RorkeData,根据客户的需求推出了领先的Exagrid字节重复数据删除技术。
Exagrid重复数据删除技术可以让你在特定的一组磁盘上存储更多的备份数据。这样,就延长了数据在备份磁盘上的保存时间,降低数据中心的电力和冷却的成本。如果你先删除重复数据,然后通过广域网传送,还可以节省带宽,并且让过去依赖磁带的公司可以使用在线异地备份。重复数据删除技术的惟一缺点就是,会导致备份速度变慢。 大幅度节约空间 当备份程序对同一个目录下的同一个文件进行多次备份,或者对网络中不同位置的相同文件进行备份时,重复数据就会使备份文件的规模逐渐超越极限。大多数网络上都有数量惊人的重复数据,有的是众多用户把有关节日聚会的一篇PDF文档保存到各自的本地目录上,有的是每台服务器的系统驱动器上都有的3GBWindows文件。
解决临时区域内文件重复的方案之一就是增量备份。虽然我们很喜欢这种方案,尤其是Tivoli Storage Manager及其他产品采用的永久增量备份方案,但是正如我们认为RAID灾难恢复不是重复数据删除那样,增量备份也不是重复数据删除。增量备份属于避免重复数据的范畴。
最基本的一种重复数据删除就是内容寻址存储(CAS)设备中的文件级单一实例存储(single-instance store)。每个文件存储到CAS系统上后,设备就会为文件的内容生成一个散列(hash);要是已经存在有相同散列的文件,系统就会创建另一个指针,指向已经存在的副本,而不是保存另一个副本。
Exagrid重复数据删除技术,它采用了略有不同的方法来消除重复文件。Exagrid重复数据删除技术不是在重复文件写入时来识别,而是在运行后台进程中识别: 单一实例存储(SIS)Groveler,它使用局部文件散列函数(之前进行了全面的二进制比较)来识别重复文件,并把重复文件移到公共存储区,用指向公共存储区中文件的链接取代原始位置上的文件。
虽然文件级SIS能够节省一些空间,但如果我们不但删除重复文件,还删除重复文件内存储的重复数据,情况就变得颇有意思。想一想Outlook的.PST文件。通常一个用户会有300 MB或者更大容量的.PST文件,里面保存着以往的所有重要电子邮件; 每天收到一封或者更多封新邮件,因为.PST文件每天都在变化,备份程序就会把该文件包括在增量备份中,即使这个300 MB的文件中改变的内容只有25 KB。
Exagrid重复数据删除技术能识别这25 KB的新数据,只保存这些数据、不用管其他数据,就可以节省大量磁盘空间。依次类推,要是重复数据(如20个用户的.PST文件中的550 KB附件)能够被消除,就可以大大缩减数据量。RorkeData提出的Exagrid重复数据删除备份目标就是这一类解决方案。这种设备在备份软件看来就像虚拟磁带库(VTL)或者NAS设备。它们从备份软件获取数据后,可以透明地删除重复数据。
查看详细资料
TOP
2008-3-26 16:14
2008-3-26 16:22, 下载次数: 40