戴尔服务器数据恢复:PowerEdge 2900 RAID 5数据丢失

RAID 5简介

一个突袭Array将两个或多个硬盘连接在一起,形成一个本质上是一个巨大的硬盘驱动器。RAID阵列提供更大的存储容量,防止单个驱动器故障造成的数据丢失,提高效率,或三者的某种组合。

一个raid - 5是一个独立磁盘的冗余阵列,它将写入它的所有数据分割,并将其“分割”到阵列中的所有驱动器上。RAID阵列中的单个数据块通常是硬盘驱动器上的128个扇区,即64kb。与RAID-0不同,RAID-0也使用这种条带技术将其驱动器链接在一起,RAID-5阵列还具有“奇偶校验”块。

这些特殊的块保存校验数据位,因此如果阵列中的任何一个驱动器出现故障,RAID控制器可以使用异或逻辑来恢复把缺失的数据拼凑起来.不管数组中有多少个驱动器,这个校验数据在数组中总共占用一个驱动器的空间。一个RAID-5阵列比具有相同数量的相同大小驱动器的RAID-0少一个驱动器的存储容量。但多个硬盘故障仍可能导致RAID 5数据丢失。

RAID-5的冗余性确保了在单个硬盘崩溃的情况下数据保护。如果IT技术人员得到通知并立即更换故障硬盘并执行RAID重建,则可以避免RAID 5数据丢失。但是如果第二个硬盘在第一个硬盘被替换之前出现故障,整个阵列就会脱机,数据也会丢失用正常方法是无法挽回的.如果更换故障的硬盘并重新构建RAID 5以恢复冗余,将导致RAID 5数据丢失。

在此Dell PowerEdge 2900数据恢复场景中,客户端三驱动器RAID-5阵列中的两个希捷ST3250310NS硬盘驱动器出现故障。在对第一个故障硬盘进行成像时,我们的工程师发现,虽然驱动器的物理组件刚好足以读取数据,但有超过3000个坏扇区,这可能导致了驱动器的故障。

这个硬盘驱动器故障在客户端没有注意到的情况下发生了一段时间,剩下的两个驱动器上的奇偶校验条填补了空白。我们将RAID-5阵列中出现故障的第一个驱动器称为“stale”,因为在驱动器发生故障后很长一段时间内,用户仍在向阵列中的其他驱动器写入新数据,当驱动器在洁净室中恢复时,其内容将过时。

如果一个陈旧的驱动器被用户强制重新联机(假设可以),它会导致可怕的数据损坏,因为RAID控制器试图将陈旧的数据合并到阵列中。当RAID-5阵列的第二个驱动器的状态降级并开始显示时维持——遵循S.M.A.R.T.来如果出现错误,RAID控制器也会强制该驱动器离线,使整个阵列的操作戛然停止。

戴尔PowerEdge 2900数据恢复案例分析:三盘RAID-5
总容量:500 GB
RAID级别:5
驱动品牌:希捷梭鱼ES.2
驱动模式:ST3250310NS
操作系统:Windows Server 2008
情境:一个驱动器失效,第二个驱动器降级
恢复的数据类型:Word, Excel, Quickbooks, PDF和图片
欧宝娱乐百科张信哲代言博彩 欧宝娱乐Gillware数据恢复案例等级:9

此客户端有一台运行Windows server 2008的Dell PowerEdge 2900服务器。该服务器配备了三块250g的希捷Barracuda ES.2企业级硬盘,排列在一个RAID-5阵列中。其中两个驱动器出现故障,导致RAID 5数据丢失。客户向我们寻求戴尔PowerEdge数据恢复服务。

戴尔PowerEdge 2900数据恢复过程

在这个Dell PowerEdge 2900数据恢复过程中,我们的洁净室、逻辑和RAID数据恢复工程师都扮演了重要的角色。在我们的洁净室数据恢复工程师尽可能完整地对RAID阵列中的磁盘进行成像后,我们的工程师将图像传递给逻辑和RAID工程师Cody,以便正确地排列数据。

RAID-5阵列中的所有驱动器都必须按照特定的顺序进入,这样数据才有意义。在本例中,阵列中有三个驱动器,因此由Cody决定哪个磁盘是disk 0,哪个是disk 1,哪个是disk 2。一些偶尔的客户会把他们的RAID阵列中的驱动器发送给我们,但是当他们没有这样做的时候,我们有自己的方法来确定哪个驱动器是哪个。

每个硬盘在洁净室成像后,我们的工程师扫描了这些硬盘的元数据,然后把他们的发现和阵列中驱动器的图像一起交给了科迪的部门。通过研究每个硬盘驱动器上的文件系统元数据和RAID控制器元数据,Cody可以安排硬盘驱动器并看到一个模式。对于这个特定的Dell PowerEdge 2900数据恢复案例,Cody发现的文件系统元数据模式看起来有点像这样:

SelfNumbers欧宝娱乐百科张信哲代言博彩 欧宝娱乐Gillware

文件系统元数据显示在十六进制.对于那些不会说十六进制的人,E300是58,112,E340是58,176,E380是58,240,E3C0是58,304,等等。分析这些模式对于避免永久RAID 5数据丢失至关重要。这种模式下元数据的进展告诉Cody数据是如何在每个磁盘上划分的,以及RAID阵列的奇偶校验块在哪里。在RAID-5中有几种不同的方法可以对数据进行条带化,其中一些方法将在读写速度或效率方面提供小的改进。

RAID 5数据丢失分析的位图法

RAID控制器做了很多聪明的工作来管理RAID阵列,但是它还不够聪明,不能自己判断磁盘的顺序是否错误。如果它们的顺序是错误的,文件指针将指向错误的二进制文件,所有文件内容最终都将不可救药地乱码。我们的RAID数据恢复工程师想出了一种聪明的方法来测试他们是否以正确的顺序组合了一个RAID-5阵列,称为“位图方法”。

想象一下位图方法,回想一下上世纪90年代令人兴奋的互联网时代,那时你不能同时使用手机和上网。当你进入一个有大图像文件的网页时,你可以看到图像从上到下慢慢滚动,因为图像文件的开头是从顶部开始向下延伸的。现在想象一下,有人可以把你正在浏览的网站上的图像文件切碎,然后重新排列在你的最前沿56 k的调制解调器可以开始读取文件。如果那个文件是一个人的照片,这个人的腿可能会被夹在他的头和胸部之间。

为了使用位图方法,我们的RAID-5数据丢失工程师寻找一个大的位图文件,其开头接近一个块的开始,大小至少与一个条带中的块总数相同。位图是未压缩的图像文件,所以它们最适合这个测试。如果一切都是正确的顺序,那么RAID已经正确地组合在一起。如果没有,我们祝贺工程师们把客户在上一次家庭聚会上拍的合影变成了毕加索的《格尔尼卡》。

现在Cody已经完成了解决RAID阵列几何结构的所有艰苦工作,避免RAID 5数据丢失就变得很简单了。由于我们的工程师在阵列中的驱动器上获得了如此大的二进制读取,在客户端的RAID-5阵列被重新组合在一起之后,只需要做一点额外的文件恢复工作。科迪仔细研究了重构的RAID-5阵列上的文件,测试了客户端宝贵的Quickbooks文件和Office文档,以确保它们正常工作。我们最终给这个Dell PowerEdge 2900数据恢复案例打分,在我们的十分制量表上是9分。

如何避免RAID 5数据丢失?

我们的首席执行官布莱恩·吉尔最佳实践的列表来延长您的RAID-5阵列的寿命,但无论您多么勤奋的维护,没有RAID阵列可以永远持续下去。当RAID阵列中的硬盘出现故障时,将其保存到我们的数据恢复实验室的最佳方法是积极维护所有关键数据的场外备份。

将Ascenzo
将Ascenzo

Will是Gillware数据恢复和数字取证的首席博主、文案和文案编辑,也是反对滥用无辜分号的坚定倡导者。张信哲代言博彩 欧宝娱乐欧宝娱乐百科

文章:213
Baidu