QNAP数据恢复案例研究:RAID-6故障

RAID(独立磁盘冗余阵列)是一种将单个硬盘串在一起的方法,这样它们就像一个巨大的硬盘驱动器。这些驱动器通常在网络连接的存储设备或存储区域网络中连接在一起。组成RAID的驱动器可以通过许多不同的方式连接在一起.每个关卡都有自己的优势和劣势。

人们倾向于依赖RAID阵列来扩展数据存储容量,并在驱动器故障时提供缓冲支持。一些RAID级别,如RAID-3和RAID-4,有一个驱动器作为所有特殊“奇偶校验”数据的容器,RAID控制器可以使用这些数据来重建任何丢失的数据。其他级别,如RAID-5和RAID-6,将此奇偶校验信息分布到阵列中的所有硬盘驱动器上。

不同的RAID级别对硬盘故障有不同的容忍度,例如,如果一个硬盘故障,RAID-0将失效;如果两个或两个以上硬盘故障,RAID-1和RAID-5将失效;如果三个或三个以上硬盘故障,RAID-6将失效。一旦RAID-5或6阵列中的单个驱动器发生故障,谨慎的做法是在任何后续故障危及数据安全之前更换它。RAID控制器将使用其校验数据将新驱动器集成到阵列中,并继续正常工作。这称为“重建”RAID。

一个典型的RAID-6阵列与五个硬盘驱动器的关系图。
一个典型的RAID-6阵列与五个硬盘驱动器的关系图。(源)

图片

但是RAID阵列在重建时也是最脆弱的。RAID重构过程中,性能显著下降。这可能会给组织的日常运营带来很大压力。此外,如果在重建过程中有更多硬盘驱动器失效,则数据将处于危险之中。

在这个QNAP数据恢复场景中,客户端在一个故障驱动器脱机后立即替换它,并开始重建RAID。在这一点上,实际上没有数据丢失。RAID-6阵列实际上可以处理丢失另一个驱动器而不会出现故障。但在重建过程中,灾难发生了。第一个驱动器失败了。然后又一个硬盘坏了,然后又一个。这些故障超出了RAID-6所能承受的范围,整个阵列都崩溃了。

什么是QNAP?

QNAP系统是一家位于台湾的技术公司,提供企业级网络附加存储(NAS)设备。QNAP产品应用于存储管理、监控、文件共享和虚拟化。QNAP系统公司提供了一种名为QTS的专有操作系统。QTS整合了文件系统和卷管理器的功能,以改善QNAP存储设备的用户体验。

ob 体育 :简要概述

在Gi欧宝娱乐百科张信哲代言博彩 欧宝娱乐llware,我们接收的许多用于数据恢复的RAID阵列都是RAID级别5的阵列。RAID-5阵列可以通过使用“异或”逻辑。使用异或逻辑,如果您有一组值,其中一个丢失了,则可以使用该集合的其余部分重新构建丢失的值。

如果RAID-5阵列中的单个驱动器出现故障,控制器将使用XOR功能获取其他驱动器上的校验数据,并在丢失的驱动器上重新创建数据。RAID控制器必须不断回头查看校验数据,以访问故障驱动器上的内容。数组将继续运行,但其性能将下降。但是,XOR本身只提供了防止数据丢失的单层绝缘。这就是为什么当RAID-5中有多个硬盘故障时,RAID-5阵列就会故障。

RAID-6阵列与我们的RAID数据恢复工程师习惯看到的RAID-5阵列非常相似。但是RAID-6阵列可以失去两个驱动器,但仍然可以正常工作。RAID-6通过额外的校验数据层来实现这一点。

这额外的冗余层被称为“双奇偶校验”。为了提供双奇偶校验,RAID-6依赖于一层奇偶校验的XOR编码,就像RAID-5一样。第二层奇偶校验由Reed-Solomon编码提供。

里德-所罗门编码是什么?

Reed-Solomon编码是确保复杂数据存储解决方案准确性的核心概念。对于一个数学上完整的定义,你可以请访问维基百科的里德-所罗门纠错码页面.如果您不擅长高级数学,那么您只需要知道Reed-Solomon编码通常用作数据存储和数据传输技术中的错误修正机制。

RS编码是扫描仪即使部分代码损坏也能读取条形码或QR码的原因之一。由于有了第二层校验数据,即使第二块硬盘出现故障,RAID控制器仍然可以从剩余的硬盘中恢复丢失的部分。

QNAP数据恢复过程

在RAID-6中连接的驱动器本身是无用的。当数据写入RAID时,RAID控制器会在各个磁盘上分割数据。每个块通常是128个扇区,大小为64千字节。写入磁盘的所有内容都被切割成这些片段,并由RAID控制器重新拼接起来。与单个硬盘驱动器不同的是,它没有“使用过的区域”作为目标。我们必须尽可能地从客户端驱动器上获取所有信息,然后将驱动器映像传递给我们的RAID数据恢复工程师,以将数据重新拼凑在一起。

在这些故障的驱动器中,有一个是电子元件故障,一个是固件故障,还有一个是读写头和固件都故障。幸运的是,我们的洁净室数据恢复工程师能够成像故障硬盘驱动器上99.9%的二进制扇区。我们的RAID工程师Cody从此处理了QNAP数据恢复过程。

恢复案例概述:

在这个QNAP数据恢复案例中,我们的客户端有8个3tb的硬盘驱动器,使用NAS设备排列在RAID-6配置中,并使用Linux Ext3文件系统进行格式化。这个RAID阵列中的几个硬盘驱动器已经失效,导致所有客户端数据都无法访问。

接下来TS-859U-RP数据恢复案例研究: RAID-6 Rebuild失败
总容量:18结核病
RAID级别:6
设备品牌:接下来
设备模型:ts - 859 u - rp +
文件系统:Ext3 (Linux)
情境:RAID-6重构过程中出现多个硬盘故障
恢复的数据类型:文档,图像,视频
案例评级:9

在本例中,这个故障RAID-6阵列的文件恢复过程进行得相当顺利。Cody能够将失败的阵列重新拼接起来,并恢复了大约17tb的客户端关键数据。由于具有8个3tb驱动器的RAID-6阵列大约有18tb的空间,所以这个特定的阵列已经满到爆了!并非阵列中的所有硬盘驱动器都已100%映像,因此有少量数据丢失。然而,绝大多数恢复的数据似乎是完全正常的。我们给这个QNAP数据恢复案例打了9分。

我们的CEO Brian Gill写了一篇文章,介绍了一些设置RAID-5阵列以减少数据丢失几率的最佳实践,他的大部分建议也适用于RAID-6阵列.最终,虽然很多人认为他们的RAID阵列是足够的备份,但确保数据受到保护并在RAID灾难发生后快速可靠地恢复数据的唯一方法是保持和维护关键数据的场外备份。

如何避免raid 6失效?

RAID-0是目前唯一的无容错RAID存储解决方案。每个其他RAID配置都有一定程度的容错能力。硬盘驱动器可能出现故障,但阵列仍能正常工作。但是,如果您的RAID系统使用的是同一天生产的相同型号的硬盘驱动器(可能相差几分钟),那么这些硬盘驱动器更有可能具有相同的寿命。当您考虑到两个或多个驱动器在本质上同时发生故障的可能性时,您操作的是容错RAID配置可能并不重要。获取不同型号的企业级硬盘有点不方便,但Gillware强烈建议在您的RAID系统中使用不同的硬盘。张信哲代言博彩 欧宝娱乐欧宝娱乐百科

JB拉森
JB拉森

JB Larson是一名技术专家,他热衷于研究数据存储设备,向客户传授技术,在不工作的时候弹钢琴。

文章:60
Baidu