RAID-5设置技巧:如何避免数据恢复实验室


作者:Brian Gill, CEO欧宝娱乐百科张信哲代言博彩 欧宝娱乐Gillware Inc .)数据恢复

我已经运行了世界上最成功的数据恢复实验室之一十多年了,我已经看到了成千上万的RAID 5数据丢失情况,这些情况本可以通过遵循这些简单的指导方针来避免。本文并不是要对raid5进行全面的解释,而是要为有经验的IT人员提供一些设置raid5的建议。RAID 5设置使用N个硬盘驱动器,将它们与物理硬件或软件一起分组到一个大的存储阵列中。整个阵列将有N-1个总容量的驱动器,因为它牺牲了一个总容量的驱动器,并将其用于冗余。一个示例RAID 5设置是3x3TB驱动器,总容量为6TB。任何单个驱动器都可能出现故障,而阵列仍然能够在“降级”状态下读写数据。此时,您应该注意到一个驱动器已死,并将该驱动器替换为一个新的驱动器,然后允许阵列“重建”并恢复冗余。如果阵列中的两个驱动器死亡,数据将无法访问,并且可能永远消失,没有严肃的专业知识。

有关RAID 5及其工作原理的更详细解释:
https://www.欧宝娱乐百科张信哲代言博彩 欧宝娱乐gillware.com/raid-data-recovery/raid-5-data-recovery/

使用多种驱动器制造商

使用不同制造商的驱动器。随着硬盘制造商不断整合,这一点变得越来越困难。如果你找不到不同的制造商,至少要挑选生产日期明显不同的驱动器,我建议至少有一个月的差异。RAID中的驱动器在关机、启动、运行时、数据读写、环境等方面的寿命几乎相同。如果它们是同一型号,在同一天生产,那么它们的寿命或制造缺陷可能非常相似,或者对电涌/突然断电/环境事件的反应相似。RAID 5给了你一个硬盘冗余的能力,所以我们绝对不希望它们在同一天或同一周死亡。使用容量/速度相似但品牌/型号不同的驱动器将有助于避免一些双驱动器死亡的情况。

安装RAID时,请填写RAID配置信息

大多数RAID卡可以通过各种不同的方式进行设置。您可能会惊讶地发现,我们从IT人员那里接到了多少电话,仅仅因为RAID卡爆炸了,就给我们发送了一盒健康的驱动器。所有配置都只存在于RAID卡上,它们绝对没有设置的内存。你运行的是RAID 5、RAID 6还是RAID 1?你的RAID的条带大小是多少,64KB, 128KB, 1个扇区?旋转是多少?有多个卷组还是只有一个?如果有多个硬盘,哪个硬盘在哪个组?补偿?哪个盘是热备盘? What firmware version is your RAID card or software RAID running?

确认RAID卡上保存了RAID配置而且在驱动器上。

如果是这种情况,我们的RAID卡死了,有一个很好的机会,只需订购另一个具有相同固件的硬盘,并将驱动器插入将允许阵列重新挂载。这是因为每个驱动器都有一些元信息存储在某个地方(通常是驱动器前面或后面的前几个扇区),这些信息解释了它在宇宙中的位置。数组中的顺序、条带大小、数据偏移量、它所在的物理组等等实际上都存在于驱动器上,允许新卡重新检测数组设置。

设置通知

虽然我从未见过官方的研究报告,但我估计超过一半的运行RAID 5的小企业都没有正确设置RAID控制器通知。当一个驱动器被RAID控制器脱机时,你绝对必须让它给你发电子邮件或页面/短信,这样你就可以迅速替换失败的驱动器,并执行必要的重建来恢复冗余。我估计近90%的小型企业/消费者使用NAS(网络附加存储)RAID 5单元没有设置任何通知。当一个驱动器出现故障并脱机时,存储阵列将继续工作(RAID 5的全部意义),并将使用所有其他驱动器上的奇偶校验计算来“模拟”从死驱动器读取和写入的数据。您可能会幸运地注意到数据访问时间变慢了20-30%,并认为“哎呀,我的NAS运行得有点慢,我想知道我是否丢失了一个驱动器?”,但说实话,大多数用户都不会注意到这一点。有人可能会路过这台设备,注意到硬盘上的LED不是绿色的,而是红色的,但他们很可能不知道这意味着什么,也不会说什么。

所以,如果你在你的小型企业中运行这样一个NAS单元,去拿一本手册,通过它所承载的小“网站”连接到它,并配置通知。如果您在办公室/家中运行的是小型传统服务器,下次启动时请检查RAID BIOS设置并查看配置选项卡。测试通知(它应该有一个简单的按钮来测试),以确保你收到那个页面/电子邮件。我建议给一个电子邮件组发邮件,而不是一个人,并确保消息没有被垃圾邮件过滤掉。

使用“企业”类驱动器

虽然大多数驱动器的内部结构非常相似,但与消费级驱动器相比,几乎每个制造商的企业系列驱动器上都有明显不同的固件。例如,消费者类驱动器可能被设置为进行“离线”扫描;它正在扫描扇区级盘片缺陷,而驱动器目前没有在使用。消费级驱动器在不使用时,实际上可能会使电机旋转并进入睡眠状态以节省电力。在单个驱动器消费者系统中,这些可能是最佳行为。然而,当RAID控制器试图在这些条件下与驱动器“对话”时,其响应可能会出现不可接受的延迟。RAID控制器可能配置为在某个超时后使驱动器脱机,现在您正在运行降级,尽管脱机驱动器实际上是健康的。如果2个或更多的驱动器满足这个条件,你就死在水里了。企业级驱动器将改变它们的行为,以满足普通RAID控制器的性能/延迟要求。企业级驱动器还经过更全面的质量保证过程,并在制造过程中使用更高质量的组件。 As such, enterprise drives are typically rated for much longer lives in general. Enterprise series drives of course will cost more and can be harder to source (you aren’t going to find them at most local consumer electronics stores) but the extra money and time to source the appropriate equipment is money well spent.

6最大驱动器

我建议RAID 5中最多包含6个驱动器。我见过一些设置,有些人使用了超过10个,但这是要避免的。简单的数学计算表明,你运行的驱动器越多,双重故障的概率就越高,这显然是我们一直试图避免的。如果您正在为巨大的容量需求构建一个RAID,我强烈建议运行RAID 6,并且可能至少有一个热备。

注意RAID 5 NAS设备的便利性。

正如我前面提到的,RAID 5 NAS设备通常没有配置为在驱动器出现故障时通知任何人。这是因为人们将它们从网络柜的盒子中取出,插入,打开,办公室里的每个人都神奇地看到本地网络上的一个新的逻辑卷。然后胜利的安装人员拍拍自己的背,继续他们的一天,有时把盒子和手册扔进垃圾桶。

尽管这些设备很方便,但我想说,它们的故障几率大约是大型服务器中合法RAID 5的3-5倍。大多数NAS设备都是随当天早上最便宜的驱动器发货的,而不考虑制造商。通常情况下,这些驱动器之间只有一个序列号,在几秒钟内就会建立起来。他们当然不会把昂贵的企业级驱动器放在流行的消费者NAS设备中;他们主要在价格上竞争。它们携带方便,很容易被盗。他们没有像真正的服务器那样独立的风扇。它们可能住在壁橱里,而不是服务器室。与大型服务器相比,还有一个更重要的故障点:NAS设备必须启动自己的专有设备操作系统(通常也是一次性的Linux),以便将数据挂载到网络上。在大型服务器上,您将运行真实版本的Linux或Windows,您有相应的磁盘,并且了解如何排除故障。 When a NAS takes a dirt nap it may allow you to attempt to “repair” the operating system, “flash the firmware”, but these options may or may not involve the annihilation of all your data, scary stuff.

当NAS出现问题时,如果你没有可靠的备份,你很有可能会把它发送到Gillware或我们的竞争对手那里进行数据恢复。张信哲代言博彩 欧宝娱乐欧宝娱乐百科所有数据恢复软件都需要访问包含数据的逻辑数组,以便扫描文件签名/ inode /目录结构等。当RAID 5 NAS是一块砖时,它就是一块真正的砖;没有什么可骑的。即使您知道如何正确地访问数据卷,您也可能不喜欢使用数据恢复软件。这些设备通常运行Linux的专有版本,有时带有相当标准的Linux文件系统,如XFS,但有时文件系统是完全专有的(专有文件系统没有任何数据恢复软件,编写文件系统的人好心地编写了一个或发布了规范)。我们已经看到一些NAS设备制造商使用标准文件系统,但实际上加密数据(无论消费者是否要求)。我们已经看到其他人在扇区级别上颠倒了位顺序,我们不得不编写软件来解开它。从本质上讲,只要NAS在网络上挂载了一个网络文件系统,它们就可以在幕后做任何它们想做的事情。它通常不会在他们的网站或手册上解释它是如何运行的,因为制造商正试图保护他们的知识产权。

NAS如此容易启动和运行,其意想不到的副作用之一是,大多数消费者不会自学如何使用管理控制台。如果你没有正确设置事件通知,也没有在安全设置上花点心思,你将来可能会后悔的。

自动重建自动力量意识

一些RAID卡将具有启用自动重建的配置设置。有些可能会设置是否允许在满足特定运行状况标准的情况下强制从阵列中退出的驱动器重新联机。如果你要启用这些类型的自动化功能,阅读你的卡的文档并了解它将如何表现是非常重要的。

在过去的几年里,我们已经看到了许多实例,卡片的行为方式与您所期望的不一致。例如,在驱动器更换失败时,卡将重新扫描整个阵列,强制一个陈旧的驱动器在线,并开始从那个陈旧的驱动器重建,破坏自那个陈旧时代以来的所有数据。我们已经见过这样的情况,阵列会注意到一个驱动器离线,自动强制它在线并重建到它。如果一个驱动器很脆弱并且处于脱机状态,最好是真正地更换它,而不是仅仅将它塞回阵列并希望它这次能保持正常。我们也见过一些罕见的情况,技术人员用一个新的空白驱动器替换了一个失败的驱动器,然后阵列开始从该阵列重新构建,将空白驱动器包含到集合中的另一个驱动器中,基本上清除了所有数据。

我不会说你永远不应该启用自动重建,特别是如果你的数组有一个热备,你实际上希望它使用备用,并自动重建到它的情况下,集合的一个成员被取出数组,因为它是不健康的。如果没有我负责的热备,我个人绝不会在任何阵列上启用这些特性。如果您的计划是用热备盘替换RAID 6或RAID 5中的多个驱动器,那么在替换完它们之前,您不会希望重新构建过程开始。

在我看来,更换故障或剥落驱动器的操作员应该决定何时开始重建过程,并且应该有机会验证重建目标是正确的。话虽如此,了解你的卡的能力和你决定启用的功能是这里的关键。

RAID 5不作为备份

许多IT专业人员在本应是例行公事的存储阵列配置偏离了他们的方向时失业。这些并不总是与RAID相关;操作系统补丁、服务器虚拟化、数据库或服务器升级等都可能存在一些相关风险。在对重要的存储阵列进行任何配置修改之前,一定要确保最关键的数据有最近的功能备份。RAID 5或任何RAID仍然会出现许多导致数据丢失的故障。RAID 5不能保护您的数据免受火灾、洪水、盗窃、病毒攻击、人为错误、恶意员工行为或多个驱动器故障的影响。它只保护您从数据丢失从单硬盘驱动器故障时,技术人员是注意,可以及时更换。运行RAID 5,再加上关键数据的云备份,对于大多数小型企业来说是一种非常可靠且具有成本效益的解决方案。无耻插件:Gillware远程备欧宝娱乐百科张信哲代言博彩 欧宝娱乐份是我们的解决方案,您可以快速轻松地配置它,自动加密和传输您的关键数据到我们的云切片。只要付一小笔费用,我们就会持续监控账户,以确保所有关键数据都在正常传输,所有关键数据都已正确配置,可以转移到云端。

有替换驱动器在手

当一个驱动器在RAID 5中失效时,有时会很难订购类似的容量/性能驱动器来替换它。如果第二个驱动器在你等待那批货物的时候出现故障,你可能会陷入困境。当您首先设置RAID时,订购一个备用驱动器是一个好主意。即使你准备了一个热备盘,你也可能想再点一个,这样你需要的时候就有一个冷备盘了。

在添加存储或闪烁固件之前,请确保您有完整的备份

在对阵列进行“例行”维护时,可能会发生大量数据丢失。如果关于阵列的元信息(驱动器顺序/旋转、条带大小、离线驱动器、热备份、物理卷分组)在一次闪光期间丢失,那么你就会死在水里。也许阵列已满,而您想添加更多驱动器和一个新的卷组。也许你的设备有新的固件,你认为会增加功能或提高性能。在进行这种类型的维护之前,确保备份是最新的并且100%完整总是一个好主意。许多IT专业人员都曾因为不先验证备份而进行例行维护而被解雇。

总结

一个正确的设置和持续监控的RAID 5阵列将保护您免受单驱动器故障损失您的所有数据。如果设置不当或根本没有监控,RAID 5会给你一种虚假的安全感,你可能会在某一天将阵列发送给我们进行数据恢复。RAID-5本身不是备份。单个物理位置的单独RAID 5阵列永远无法保护您免受火灾、洪水、盗窃、电涌、恶意员工、多个驱动器故障、人为错误或病毒攻击。

在领英上联系Gillwar欧宝娱乐百科张信哲代言博彩 欧宝娱乐e公司CEO布莱恩·吉尔在这里并在faceboo欧宝娱乐百科张信哲代言博彩 欧宝娱乐k上加入Gillware在这里

布莱恩·吉尔
布莱恩·吉尔

Brian拥有威斯康星大学麦迪逊分校的计算机科学学士学位。他是一名软件架构师和数据恢复专家。

文章:2
Baidu