【数据恢复故障描述】
客户服务器的存储是由HP 8块SAS 300G 硬盘组成的RAID5,其中一块盘为热备盘, RAID故障时表现为两块硬盘离线,阵列失效。正常的操作系统引导不了,导致系统下的Hyper-V虚拟化应用系统启动不了。
【数据恢复故障分析】
RAID5中两块硬盘掉线很少属于同时离线的情况,分析原因是多方面的,有以下几方面的原因有可能会导致此故障的发生:1、服务器突然断电(数据中心有UPS电池柜);2、服务器未正常关机;3、硬盘接触不稳定;4、运输途中导致的服务器不稳定。5、阵列卡故障;6、硬盘物理故障(坏道,固件,磁头损坏,电路板坏)等。
【数据恢复过程】
1、2021年3月24日晚7点钟左右收到徐小姐送修的8块故障盘,当晚加班对用户提供的8块SAS 硬盘进行严格的物理检测及全盘镜像,发现硬盘没有物理故障。
2、镜像完成后,2020年3月25早上8点对所生成的8个备份文件进行RAID结构分析,依据文件系统存储规则确定8块硬盘在构建RAID5的盘序、数据块大小及校验方式,并于虚拟环境中重新构建RAID组;
3、2021年3月25日14点在确保各种RAID参数完全正确的情况下,对7种不同的掉盘组合情况进行详细比较,发现在任一RAID组合中,实际重组出来的数据都是相同的。并发截图给群里看到D 盘虚拟机的文件为:RNAP001
4、2021年3月25日16时将重组出来的数据拷贝至WD30PURX 后将7种不同缺盘的RAID组出来的数据也拷贝到此盘中。
5、2021年3月26日9点送8块SAS 300G故障盘及拷贝盘(WD30PURX )到客户办公地址。
6、现场支持工程师找出编号为:虚拟机的机器,现场支持工程师通过USB3.0座把硬盘转接挂载到此服务器上。
7、终端客户远程连接此服务器把虚拟化的RNAP_C.vhdx, RNAP_D.vhdx,RNAP_E.vhdx,RNAP_F.vhdx,还有其它的快照文件一起拷贝到RNAP的D 盘VHDS目录下。
8、2021年3月26日12时左右终端客户服务器IT工程师远程成功此虚拟化系统,数据库启动无报错
9、2021年3月27日12时左右应用工程师反馈应用数据没问题
10、2021年3月27日20时终端门店反馈确认数据无误。
【数据恢复结果】
数据恢复总共历时2天,其中硬盘检测、检测及分析重构RAID花费1天,数据验证经过服务器IT工程师,应用工程师,门店验证无误,数据100%成功恢复。
【服务器存储安全建议】
1.对存储硬件状态及服务器运行情况做定期检测,发现异常情况时及时采取相应解决方案;
2.在存储出现多块硬盘离线的情况下,切忌贸然对硬盘强制上线或REBUILD,以免数据受到进一步破坏;
3.使用数据备份方案,实时,定期或手动备份数据的二次以上的备份。有条件可考虑异地实时备份。
评论区