服务器数据恢复环境:
IBM Storwize某型号存储,共10块磁盘,组建了2组Mdisk加入到一个存储池中,创建了一个通用卷存放数据,存放的数据包含oracle数据库。
服务器故障:
存储中其中一组Mdisk有两块磁盘出现故障离线,该组Mdisk失效,通用卷不可用。
服务器数据恢复:
一、对故障离线的两块硬盘做物理故障检测,发现盘片有划伤且无法做镜像。将故障存储中其他磁盘以只读方式做全盘镜像, 后续的数据分析和数据恢复操作基于镜像盘进行。避免在恢复数据的过程中对磁盘中的原始数据造成二次破坏。
二、组建raid。由于故障存储的结构比较复杂,在数据恢复过程中需要多次组建raid磁盘阵列。
1、根据用户方提供的配置信息将磁盘按照Mdisk组分类。分析每一组Mdisk中的硬盘获取raid相关信息。利用获取到的raid相关信息虚拟重组Mdisk。
2、通过分析Mdisk获取到pool存储池的相关信息并虚拟重组pool存储池,提取数据Lun。
三、恢复数据库。
完成LUN的数据提取后,根据固有特征值扫描oracle数据库数据页,共得到4个文件:SYSTEM、SYSAUX、USER、UNDOTBS1。
1、尝试解析系统表,发现系统表损坏严重,很多表的信息丢失,系统表不可用。在系统表不能用的情况下,北亚企安数据恢复工程师通过人工匹配表结构信息和记录特征信息来确定数据页所属表。
2、由于人工匹配效果不理想,于是尝试用匹配特殊记录进行匹配。匹配到结果后,北亚企安数据恢复工程师手工解析记录,查看是否符合表结构、语义要求及类型要求。经过长时间的搜索、解析、匹配工作后,最终完成数据页到表的连接。
3、提取备份库内表结构,创建恢复环境。使用北亚企安自主编写的记录提取程序提取数据页内记录,并导入到恢复环境内。
5、导入完成后检查是否有重复、错误数据,发现立即处理直至没有发现任何问题后导出数据并由用户方亲自进行验证。
6、经过用户方工程师的反复验证,确认恢复出来的数据完整有效。本次数据恢复工作完成。
由于故障存储中有两块盘的盘片有划伤,在缺失两块盘的情况下,数据出现条带化错误,工程师尝试了各种方法才修复了错误并提取出用户所需要的数据库数据。