服務器數(shù)據(jù)恢復環(huán)境&故障:
一臺ibm x3850服務器,有一組由5塊硬盤組建的raid5磁盤陣列,上層是Redhat Linux操作系統(tǒng),部署了一個oracle數(shù)據(jù)庫。
raid5陣列中2塊硬盤離線,陣列崩潰。經過檢測發(fā)現(xiàn)該raid中的熱備盤未激活,硬盤無物理故障,無明顯同步表現(xiàn)。
服務器數(shù)據(jù)恢復方案:
1、關閉服務器,將所有磁盤標記后取出槽位。由硬件工程師檢測是否有硬盤存在硬件故障,對存在硬件故障的硬盤進行處理。將所有磁盤以只讀方式進行扇區(qū)級全盤鏡像,鏡像完成后將所有磁盤按照標記還原到原服務器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析故障raid結構,得到原陣列中的盤序、條帶大小、校驗方向、條帶規(guī)則以及meta區(qū)域等重組raid所必需的信息。
3、根據(jù)分析獲取到的raid信息重組raid5陣列,并進行文件系統(tǒng)解釋,對重組raid的結構做正確性檢測,確認數(shù)據(jù)無誤后回遷數(shù)據(jù)。
服務器數(shù)據(jù)恢復方案實施過程:
1、硬件工程師檢測后發(fā)現(xiàn)所有硬盤均不存在硬件故障,讀寫正常。在對所有硬盤做鏡像過程中,發(fā)現(xiàn)只有一塊硬盤有10-20個壞扇區(qū),其他硬盤均正常。
2、基于鏡像文件分析原raid結構。
北亞企安數(shù)據(jù)恢復—raid5數(shù)據(jù)恢復
3、根據(jù)分析獲取到的raid結構相關信息重組raid。重組raid后驗證數(shù)據(jù),發(fā)現(xiàn)200M以上的壓縮包解壓無報錯。按照這一結構將raid生成到一塊硬盤上,通過USB將該硬盤接到原服務器,通過linux SystemRescueCd啟動故障服務器后使用dd命令進行全盤回寫。
4、數(shù)據(jù)回寫完成后無法進入操作系統(tǒng),報錯信息為:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。工程師使用SystemRescueCd重啟后檢查發(fā)現(xiàn)文件的權限、時間、大小都有明顯錯誤,對根分區(qū)再次分析,定位出錯的/sbin/pidof/,發(fā)現(xiàn)報錯原因是其中一塊硬盤存在壞道。
5、通過其他盤針對存在壞道硬盤的損壞區(qū)域進行xor補齊并重新校驗文件系統(tǒng),依然有錯誤。工程師再次檢查inode表,發(fā)現(xiàn)存在壞道硬盤的損壞區(qū)域有部分節(jié)點表現(xiàn)為下圖中的55 55 55部分。
北亞企安數(shù)據(jù)恢復—raid5數(shù)據(jù)恢復
雖然節(jié)點中描述的uid正常存在,但大小、屬性、最初的分配塊全部是錯誤的。
6、通過日志確定原節(jié)點塊的節(jié)點信息后進行修正,重新dd根分區(qū),執(zhí)行fsck -fn /dev/sda5/檢測,報錯情況如下圖。
北亞企安數(shù)據(jù)恢復—raid5數(shù)據(jù)恢復
7、經過分析發(fā)現(xiàn),節(jié)點信息新舊交集導致有多個節(jié)點共用數(shù)據(jù)塊。北亞企安數(shù)據(jù)恢復工程師按節(jié)點所屬的文件進行區(qū)別,清除錯誤節(jié)點后,再次執(zhí)行fsck -fn /dev/sda5,依然有部分位于doc目錄下的節(jié)點報錯。由于不影響啟動所以強行修復后重啟系統(tǒng),系統(tǒng)正常,啟動數(shù)據(jù)庫正常。
8、經過用戶方仔細檢測,確認恢復數(shù)據(jù)完整可用,認可數(shù)據(jù)恢復結果。
審核編輯 黃宇
-
硬盤
+關注
關注
3文章
1361瀏覽量
59897 -
服務器
+關注
關注
14文章
10253瀏覽量
91506 -
RAID
+關注
關注
0文章
290瀏覽量
37673 -
數(shù)據(jù)恢復
+關注
關注
10文章
712瀏覽量
18985
發(fā)布評論請先 登錄
【服務器數(shù)據(jù)恢復】服務器raid5陣列raid模塊損壞的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—意外斷電!Linux服務器數(shù)據(jù)恢復大揭秘
服務器數(shù)據(jù)恢復—EqualLogic存儲上raid5磁盤陣列數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—RAIDZ多塊硬盤離線導致服務器崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—服務器斷電導致raid模塊損壞的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—壞道“突襲”Raid5陣列,數(shù)據(jù)恢復大揭秘
服務器數(shù)據(jù)恢復—硬盤離線導致raid上層的卷無法掛載的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—raid5陣列多塊硬盤離線導致raid崩潰的數(shù)據(jù)恢復
服務器數(shù)據(jù)恢復——服務器異常斷電導致raid模塊損壞的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—重裝系統(tǒng)導致XFS文件系統(tǒng)分區(qū)丟失的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—Linux系統(tǒng)服務器崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—服務器重裝系統(tǒng)導致分區(qū)消失的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—raid5陣列中硬盤壞道導致陣列崩潰的數(shù)據(jù)恢復案例
虛擬化數(shù)據(jù)恢復—VMware虛擬化環(huán)境下重裝系統(tǒng)導致服務器數(shù)據(jù)丟失的數(shù)據(jù)恢復
服務器數(shù)據(jù)恢復—raid硬盤壞道導致服務器操作系統(tǒng)文件錯誤的數(shù)據(jù)恢復案例
評論