在服務(wù)器運(yùn)維過(guò)程中,硬盤掉線是導(dǎo)致服務(wù)器故障、數(shù)據(jù)丟失的常見(jiàn)原因。針對(duì)普通服務(wù)器硬盤掉線引發(fā)的數(shù)據(jù)丟失問(wèn)題,存在一套常規(guī)的數(shù)據(jù)恢復(fù)方法。下面將詳細(xì)介紹北亞數(shù)據(jù)恢復(fù)中心為某客戶服務(wù)器進(jìn)行數(shù)據(jù)恢復(fù)的全過(guò)程。
服務(wù)器故障:
故障服務(wù)器配備了16塊硬盤。某一天,運(yùn)維人員發(fā)現(xiàn)10號(hào)和13號(hào)硬盤亮黃燈,服務(wù)器業(yè)務(wù)隨即中斷。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、服務(wù)器狀態(tài)查詢與日志備份分析
借助服務(wù)器管理工具連接到服務(wù)器,對(duì)服務(wù)器狀態(tài)進(jìn)行查詢。結(jié)果顯示,服務(wù)器報(bào)告邏輯卷狀態(tài)失敗,物理硬盤狀態(tài)方面,6號(hào)盤報(bào)告“警告”,10號(hào)和13號(hào)盤報(bào)告“失敗”。對(duì)當(dāng)前服務(wù)器的日志進(jìn)行完整備份,同時(shí)分析日志內(nèi)容,獲取部分邏輯卷信息,這些信息將用于后續(xù)的數(shù)據(jù)恢復(fù)。
2、硬盤編號(hào)、移除與檢測(cè)
將服務(wù)器內(nèi)的所有硬盤按照既定的順序和編號(hào)規(guī)則進(jìn)行編號(hào)標(biāo)記,然后將硬盤從服務(wù)器中取出。使用數(shù)據(jù)恢復(fù)鏡像設(shè)備對(duì)所有硬盤進(jìn)行檢測(cè),結(jié)果顯示16塊硬盤均能被正常識(shí)別。分別檢測(cè)這16塊硬盤的SMART狀態(tài),發(fā)現(xiàn)6號(hào)盤的SMART狀態(tài)為“警告”,與在服務(wù)器管理工具中的報(bào)告一致。
3、磁盤鏡像操作
在Windows環(huán)境下,首先將設(shè)備識(shí)別出的FC盤在磁盤管理器中標(biāo)記為脫機(jī)狀態(tài),以提供寫保護(hù)。接著使用winhex軟件對(duì)原始磁盤進(jìn)行扇區(qū)級(jí)別鏡像操作,將原始磁盤的所有物理扇區(qū)鏡像到Windows系統(tǒng)下的邏輯磁盤,并保存為文件。鏡像過(guò)程中發(fā)現(xiàn),6號(hào)磁盤的鏡像速度極慢。結(jié)合之前對(duì)硬盤SMART狀態(tài)的檢測(cè)情況判斷,6號(hào)盤存在大量損壞和不穩(wěn)定扇區(qū),導(dǎo)致Windows下的一般應(yīng)用軟件無(wú)法對(duì)其進(jìn)行操作。
4、6號(hào)硬盤壞道鏡像處理
采用專業(yè)壞道硬盤鏡像設(shè)備對(duì)6號(hào)硬盤進(jìn)行壞道鏡像操作。在鏡像過(guò)程中,密切觀察鏡像的速度和穩(wěn)定性。發(fā)現(xiàn)6號(hào)盤壞道數(shù)量不多,但存在大量讀取響應(yīng)時(shí)間長(zhǎng)的不穩(wěn)定扇區(qū)。于是,調(diào)整6號(hào)盤的拷貝策略,修改遇到壞道跳過(guò)扇區(qū)數(shù)和響應(yīng)等待時(shí)間等參數(shù),繼續(xù)進(jìn)行鏡像操作,同時(shí)關(guān)注剩余硬盤在Windows環(huán)境下使用winhex鏡像的情況。
5、鏡像結(jié)果分析與文件系統(tǒng)修復(fù)準(zhǔn)備
經(jīng)過(guò)鏡像操作,Windows平臺(tái)下使用winhex鏡像的磁盤全部完成。查看winhex生成的日志發(fā)現(xiàn),在服務(wù)器管理工具和硬盤SMART狀態(tài)中均未報(bào)錯(cuò)的1號(hào)盤也存在壞道,10號(hào)和13號(hào)盤存在大量不規(guī)律的壞道分布。根據(jù)壞道列表,使用winhex定位到目標(biāo)鏡像文件進(jìn)行分析,發(fā)現(xiàn)ext3文件系統(tǒng)的一些關(guān)鍵源數(shù)據(jù)信息已被壞道破壞。北亞企安數(shù)據(jù)恢復(fù)工程師只能等待6號(hào)盤鏡像完成后,通過(guò)同一條帶進(jìn)行xor以及依據(jù)文件系統(tǒng)上下文關(guān)系手動(dòng)修復(fù)被損壞的文件系統(tǒng)。
6、6號(hào)盤完整鏡像
壞道鏡像設(shè)備報(bào)告6號(hào)盤鏡像完成,但由于之前為保護(hù)磁頭和獲取有效扇區(qū)而設(shè)置的拷貝策略自動(dòng)跳過(guò)了一些不穩(wěn)定扇區(qū),鏡像并不完整。因此,再次調(diào)整拷貝策略,繼續(xù)鏡像被跳過(guò)的扇區(qū),直至6號(hào)盤所有扇區(qū)全部鏡像完畢。
7、RAID虛擬重組與數(shù)據(jù)恢復(fù)
獲得所有硬盤的物理扇區(qū)鏡像后,在Windows平臺(tái)下使用winhex展開(kāi)所有鏡像文件。北亞企安數(shù)據(jù)恢復(fù)工程師通過(guò)對(duì)ext3文件系統(tǒng)的逆向分析以及日志文件的研究,確定了16塊FC盤在存儲(chǔ)中的盤序、RAID的塊大小、RAID的校驗(yàn)走向和方式等信息。隨后,嘗試通過(guò)軟件方式虛擬重組RAID。RAID搭建完成后,進(jìn)一步解析ext3文件系統(tǒng),并與用戶溝通,提取出一些oracle的dmp文件供用戶嘗試恢復(fù)。
8、數(shù)據(jù)恢復(fù)測(cè)試與成功
在dmp恢復(fù)過(guò)程中,oracle報(bào)告imp-0008錯(cuò)誤。北亞數(shù)據(jù)恢復(fù)中心的oracle工程師仔細(xì)分析導(dǎo)入dmp文件的日志,發(fā)現(xiàn)恢復(fù)的dmp文件存在問(wèn)題導(dǎo)致導(dǎo)入失敗。北亞企安數(shù)據(jù)恢復(fù)工程師隨即重新分析raid結(jié)構(gòu),進(jìn)一步確定ext3文件系統(tǒng)的破壞程度。經(jīng)過(guò)數(shù)小時(shí)的努力,重新恢復(fù)dmp文件和dbf原始庫(kù)文件。將恢復(fù)的dmp文件交給用戶進(jìn)行數(shù)據(jù)導(dǎo)入測(cè)試,測(cè)試順利通過(guò),未發(fā)現(xiàn)問(wèn)題,數(shù)據(jù)恢復(fù)成功。最后,對(duì)恢復(fù)的dbf原始庫(kù)文件進(jìn)行校驗(yàn)檢測(cè),所有文件均通過(guò)測(cè)試,本次服務(wù)器數(shù)據(jù)恢復(fù)圓滿完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
14文章
10261瀏覽量
91526 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
713瀏覽量
18989
發(fā)布評(píng)論請(qǐng)先 登錄
【服務(wù)器數(shù)據(jù)恢復(fù)】多盤掉線RAID6數(shù)據(jù)恢復(fù):基于Reed-Solomon算法的修復(fù)
【服務(wù)器數(shù)據(jù)恢復(fù)】服務(wù)器raid5陣列raid模塊損壞的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—供電不穩(wěn)引發(fā)服務(wù)器EXT4分區(qū)掛載失敗的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—RAIDZ多盤離線導(dǎo)致服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線致raid5陣列崩潰,數(shù)據(jù)恢復(fù)大揭秘
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤指示燈亮黃燈,RAID5崩潰數(shù)據(jù)這樣恢復(fù)
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器斷電導(dǎo)致raid模塊損壞的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—壞道“突襲”Raid5陣列,數(shù)據(jù)恢復(fù)大揭秘
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列多塊硬盤離線導(dǎo)致raid崩潰的數(shù)據(jù)恢復(fù)
服務(wù)器數(shù)據(jù)恢復(fù)—重裝系統(tǒng)導(dǎo)致XFS文件系統(tǒng)分區(qū)丟失的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—ocfs2文件系統(tǒng)被格式化為Ext4文件系統(tǒng)的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器重裝系統(tǒng)導(dǎo)致分區(qū)消失的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列中硬盤壞道導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例
虛擬化數(shù)據(jù)恢復(fù)—VMware虛擬化環(huán)境下重裝系統(tǒng)導(dǎo)致服務(wù)器數(shù)據(jù)丟失的數(shù)據(jù)恢復(fù)
【服務(wù)器數(shù)據(jù)恢復(fù)】從崩潰到重生:16盤服務(wù)器RAID與EXT4文件系統(tǒng)深度修復(fù)實(shí)錄
評(píng)論