91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TECS OpenStack資源池虛機(jī)殘留導(dǎo)致網(wǎng)元異常的問(wèn)題處理

中興文檔 ? 來(lái)源:中興文檔 ? 2025-03-03 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

故障現(xiàn)象

某運(yùn)營(yíng)商TECS資源池的一臺(tái)主機(jī)內(nèi)存故障,進(jìn)行關(guān)機(jī)、內(nèi)存更換操作,虛機(jī)自動(dòng)遷移到其他主機(jī)上,同時(shí)做了其他虛擬機(jī)的手動(dòng)遷移操作。后續(xù)在TECS上出現(xiàn)虛機(jī)內(nèi)核異常告警,如下圖所示。

942c8290-f40f-11ef-9310-92fbcf53809c.png

故障分析

1. 檢查告警,確認(rèn)是一臺(tái)虛擬機(jī)的多次告警,如下圖所示。

944e21ac-f40f-11ef-9310-92fbcf53809c.png

2. 經(jīng)排查,服務(wù)器SRV-09有內(nèi)存更換和下電操作,00:39 虛機(jī)全部自動(dòng)遷移成功,其中包含了XXX0012虛機(jī),同時(shí)還包括其他網(wǎng)元的虛機(jī),其他網(wǎng)元未出現(xiàn)異常。

3. 現(xiàn)場(chǎng)進(jìn)行虛機(jī)重啟、遷移等操作,未成功恢復(fù)XXX00012虛機(jī)。分析虛機(jī)CPU都沖高到100%,虛機(jī)操作系統(tǒng)顯示軟鎖,如下圖所示。

9485e0b0-f40f-11ef-9310-92fbcf53809c.png

4. 經(jīng)操作系統(tǒng)分析,是有大量外部報(bào)文沖擊導(dǎo)致CPU沖高到100%,系統(tǒng)得不到調(diào)度。

5. 將該網(wǎng)元中除XXX00012外的其他虛機(jī)都shutdown后,再重啟XXX00012虛機(jī),XXX00012虛擬機(jī)恢復(fù)正常。

6. 逐一開(kāi)啟其他虛機(jī),發(fā)現(xiàn)XXX00012虛機(jī)異常,其余虛機(jī)均正常啟動(dòng)。3分鐘后XXX00012虛機(jī)CPU再次沖高到100%。

7. 分析XXX00012虛機(jī),發(fā)現(xiàn)該虛機(jī)存在I/O Error,數(shù)據(jù)盤(pán)不能正常讀寫(xiě),如下圖所示。

94916b24-f40f-11ef-9310-92fbcf53809c.png

8. 分析虛機(jī)殘留問(wèn)題,原主機(jī)SRV-09故障下電后,虛機(jī)自動(dòng)遷移,第一次自動(dòng)遷移失敗,自動(dòng)遷移落地的節(jié)點(diǎn)是SRV-10,如下圖所示。

94a8e088-f40f-11ef-9310-92fbcf53809c.png

9. SRV-10節(jié)點(diǎn)上因?yàn)閹捹Y源不足落地失敗,XXX00012虛機(jī)重新自動(dòng)遷移到SRV-12,自動(dòng)遷移成功,如下圖所示。

94cc0842-f40f-11ef-9310-92fbcf53809c.png

10. 自動(dòng)遷移異常導(dǎo)致虛機(jī)實(shí)例在SRV-10和SRV-12同時(shí)啟動(dòng),如下圖所示。

94f0ad00-f40f-11ef-9310-92fbcf53809c.png

11. 綜上分析,產(chǎn)生該問(wèn)題的原因是殘留虛機(jī),導(dǎo)致網(wǎng)元異常。

故障處理

1. 關(guān)閉SRV-12服務(wù)器上XXX0012虛機(jī),同時(shí)刪除SRV-10服務(wù)器上該虛機(jī)殘留的實(shí)例。

2. 重啟XXX0012虛機(jī),虛機(jī)啟動(dòng)正常,CPU恢復(fù)正常。觀察半小時(shí)未再出現(xiàn)異常。

3. 總結(jié):異地重生階段建議不要做其他互斥或者相同的操作,容易造成集群中數(shù)據(jù)不一致等問(wèn)題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    4

    文章

    1467

    瀏覽量

    42867
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11275

    瀏覽量

    224926
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3209

    瀏覽量

    76353
  • 主機(jī)
    +關(guān)注

    關(guān)注

    0

    文章

    1053

    瀏覽量

    36740
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    972

    瀏覽量

    30462

原文標(biāo)題:TECS OpenStack-資源池虛機(jī)殘留導(dǎo)致網(wǎng)元異常的問(wèn)題處理

文章出處:【微信號(hào):ztedoc,微信公眾號(hào):中興文檔】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RCS融合通信系統(tǒng)設(shè)計(jì)方案解析

    TECS主要由以下部分組成:OpenStack自身的組件,OpenStack部署相關(guān)組件,以及擴(kuò)展的HA、自動(dòng)部署與管理、系統(tǒng)管理(軟、硬件資源管理)等組件,
    發(fā)表于 07-01 15:45 ?3739次閱讀
    RCS融合通信系統(tǒng)設(shè)計(jì)方案解析

    OpenStack資源調(diào)度和現(xiàn)狀分析

    OpenStack云端的資源調(diào)度和優(yōu)化剖析2016-07-03 19:12 作者簡(jiǎn)介:胡曉亮,目前就職于IBM Platform Computing 系統(tǒng)科技部云計(jì)算部門(mén),擔(dān)任云計(jì)算開(kāi)發(fā)部工程師。自
    發(fā)表于 10-10 10:44 ?0次下載
    <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b>調(diào)度和現(xiàn)狀分析

    電力云資源的建立

    國(guó)家電網(wǎng)公司從2010年開(kāi)始建設(shè)電力云資源,存儲(chǔ)域作為資源的必須部分,設(shè)計(jì)和實(shí)現(xiàn)存儲(chǔ)域是資源
    發(fā)表于 11-27 17:33 ?0次下載
    電力云<b class='flag-5'>資源</b><b class='flag-5'>池</b>的建立

    OpenStack云平臺(tái)監(jiān)控?cái)?shù)據(jù)采集及處理的實(shí)踐與優(yōu)化

    本文介紹了在OpenStack云平臺(tái)中通過(guò)Ceilometer采集云平臺(tái)中虛擬機(jī)、磁盤(pán)、網(wǎng)絡(luò)等資源的使用數(shù)據(jù),并通過(guò)Gnocchi處理、儲(chǔ)存和索引數(shù)據(jù)的實(shí)踐。
    的頭像 發(fā)表于 12-25 18:38 ?2828次閱讀

    線程池中如何獲取和處理異常

    在實(shí)際開(kāi)發(fā)中,我們常常會(huì)用到線程,但任務(wù)一旦提交到線程之后,如果發(fā)生異常之后,怎么處理
    的頭像 發(fā)表于 10-24 15:44 ?2018次閱讀

    TECS資源池上報(bào)網(wǎng)絡(luò)流程異常告警的問(wèn)題處理

    資源TECS上報(bào)網(wǎng)絡(luò)流程異常告警,告警單次持續(xù)15秒-4分鐘之間。
    的頭像 發(fā)表于 06-07 09:41 ?1929次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報(bào)網(wǎng)絡(luò)流程<b class='flag-5'>異常</b>告警的問(wèn)題<b class='flag-5'>處理</b>

    TECS資源池上報(bào)存儲(chǔ)設(shè)備離線的問(wèn)題處理

    資源在運(yùn)行過(guò)程中出現(xiàn)存儲(chǔ)設(shè)備離線告警,通過(guò)底層cinder service-list命令查看,確認(rèn)存儲(chǔ)state為down狀態(tài)。
    的頭像 發(fā)表于 06-07 09:44 ?1478次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報(bào)存儲(chǔ)設(shè)備離線的問(wèn)題<b class='flag-5'>處理</b>

    TECS資源SSH控制節(jié)點(diǎn)機(jī)提示connection refused的問(wèn)題處理

    某局點(diǎn)現(xiàn)場(chǎng)TECS控制節(jié)點(diǎn)的TECSClient平面使用雙棧配置,同時(shí)使用IPv4和IPv6。
    的頭像 發(fā)表于 06-07 09:47 ?1606次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>SSH控制節(jié)點(diǎn)<b class='flag-5'>虛</b><b class='flag-5'>機(jī)</b>提示connection refused的問(wèn)題<b class='flag-5'>處理</b>

    TECS資源池上報(bào)BFD會(huì)話(huà)DOWN和網(wǎng)絡(luò)流量異常告警的問(wèn)題處理

    資源TECS上報(bào)BFD會(huì)話(huà)DOWN告警和網(wǎng)絡(luò)流量異常告警,持續(xù)時(shí)間1秒至6分鐘不等,如下圖所示。
    的頭像 發(fā)表于 06-07 09:49 ?2505次閱讀
    <b class='flag-5'>TECS</b><b class='flag-5'>資源</b>池上報(bào)BFD會(huì)話(huà)DOWN和網(wǎng)絡(luò)流量<b class='flag-5'>異常</b>告警的問(wèn)題<b class='flag-5'>處理</b>

    資源后端存儲(chǔ)服務(wù)狀態(tài)異常的問(wèn)題處理

    故障現(xiàn)象某資源在巡檢過(guò)程中檢查服務(wù)狀態(tài),其中云盤(pán)后端的服務(wù)狀態(tài)為down,如下圖所示,影響虛擬機(jī)云盤(pán)的生命周期管理操作。
    的頭像 發(fā)表于 09-20 11:06 ?1593次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>后端存儲(chǔ)服務(wù)狀態(tài)<b class='flag-5'>異常</b>的問(wèn)題<b class='flag-5'>處理</b>

    資源虛擬機(jī)時(shí)鐘跳變異常的問(wèn)題處理

    資源在運(yùn)行過(guò)程中一臺(tái)虛擬機(jī)出現(xiàn)業(yè)務(wù)異常,通過(guò)查看日志和異常記錄,判斷為虛擬機(jī)發(fā)生時(shí)鐘跳變問(wèn)題
    的頭像 發(fā)表于 09-20 11:08 ?2542次閱讀
    <b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬機(jī)時(shí)鐘跳變<b class='flag-5'>異常</b>的問(wèn)題<b class='flag-5'>處理</b>

    TECS OpenStack資源時(shí)間同步失敗的故障分析

    某運(yùn)營(yíng)商TECS OpenStack資源,在當(dāng)前告警中顯示“時(shí)鐘同步失敗”,以10分鐘整數(shù)倍為間隔上報(bào)“時(shí)間同步失敗”告警,持續(xù)時(shí)間30秒-1分鐘不等。
    的頭像 發(fā)表于 03-03 10:09 ?1128次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>時(shí)間同步失敗的故障分析

    TECS OpenStack資源機(jī)寫(xiě)磁盤(pán)時(shí)延高告警的問(wèn)題處理

    某運(yùn)營(yíng)商TECS資源,在當(dāng)前告警中顯示“機(jī)寫(xiě)磁盤(pán)時(shí)延高告警”,如下圖所示。告警統(tǒng)計(jì)總體平均10分鐘左右自動(dòng)恢復(fù)。
    的頭像 發(fā)表于 03-21 09:36 ?1013次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b><b class='flag-5'>虛</b><b class='flag-5'>機(jī)</b>寫(xiě)磁盤(pán)時(shí)延高告警的問(wèn)題<b class='flag-5'>處理</b>

    TECS OpenStack資源主機(jī)磁盤(pán)分區(qū)使用率過(guò)高的問(wèn)題處理

    某運(yùn)營(yíng)商TECS資源池上報(bào)“主機(jī)磁盤(pán)分區(qū)使用率過(guò)高”的告警,如下圖所示。
    的頭像 發(fā)表于 03-21 09:47 ?1017次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>主機(jī)磁盤(pán)分區(qū)使用率過(guò)高的問(wèn)題<b class='flag-5'>處理</b>

    TECS OpenStack資源虛擬機(jī)網(wǎng)絡(luò)二層地址無(wú)法互通的問(wèn)題處理

    某運(yùn)營(yíng)商TECS OpenStack使用主機(jī)overlay SDN方案組網(wǎng),運(yùn)維人員在創(chuàng)建虛擬機(jī)測(cè)試虛擬機(jī)網(wǎng)絡(luò)狀態(tài)時(shí)發(fā)現(xiàn)問(wèn)題:在其中一臺(tái)主機(jī)上創(chuàng)建兩臺(tái)同網(wǎng)段虛擬
    的頭像 發(fā)表于 06-12 09:28 ?877次閱讀
    <b class='flag-5'>TECS</b> <b class='flag-5'>OpenStack</b><b class='flag-5'>資源</b><b class='flag-5'>池</b>虛擬<b class='flag-5'>機(jī)</b>網(wǎng)絡(luò)二層地址無(wú)法互通的問(wèn)題<b class='flag-5'>處理</b>