隨著數(shù)字化進(jìn)程的加快,各企業(yè)、組織對大規(guī)模計(jì)算服務(wù)集群的需求與日俱增,運(yùn)維難度也隨之加大。浪潮作為全球領(lǐng)先的算力基礎(chǔ)設(shè)施供應(yīng)商,推出了ISPIM平臺(tái),可同時(shí)實(shí)現(xiàn)對數(shù)萬臺(tái)不同品牌服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備等設(shè)施的統(tǒng)一監(jiān)控、運(yùn)維和告警管理,保障客戶大規(guī)模數(shù)據(jù)中心安全、穩(wěn)定、可靠運(yùn)行。

截至目前,中國高校信息化進(jìn)程已經(jīng)走過二十余載,從最初的校園信息化建設(shè)到如今的智慧校園,數(shù)字化轉(zhuǎn)型下的高校教學(xué)、科研、管理和服務(wù)對算力的需求也在不斷攀升。以中南大學(xué)算平臺(tái)為例,基于傳統(tǒng)運(yùn)維模式已無法對計(jì)算服務(wù)器集群的算力進(jìn)行管理、調(diào)度和科學(xué)合理分配計(jì)算資源,算力應(yīng)用處于黑箱模式,類似于盲人摸象,不清楚、不清晰,無法實(shí)現(xiàn)對計(jì)算集群快速而精準(zhǔn)的有效運(yùn)維,也造成了運(yùn)維人力資源的沉重負(fù)擔(dān)。
為了解決傳統(tǒng)人力運(yùn)維管理面臨的窘境,中南大學(xué)選擇與浪潮信息合作。通過實(shí)地考察、調(diào)研并與中南大學(xué)HPC平臺(tái)管理和技術(shù)人員進(jìn)行多次反復(fù)的交流、溝通和分析、研究,浪潮信息研發(fā)工程師最終決定以“1+1+N高可用模式”,在5臺(tái)服務(wù)器上部署ISPIM系統(tǒng),主動(dòng)采集頻率為45min,監(jiān)控指標(biāo)可達(dá)150W+,覆蓋智算平臺(tái)內(nèi)的所有設(shè)備。
浪潮信息ISPIM系統(tǒng)基于AI算法,對采集到的所有設(shè)備的能耗、溫度、氣流、CUPS以及機(jī)房環(huán)境數(shù)據(jù)進(jìn)行實(shí)時(shí)智能分析,推送能耗管理與優(yōu)化建議,通過可視化拓?fù)涑尸F(xiàn),3D建模展示數(shù)據(jù)中心內(nèi)機(jī)柜位置、位置、功耗、溫度狀態(tài)信息,實(shí)現(xiàn)對整個(gè)數(shù)據(jù)中心的細(xì)粒度管理。
一方面,中南大學(xué)智算平臺(tái)通過部署浪潮信息ISPIM系統(tǒng),實(shí)現(xiàn)了集中自動(dòng)化管理,大大減輕了運(yùn)維負(fù)擔(dān),通過對算力數(shù)據(jù)的精準(zhǔn)獲取、調(diào)度,使得算力的管控集中化、智能化,另一方面,運(yùn)維人員通過ISPIM平臺(tái)可隨時(shí)隨地監(jiān)控整個(gè)平臺(tái)的運(yùn)行狀態(tài),故障報(bào)警能夠以秒級的速度精準(zhǔn)定位,保障中南大學(xué)的智算平臺(tái)高效有序運(yùn)轉(zhuǎn),節(jié)約了人力資源,運(yùn)維效率大幅提升。
在未來,浪潮信息將持續(xù)關(guān)注大規(guī)模計(jì)算服務(wù)集群的需求,基于ISPIM平臺(tái),提供優(yōu)質(zhì)的自動(dòng)化運(yùn)維解決方案,為千行百業(yè)賦能。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7342瀏覽量
94932
發(fā)布評論請先 登錄
青智ZW3432B1數(shù)據(jù)中心電源管理系統(tǒng)監(jiān)控方案
1分鐘帶你了解數(shù)據(jù)中心供電架構(gòu) #電子元器件 #數(shù)據(jù)中心 #供電架構(gòu)
NVIDIA軟件可選服務(wù)支持數(shù)據(jù)中心集群管理
偉創(chuàng)力重磅發(fā)布全球首款面向千兆瓦級數(shù)據(jù)中心的AI基礎(chǔ)設(shè)施平臺(tái)
AI 芯片浪潮下,職場晉升新契機(jī)?
睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級
加速AI未來,睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)
蘇州DCIM數(shù)據(jù)中心基礎(chǔ)設(shè)施管理運(yùn)維系統(tǒng)簡介
PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?
中型數(shù)據(jù)中心應(yīng)用平臺(tái)與差分晶體振蕩器參數(shù)對照中型數(shù)據(jù)中心應(yīng)用平臺(tái)與差分晶體振蕩器參數(shù)對照
中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案
飛利信與浪潮信息達(dá)成戰(zhàn)略合作
施耐德電氣發(fā)布數(shù)據(jù)中心高密度AI集群部署解決方案
浪潮信息ISPIM平臺(tái)基于AI算法,整個(gè)數(shù)據(jù)中心細(xì)粒度管理
評論