經(jīng)驗告訴我們,組織規(guī)模與技術(shù)采用之間存在關(guān)系:更大,資源更豐富的企業(yè)通常會首先采用新技術(shù),而隨后是規(guī)模較小,資源受限的組織會緊隨其后(前提是,小型組織不在企業(yè)內(nèi)部)。技術(shù)業(yè)務(wù))。這種模式已經(jīng)在多種技術(shù)中重復(fù)了好幾代。但是,一旦較小的組織掌握了一項技術(shù),他們的創(chuàng)造力便會以前所未有的方式推動其發(fā)展。恰當(dāng)?shù)睦樱簜€人計算機(jī)最初是在大型公司中部署的,主要用于文字處理和電子表格,但是在十年之內(nèi)被用于創(chuàng)作音樂,控制建筑物,前端復(fù)雜的醫(yī)療設(shè)備以及成千上萬的其他應(yīng)用程序。聯(lián)想
NetApp使用AI的漂亮描述作為數(shù)據(jù)管道。由于我們是合作伙伴,因此我將毫不客氣地竊取該描述。管道始于(1)在邊緣創(chuàng)建和攝取數(shù)據(jù),然后(2)移至位于中心的數(shù)據(jù)清理和準(zhǔn)備階段,在此階段將其匯總為(3)訓(xùn)練階段,這是資源消耗最大的階段。過程。如果數(shù)據(jù)是石油,則將培訓(xùn)視為通過煉油廠生產(chǎn)石油。最后,(4)部署和推理階段,其中訓(xùn)練后的數(shù)據(jù)以推理模式發(fā)送回邊緣,并收集更多數(shù)據(jù)以重新開始引入流水線。
我們的解決方案專注于關(guān)鍵的第三階段培訓(xùn)。它是一種參考架構(gòu)(RA),它將配備了NVIDIA GPU的Lenovo ThinkSystem服務(wù)器和基于NetApp技術(shù)的Lenovo ThinkSystem存儲結(jié)合在一起。通過為客戶和合作伙伴提供“最佳配方”,聯(lián)想,NetApp和NVIDIA消除了配置和優(yōu)化培訓(xùn)平臺的猜測。它可以作為單個向上擴(kuò)展實例,其中多個用戶使用共享存儲在單個節(jié)點上運(yùn)行作業(yè),也可以作為多節(jié)點向外擴(kuò)展群集,其中在所有節(jié)點上依次執(zhí)行作業(yè),并且節(jié)點訪問共享存儲同時。這是一個關(guān)鍵的區(qū)別,因為大多數(shù)較小的組織都將從擴(kuò)大規(guī)模開始,但最終可能會遷移到擴(kuò)大規(guī)模的方法。
培訓(xùn),尤其是依賴于神經(jīng)網(wǎng)絡(luò)進(jìn)行培訓(xùn)的深度學(xué)習(xí),可能需要數(shù)百GB的存儲空間,最多需要PB的存儲空間。在清理和準(zhǔn)備階段,數(shù)據(jù)被組裝成大的,預(yù)打包的文件,例如TFRecords(TensorFlow記錄),然后依次讀取它們。對于利用GPU的任何工作負(fù)載而言,至關(guān)重要的是使它們不斷地處理數(shù)據(jù)。這使得系統(tǒng)范圍內(nèi)的吞吐量對于保持所有計算資源都至關(guān)重要。
責(zé)任編輯:lq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4839瀏覽量
108055 -
AI
+關(guān)注
關(guān)注
91文章
40643瀏覽量
302304 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5602瀏覽量
124569
發(fā)布評論請先 登錄
NetApp數(shù)據(jù)恢復(fù)—NetApp FAS-8200存儲卷丟失故障數(shù)據(jù)恢復(fù)實戰(zhàn)
基于 LES30-PT100-RS485 的水務(wù)水廠管道防凍測溫智能監(jiān)控解決方案
AI輔助編程設(shè)計之道:從Spec到Code工程實踐
使用NORDIC AI的好處
NetApp數(shù)據(jù)平臺助力Super Bowl LX實現(xiàn)高效數(shù)據(jù)運(yùn)營
慧榮科技以創(chuàng)新技術(shù)破解AI數(shù)據(jù)管道IO混合難題
Netapp數(shù)據(jù)恢復(fù)—誤刪NetApp卷數(shù)據(jù):從崩潰到恢復(fù)的實戰(zhàn)復(fù)盤
Netapp數(shù)據(jù)恢復(fù)—Netapp存儲數(shù)據(jù)恢復(fù)揭秘
NetApp使用AI的漂亮描述作為數(shù)據(jù)管道
評論