91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU會完全取代用于AI工作負載的計算基礎(chǔ)架構(gòu)中的CPU?

我快閉嘴 ? 來源:賢集網(wǎng) ? 作者:賢集網(wǎng) ? 2020-10-09 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能AI)最初只是實驗室研究,但如今機器學習深度學習等人工智能技術(shù)正越來越多地應(yīng)用到現(xiàn)實世界中,例如檢測金融交易中的欺詐行為、分析零售數(shù)據(jù)以提供個性化的購物體驗,或者找到運輸工具的最佳路線。

這些趨勢意味著人工智能正迅速成為許多企業(yè)工作流程中不可或缺的一部分,從電子郵件到CRM或ERP,尤其是數(shù)據(jù)分析,從組織自身的數(shù)據(jù)集中收集商業(yè)智能見解,以提高效率,甚至創(chuàng)造新的商業(yè)機會。

這并不奇怪,IDC最近的一項調(diào)查顯示,85%的企業(yè)正在評估人工智能或已經(jīng)在生產(chǎn)中使用人工智能。然而,IDC發(fā)現(xiàn),大多數(shù)組織報告說,在他們的人工智能項目中,有四分之一的機構(gòu)報告說,失敗率高達50%。這些失敗都歸因于缺乏熟練員工或文化上的挑戰(zhàn),但另一個常見的失敗原因是無法從概念驗證項目擴展到能夠服務(wù)于整個組織的生產(chǎn)能力。

退一步講,重要的是要區(qū)分那些投資于人工智能以獲得顯著的戰(zhàn)略優(yōu)勢或可能重塑其整個商業(yè)模式的組織,而不是那些僅僅尋求簡化運營或使用人工智能來自動化某些任務(wù)的組織。對于后者,基于云的AI功能生態(tài)系統(tǒng)已經(jīng)興起,可以通過API進行訪問并將其集成到業(yè)務(wù)工作流程中。

另一類公司則以電子商務(wù)巨頭阿里巴巴(Alibaba)分拆出來的一家銀行為例,該銀行使用人工智能來管理其所有金融服務(wù),在貸款審批等流程方面,它的速度比競爭對手快得多,而且員工人數(shù)只占其一小部分。正如《哈佛商業(yè)評論》(Harvard Business Review)所詳述的,這家新銀行的核心是一個基于人工智能的“決策工廠”,它將決策視為一門科學,利用數(shù)據(jù)來推動預(yù)測和洞察,從而指導和自動化公司的運營工作流程。

對于這類業(yè)務(wù),實施你的人工智能戰(zhàn)略首先要有正確的數(shù)據(jù),并且要理解如何使用它。這意味著不僅要雇傭數(shù)據(jù)科學家,還要雇傭數(shù)據(jù)戰(zhàn)略家,他們是能夠?qū)I(yè)務(wù)問題轉(zhuǎn)化為分析解決方案和見解的專業(yè)人士。

人工智能是建立在數(shù)據(jù)基礎(chǔ)上的

大量的數(shù)據(jù)是開發(fā)機器學習(ML)或深度學習(DL)算法的最終根本。您在模型上投入的樣本數(shù)據(jù)越多,就可以將模型“訓練”得越好,并且其輸出越準確可靠。結(jié)果是,與傳統(tǒng)的企業(yè)IT環(huán)境相比,為AI項目存儲和處理數(shù)據(jù)通常需要與高性能計算(HPC)安裝有更多共同點的硬件。

訓練一個深度學習模型或分析大量數(shù)據(jù)需要大量的處理能力。這可以通過使用一堆服務(wù)器和高端處理器芯片并行處理問題來實現(xiàn)。但更有效的解決方案是求助于專門的加速器,如GPU,或圖形處理單元。

GPU之所以得名,是因為它們最初是3D圖形的加速器,需要數(shù)百萬次重復(fù)計算才能渲染圖像。因此,它們具有使用數(shù)百個簡單處理核心的大規(guī)模并行體系結(jié)構(gòu),事實證明,它們也適用于AI模型所涉及的計算。

例如,谷歌發(fā)現(xiàn)一個僅用于48個Nvidia GPU即可處理用于在線圖像識別的AI系統(tǒng),該系統(tǒng)需要16,000個CPU。

這并不意味著GPU會完全取代用于AI工作負載的計算基礎(chǔ)架構(gòu)中的CPU。在許多情況下,仍然需要CPU來處理應(yīng)用程序邏輯和其他數(shù)據(jù)科學計算,因此在大多數(shù)情況下,結(jié)合使用CPU和GPU的計算節(jié)點將被證明是最佳解決方案。

存儲源計算

與傳統(tǒng)的HPC體系結(jié)構(gòu)一樣,獲得最佳性能的關(guān)鍵是保持計算節(jié)點及其gpu以足夠高的速率接收數(shù)據(jù),以使它們保持忙碌,這意味著存儲基礎(chǔ)結(jié)構(gòu)在提供所需的性能級別方面起著至關(guān)重要的作用。正確的數(shù)據(jù)存儲系統(tǒng)必須提供高吞吐量,以防止昂貴的gpu閑置,但它也必須具有靈活性和可擴展性。

更復(fù)雜的是,不同的AI工作負載將以讀寫數(shù)據(jù)的方式顯示不同的訪問模式,存儲層需要能夠處理所有這些模式。ML訓練工作負載往往遵循一種不可預(yù)測的訪問模式,例如,生成大量的讀寫操作,這些讀寫操作可能包括大小不等的隨機訪問和順序訪問,存儲層必須能夠吸收這些數(shù)據(jù)并提供高吞吐量。

當訓練數(shù)據(jù)集足夠小時,例如在試驗性部署中,它可能被緩存在本地內(nèi)存中,或者從小型計算節(jié)點群集中的本地閃存驅(qū)動器(SSD)中提供服務(wù),這可以提供足夠的性能級別,特別是當閃存SSD是NVMe驅(qū)動器時。

NVMe是一種存儲標準,它使用高速PCIe總線將SSD直接鏈接到系統(tǒng)中的處理器,而不是傳統(tǒng)接口(如SASSATA)。它還指定了一種新的高效協(xié)議,可以減少軟件開銷,從而最大限度地提高閃存提供的低延遲。NVMe的一個關(guān)鍵特性是支持多個I/O隊列(最多65535個),從而使閃存能夠并行處理多個請求。這利用了NAND存儲設(shè)備的內(nèi)部并行性,并允許比SAS或SATA高得多的原始吞吐量。

然而,擴展這樣一個試驗性部署來支持生產(chǎn)性人工智能用例所需的大量數(shù)據(jù)是困難的和/或昂貴的,這可能是一些人工智能項目無法超越概念驗證階段的原因。

成本也是一個因素。許多全閃存存儲體系結(jié)構(gòu)都依賴于單獨的對象存儲池或類似的存儲池來保存訪問頻率較低的冷數(shù)據(jù)。相比之下,存儲公司DDN有一個名為熱池的功能,用戶可以通過在用于熱數(shù)據(jù)的閃存層和用于冷數(shù)據(jù)的更大的旋轉(zhuǎn)磁盤層之間自動遷移數(shù)據(jù),將所有內(nèi)容保存在一個文件系統(tǒng)中。這降低了由于管理開銷而導致的成本,同時使所有數(shù)據(jù)更接近你的手邊。

加速任意規(guī)模的AI

這方面的一個很好的例子可以從DDN的加速、任意規(guī)模的AI(A3I)投資組合中看到,DDN是一家專門從事高性能存儲的公司。A3I系列是一套基于DDN EXAScaler系統(tǒng)的預(yù)配置設(shè)備,可選擇所有閃存NVMe SSD或閃存與硬盤驅(qū)動器存儲的混合,以提高存儲容量。

為了擴大規(guī)模,客戶只需添加額外的設(shè)備,每個AI200X/AI400X設(shè)備的閃存NVMe容量高達256TB,或AI7990X型號的混合存儲容量為4PB。每個文件系統(tǒng)都可以看作是一個構(gòu)建塊,可以聚合成一個可以在容量、性能和功能上進行擴展的文件系統(tǒng)。

根據(jù)DDN,A3I設(shè)備針對所有類型的訪問模式和數(shù)據(jù)布局進行了優(yōu)化,以確保GPU資源的充分利用。每個設(shè)備還具有多個高速主機接口,最多有8個HDR100 InfiniBand或100Gbit/s以太網(wǎng)端口。

AI基礎(chǔ)設(shè)施認證

認識到這一點,領(lǐng)先的GPU供應(yīng)商Nvidia在其參考架構(gòu)中將DDNA3I存儲與DGX A100系統(tǒng)結(jié)合在一起,DGX A100系統(tǒng)是一個專用的AI計算系統(tǒng),其中包含八個最新的A100 Tensor Core GPU和一對AMD Epyc CPU。DGX A100系統(tǒng)的架構(gòu)被設(shè)計為適用于所有AI工作負載的通用系統(tǒng),可消耗高達192GB / s的大量數(shù)據(jù)。但是,四個并行工作的DDN AI400X存儲設(shè)備能夠使所有這些GPU完全存滿數(shù)據(jù)。

雖然DGX A100是相當新的產(chǎn)品,但是客戶已經(jīng)在AI應(yīng)用程序中將DDN存儲與Nvidia的舊DGX-1平臺一起使用。日本東北大學醫(yī)學大銀行組織(ToMMo)已實現(xiàn)DDN EXAScaler存儲,該存儲連接到運行Parabricks基因組分析軟件的基于DGX-1 GPU的分析服務(wù)器,作為其醫(yī)療超級計算機系統(tǒng)的一部分。

據(jù)該大學稱,這極大地提高了其分析能力和樣品量。因為由于能夠處理更大的數(shù)據(jù)集,所以以前只存在于理論上的方法現(xiàn)在變得可行,從而提高了數(shù)據(jù)分析的準確性。

不過教訓是,要使用A來I轉(zhuǎn)變業(yè)務(wù)運營,組織需要能夠處理大量數(shù)據(jù)。這反過來又意味著要建立一個能夠處理這些數(shù)據(jù)量的基礎(chǔ)設(shè)施,以及在不破壞銀行資金的情況下擴大對數(shù)據(jù)和計算資源的訪問的方法,以支持未來的增長。

希望通過采用全面的數(shù)據(jù)戰(zhàn)略來領(lǐng)先于競爭對手的公司需要確保自己不會在基礎(chǔ)架構(gòu)方面承擔額外風險。選擇一家在要求最苛刻的數(shù)據(jù)密集型的環(huán)境中提供一系列解決方案方面具有豐富經(jīng)驗的存儲供應(yīng)商是一個明智的起點。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40696

    瀏覽量

    302342
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50229

    瀏覽量

    266585
  • 機器學習
    +關(guān)注

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137158
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    內(nèi)存要取代GPU?HBM之父警告:以英偉達GPU為核心的架構(gòu)要被顛覆

    主板和CPU成為了主角。 ? 而最近“HBM之父”金正浩教授也語出驚人,提出未來內(nèi)存將成為主角:“GPUCPU將會被集成到內(nèi)存(HBM和HBF)里,淪為內(nèi)存的一個組件”。 ? 倒反
    的頭像 發(fā)表于 04-03 09:54 ?6114次閱讀
    內(nèi)存要<b class='flag-5'>取代</b><b class='flag-5'>GPU</b>?HBM之父警告:以英偉達<b class='flag-5'>GPU</b>為核心的<b class='flag-5'>架構(gòu)</b>要被顛覆

    基于openEuler平臺的CPU、GPU與FPGA異構(gòu)加速實戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出
    的頭像 發(fā)表于 04-08 11:02 ?213次閱讀
    基于openEuler平臺的<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>與FPGA異構(gòu)加速實戰(zhàn)

    為何CPUAI基礎(chǔ)設(shè)施的核心

    人工智能 (AI) 并非一種具有單一理想基礎(chǔ)設(shè)施的單一工作負載。AI 涵蓋了多樣化的工作負載,需
    的頭像 發(fā)表于 03-11 10:35 ?827次閱讀

    成功案例:象帝先計算技術(shù)與Imagination合作——面向現(xiàn)代圖形與計算工作負載的專業(yè)GPU

    為專業(yè)計算設(shè)計桌面GPU桌面GPU不僅用于游戲,還能加速從專業(yè)可視化、高級模擬到數(shù)據(jù)密集型計算在內(nèi)的多種現(xiàn)代
    的頭像 發(fā)表于 03-09 09:17 ?401次閱讀
    成功案例:象帝先<b class='flag-5'>計算</b>技術(shù)與Imagination合作——面向現(xiàn)代圖形與<b class='flag-5'>計算</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>的專業(yè)<b class='flag-5'>GPU</b>

    OrangePi RV2 深度技術(shù)評測:RISC-V AI融合架構(gòu)的先行者

    OrangePi RV2是香橙派推出的一款基于RISC-V架構(gòu)AI開發(fā)板,搭載KY X1八核處理器。該板以“CPU 融合AI”為核心理念,內(nèi)置2TOPS算力,并支持雙M.2 NVMe
    發(fā)表于 03-03 20:19

    Banana Pi BPI-CM6 計算模塊將 8 核 RISC-V 處理器帶入 CM4 外形尺寸

    。AI 加速器/NPU:該 SoC 的架構(gòu)宣稱可提供高達 2.0 TOPS 的 AI 計算能力(專為機器學習/AI
    發(fā)表于 12-20 09:01

    適應(yīng)邊緣AI全新時代的GPU架構(gòu)

    電子發(fā)燒友網(wǎng)站提供《適應(yīng)邊緣AI全新時代的GPU架構(gòu).pdf》資料免費下載
    發(fā)表于 09-15 16:42 ?47次下載

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構(gòu)

    算法 5.2加速矩陣乘法的芯片架構(gòu) ①新的矩陣乘法器架構(gòu) ②基于RISC-V的矩陣乘法擴展指令集 ③用信息論的思想來減少AI推理計算量 三、用于
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于
    發(fā)表于 09-12 16:07

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)
    的頭像 發(fā)表于 07-09 15:59 ?1872次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了芯片架構(gòu)的基礎(chǔ)知識,但該部分知識比較晦澀難懂,或許是由于我一
    發(fā)表于 06-18 19:31

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)
    的頭像 發(fā)表于 05-30 10:36 ?1991次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度解析

    能效提升3倍!異構(gòu)計算架構(gòu)AI跑得更快更省電

    。它是應(yīng)對復(fù)雜計算需求的關(guān)鍵技術(shù)之一。 ? 異構(gòu)計算架構(gòu)的核心優(yōu)勢 ? 異構(gòu)計算架構(gòu)的核心要素主要包括多種
    的頭像 發(fā)表于 05-25 01:55 ?4220次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內(nèi)存,32GBEMMC。 四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內(nèi)置NPU RK3588S內(nèi)置NPU,支持INT4/INT8/INT1
    發(fā)表于 05-15 10:36

    超越CPU/GPU:NPU如何讓AI“輕裝上陣”?

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)NPU是一種專門為人工智能(AI計算設(shè)計的處理器,主要用于高效執(zhí)行神經(jīng)網(wǎng)絡(luò)相關(guān)的運算(如矩陣乘法、卷積、激活函數(shù)等)。相較于傳統(tǒng)CPU/
    的頭像 發(fā)表于 04-18 00:05 ?4379次閱讀