91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在數(shù)據(jù)量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據(jù)舞臺中心

新思科技 ? 來源:新思科技 ? 作者:新思科技 ? 2021-04-02 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

軟件一直是智能應(yīng)用領(lǐng)域的創(chuàng)新助推器,而硬件正迅速成為人工智能AI)領(lǐng)域的核心引擎。人臉識別、自動駕駛、虛擬輔助,以及眾多其他應(yīng)用都要依賴AI硬件。預(yù)計(jì)到2025年,AI的市場規(guī)模將達(dá)到650億美元。

神經(jīng)網(wǎng)絡(luò)等并行計(jì)算系統(tǒng)對于能夠處理海量數(shù)據(jù)并執(zhí)行自我迭代訓(xùn)練有著巨大的需求,硬件也因此成為這一領(lǐng)域的主導(dǎo)力量。在這個數(shù)據(jù)量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據(jù)了舞臺中心

AI加速器具有如下眾多優(yōu)勢:

● 能效相較于通用型計(jì)算設(shè)備顯著提高

● 降低計(jì)算延遲以支持實(shí)時應(yīng)用

● 具備可擴(kuò)展性,能夠取得性能速度改善,其程度甚至能與所用的內(nèi)核數(shù)達(dá)成線性擴(kuò)展

● 異構(gòu)架構(gòu)支持系統(tǒng)容納多個專用處理器以執(zhí)行特定任務(wù)

AI加速器支持?jǐn)?shù)據(jù)中心和邊緣

AI加速器主要在兩大領(lǐng)域發(fā)揮作用:數(shù)據(jù)中心和邊緣?,F(xiàn)在的數(shù)據(jù)中心需要大規(guī)模的可拓展計(jì)算架構(gòu),尤其是那些可支持多達(dá)數(shù)千臺物理服務(wù)器和數(shù)百萬臺虛擬機(jī)的超大規(guī)模數(shù)據(jù)中心,對大規(guī)??蓴U(kuò)展計(jì)算架構(gòu)的需求極為迫切,這一市場需求使得一些企業(yè)憑借加速AI工作負(fù)載這一業(yè)務(wù)發(fā)展壯大。例如,Cerebras為Cerebras CS-1深度學(xué)習(xí)系統(tǒng)創(chuàng)造了晶圓級引擎(WSE)。WSE面積為46,225mm2,擁有1.2 萬億個晶體管和40萬個經(jīng)過AI優(yōu)化的內(nèi)核,是迄今為止最大的芯片。WSE可提供更大的算力、存儲和通信帶寬,能夠支持AI研究達(dá)到前所未有的速度和規(guī)模。與之相對的是硬件基板面有限且節(jié)能至為關(guān)鍵的邊緣應(yīng)用。如果邊緣SoC內(nèi)部集成了AI加速器IP ,則它可以快速提供必要的智能功能從而支持各種應(yīng)用,例如智能手機(jī)或自動化工廠機(jī)器人中運(yùn)行的交互式程序。對于在邊緣提供智能應(yīng)用,支持它們的 AI加速器必須經(jīng)過優(yōu)化,以具備諸如實(shí)時計(jì)算延遲、超高能效、失效安全運(yùn)行以及高度可靠性等特征。

并不是所有AI應(yīng)用都需要像WSE這么大的芯片,例如以下類型的硬件AI加速器:

● 能夠執(zhí)行時間神經(jīng)網(wǎng)絡(luò)處理的圖形處理單元 (GPU

● Google張量處理單元 (TPU) 等空間加速器

● Sambanova的DataScale等粗粒度可重構(gòu)計(jì)算架構(gòu) (CGRA)

● 經(jīng)過向量處理擴(kuò)展的大規(guī)模多核標(biāo)量處理器

所有此類芯片均可以幾十個或幾百個組合使用,形成更大的系統(tǒng),處理更大型的神經(jīng)網(wǎng)絡(luò)。比如說,如果將Google的TPU合并到pod配置中,那么可以帶來超過100 petaFLOPS的處理能力來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。NVIDIA旗下應(yīng)用深度學(xué)習(xí)研究團(tuán)隊(duì)推出的Megatron創(chuàng)造了一個帶有83億參數(shù)轉(zhuǎn)換器的語言模型,可提供8路模型并行和64路數(shù)據(jù)并行功能用于自然語言處理。要執(zhí)行這一模型,就必須開發(fā)出具有 312 teraFLOP FP16計(jì)算能力的NVIDIA A100 GPU。另一種新興的硬件類型是 CGRA,它能在編程不同網(wǎng)絡(luò)時,在性能、能效與靈活性方面巧妙地實(shí)現(xiàn)權(quán)衡。

在這場關(guān)于AI硬件的討論中,軟件棧是不容忽視的存在,因?yàn)樗軐?shí)現(xiàn)系統(tǒng)級性能表現(xiàn),并確保充分利用硬件。TensorFlow等開源軟件平臺為開發(fā)人員提供各類工具、庫和其他資源,幫助他們輕松構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用。Facebook Glow等機(jī)器學(xué)習(xí)編譯器不斷涌現(xiàn),有助于促成高級軟件框架與各種AI加速器的連接。

種類全面的AI設(shè)計(jì)產(chǎn)品組合

硬件已經(jīng)成為AI應(yīng)用的關(guān)鍵組件,但此類組件仍然面臨特有的設(shè)計(jì)難題,在云和邊緣應(yīng)用想要突破當(dāng)前硅技術(shù)的功耗、性能和面積(PPA)極限時尤其如此。對數(shù)據(jù)中心來說,件設(shè)計(jì)呈現(xiàn)多級物理分層、局部同步和全局異步架構(gòu)、尺寸龐大和布局分散等特征。在邊緣應(yīng)用中, AI設(shè)計(jì)必須能夠處理數(shù)以百計(jì)的設(shè)計(jì)角,以滿足超低功耗要求,實(shí)現(xiàn)異構(gòu)集成并具備超乎尋常的多變性。

新思科技能夠?yàn)锳I硬件設(shè)計(jì)人員提供業(yè)內(nèi)最為全面的AI設(shè)計(jì)產(chǎn)品組合,幫助他們攻克此類難題。我們的產(chǎn)品,以邊緣設(shè)備IP、Zebu Server 4仿真系統(tǒng),全面輻射整個范圍,并能快速將載復(fù)雜的工作負(fù)載引入到Fusion Design Platform,實(shí)現(xiàn)全流程的、且經(jīng)AI改進(jìn)結(jié)果質(zhì)量(QoR)和結(jié)果轉(zhuǎn)化時間(TTR)的IC設(shè)計(jì)。

新思科技還推出DSO.ai(設(shè)計(jì)空間優(yōu)化AI),這是業(yè)內(nèi)首款針對芯片設(shè)計(jì)的自主AI應(yīng)用。DSO.ai 在非常大的芯片設(shè)計(jì)解決方案范圍內(nèi)尋找優(yōu)化目標(biāo)。它減少了設(shè)計(jì)工作流中自動執(zhí)行的間接決策,從而大幅加快了專用AI加速器的設(shè)計(jì)進(jìn)度。

隨著AI應(yīng)用更加深入地融入我們的生活,AI加速器等硬件將會繼續(xù)發(fā)揮關(guān)鍵作用,實(shí)現(xiàn)實(shí)時響應(yīng),為智能設(shè)備和系統(tǒng)創(chuàng)造更大價值。

原文標(biāo)題:AI加速器,實(shí)現(xiàn)人工智能創(chuàng)新的核心引擎

文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    839

    瀏覽量

    40111
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39866

    瀏覽量

    301513
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50105

    瀏覽量

    265546

原文標(biāo)題:AI加速器,實(shí)現(xiàn)人工智能創(chuàng)新的核心引擎

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AOC光纖跳線在數(shù)據(jù)中心的應(yīng)用與發(fā)展趨勢

    數(shù)據(jù)中心作為信息時代的核心基礎(chǔ)設(shè)施,承擔(dān)著數(shù)據(jù)的存儲、處理和傳輸?shù)戎匾蝿?wù)。隨著云計(jì)算、大數(shù)據(jù)、人工智能技術(shù)的快速發(fā)展,數(shù)據(jù)中心
    的頭像 發(fā)表于 02-25 09:57 ?107次閱讀

    使用NORDIC AI的好處

    ,時延更低,系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定甚至離線時也能繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感數(shù)據(jù)(如運(yùn)動、生理信號)可以
    發(fā)表于 01-31 23:16

    SST開發(fā)加速器:半實(shí)物仿真全鏈路解決方案

    AI算力爆發(fā)的背景下,數(shù)據(jù)中心供電系統(tǒng)面臨巨大挑戰(zhàn)。固態(tài)變壓(SST)以其模塊化、可控性與高功率密度,成為突破傳統(tǒng)供電瓶頸的關(guān)鍵技術(shù)。為
    發(fā)表于 12-11 18:23

    邊緣計(jì)算AI加速器類型與應(yīng)用

    人工智能正在推動對更快速、更智能、更高效計(jì)算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實(shí)際。這正是邊緣計(jì)算AI加速器
    的頭像 發(fā)表于 11-06 13:42 ?822次閱讀
    邊緣計(jì)算<b class='flag-5'>中</b>的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>類型與應(yīng)用

    亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進(jìn)程

    的Agentic AI。入營初創(chuàng)企業(yè)在為期10周的加速,均獲得了亞馬遜云科技提供的技術(shù)資源支持及定制化加速方案,得以在AI領(lǐng)域快速起步。
    的頭像 發(fā)表于 10-29 15:18 ?937次閱讀

    硬件協(xié)同技術(shù)分享 - 任務(wù)劃分 + 自定義指令集

    ),基于CPU的純軟件計(jì)算時間長達(dá)10秒以上。這意味著該模塊需要通過硬件加速器來實(shí)現(xiàn)。 我們的設(shè)計(jì)將硬件加速器掛載到SoC外圍總線上,自動獲取麥克風(fēng)的數(shù)值計(jì)算并輸出數(shù)據(jù)到FIFO
    發(fā)表于 10-28 08:03

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴(kuò)展數(shù)字孿生平臺庫,加速 AI 數(shù)據(jù)中心部署與運(yùn)營

    人員將能夠在 AI 工廠的構(gòu)建中輕松部署世界領(lǐng)先的 AI 加速器。作為一款創(chuàng)新解決方案,Cadence Reality Digital Twin Platform 能夠在物理實(shí)施之前,根據(jù)特定服務(wù)等級協(xié)議對
    的頭像 發(fā)表于 09-15 15:19 ?1515次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    Transformer和視覺Transformer模型。 ViTA是一種高效數(shù)據(jù)AI加速器,用于在邊緣設(shè)備上部署計(jì)算密集型視覺Transformer模型。 2、射頻神經(jīng)網(wǎng)絡(luò) 2.1線性射頻模擬處理
    發(fā)表于 09-12 17:30

    Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴(kuò)展 NVMe? RAID 存儲解決方案

    ,專為NVMe部署而設(shè)計(jì)。該系列加速器尤其適用于現(xiàn)代人工智能數(shù)據(jù)中心環(huán)境。在此類環(huán)境加速訪問
    的頭像 發(fā)表于 08-06 16:31 ?1.9w次閱讀
    Microchip推出Adaptec? SmartRAID 4300 系列<b class='flag-5'>加速器</b> 提供安全的可擴(kuò)展 NVMe? RAID 存儲解決方案

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中扮演著至關(guān)重要的角色,它通過深度解析PCIe總線的物理層、鏈路層、事務(wù)層及應(yīng)用層協(xié)議,幫助運(yùn)維人員、硬件工程師和系統(tǒng)架構(gòu)師優(yōu)化性能、診斷故障、驗(yàn)證設(shè)計(jì)合規(guī)性,并提
    發(fā)表于 07-29 15:02

    PCIe協(xié)議分析儀能測試哪些設(shè)備?

    /ASIC加速器 測試場景:分析專用AI推理加速器與主系統(tǒng)的PCIe通信,優(yōu)化數(shù)據(jù)傳輸和指令下發(fā)效率。 應(yīng)用價值:提高推理吞吐
    發(fā)表于 07-25 14:09

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境對帶電粒子(如電子、質(zhì)子、離子)進(jìn)行加速和控制,使其獲得高能量的特種裝置。粒
    的頭像 發(fā)表于 06-19 12:05 ?3640次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    是德科技推出AI數(shù)據(jù)中心構(gòu)建

    的工作負(fù)載模擬功能將大型語言模型(LLM)和其他人工智能(AI)模型訓(xùn)練工作負(fù)載集成到AI基礎(chǔ)設(shè)施組件的設(shè)計(jì)和驗(yàn)證——包括網(wǎng)絡(luò)、主機(jī)和加速器。該解決方案實(shí)現(xiàn)了
    的頭像 發(fā)表于 04-07 11:06 ?1010次閱讀

    適用于數(shù)據(jù)中心AI時代的800G網(wǎng)絡(luò)

    100Gbps,整體速率高達(dá)800Gbps。這意味著在AI模型訓(xùn)練過程,服務(wù)之間的數(shù)據(jù)傳輸速率更快,顯著提升訓(xùn)練效率。相比NRZ,PAM4在相同頻譜范圍內(nèi)可以承載雙倍
    發(fā)表于 03-25 17:35

    小型加速器中子源監(jiān)測系統(tǒng)解決方案

    小型加速器中子源是一種基于先進(jìn)加速器技術(shù)的中子產(chǎn)生裝置,憑借體積小、成本低、安全性高的優(yōu)勢,在醫(yī)學(xué)、工業(yè)、科研、安全、能源多個領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價值。無論是用于醫(yī)學(xué)領(lǐng)域的精準(zhǔn)
    的頭像 發(fā)表于 03-13 11:19 ?1409次閱讀
    小型<b class='flag-5'>加速器</b>中子源監(jiān)測<b class='flag-5'>系統(tǒng)</b>解決方案