91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

爆紅智能AI如何看待DPU

芯啟源 ? 來源:芯啟源 ? 2023-02-10 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上線僅2個月,OpenAI的最新一代產品-AI聊天機器人ChatGPT月活用戶接近1億。

作為自然語言處理(NLP)領域的前沿研究成果之一,ChatGPT已成為AIGC里程碑式的產品。

這周我們也與ChatGPT聊了聊他/她對大規(guī)模預訓練背后所需資源的看法。

讓我們一起來看看ChatGPT的回答是否能讓你滿意呢?

9f63de06-a8df-11ed-bfe3-dac502259ad0.png

9f8cfb56-a8df-11ed-bfe3-dac502259ad0.png

9fb5eda4-a8df-11ed-bfe3-dac502259ad0.png

強大的語言生成能力現(xiàn)在引起更多討論的是規(guī)模預訓練。在過去的很長一段時間里,許多的AI廠商都是通過本地設備來進行訓練的。

GPT-3所訓練的參數(shù)約為1750億個,這部分需要大量的算力,而目前我們已知ChatGPT導入了至少1萬顆英偉達高端GPU來訓練模型。

a0011ebe-a8df-11ed-bfe3-dac502259ad0.png

a01a0bf4-a8df-11ed-bfe3-dac502259ad0.png

a034200c-a8df-11ed-bfe3-dac502259ad0.png

業(yè)界部分專家認為GPT-4訓練參數(shù)可能會達到100萬億個參數(shù),如此大規(guī)模、長時間的GPU集群訓練任務,也對網絡互聯(lián)底座的性能、可靠性、成本等各方面都提出了極致的要求。

面對千億、萬億參數(shù)規(guī)模的大模型訓練,僅僅是單次計算迭代內梯度同步需要的通信量就高達TB量級。此外還有各種并行模式、加速框架引入的通信需求,使得傳統(tǒng)低速網絡的帶寬遠遠無法支撐GPU集群的高效計算,甚至成為了其中關鍵的瓶頸。

因此要充分發(fā)揮GPU計算資源的強大算力,必須構建一個全新的高性能網絡底座,用高速網絡的大帶寬來助推整個集群計算的高效率。

a0b178ae-a8df-11ed-bfe3-dac502259ad0.png

a0e8cb24-a8df-11ed-bfe3-dac502259ad0.png

CPU+GPU的異構計算模型已經成為高性能計算領域中的主流計算架構。而高吞吐、低延時是高性能計算場景中最為迫切的應用需求。

a124efc8-a8df-11ed-bfe3-dac502259ad0.png

a14629cc-a8df-11ed-bfe3-dac502259ad0.png

a1dac668-a8df-11ed-bfe3-dac502259ad0.png

我們可以知道,GPUDirect RDMA是RDMA在異構計算場景中的應用延伸,使得GPU之間的通信不在依賴CPU轉發(fā),從而進一步提升高性能計算場景中整體算力。

從DPU芯片的實現(xiàn)角度看,不同DPU廠商的核心競爭壁壘在于專用加速引擎的硬件實現(xiàn)上。由于DPU是數(shù)據(jù)中心中所有服務器的流量入口,并以處理報文的方式處理數(shù)據(jù),在網絡芯片領域積累更多的廠商將更有優(yōu)勢。

a1fea060-a8df-11ed-bfe3-dac502259ad0.png

傳統(tǒng)的GPU在訪問存儲時,需要將數(shù)據(jù)先搬移到系統(tǒng)內存,再由系統(tǒng)內存搬移到目標設備。而采用DPU介入后可以繞過CPU,直接通過PCIe訪問遠端的NVMe設備,加速AI訓練,大大降低CPU的開銷。

在AI/ML領域的工作負載對于存儲系統(tǒng)的要求十分苛刻,目前此類應用已主要采用全閃存存儲,其中NVMe全閃存逐漸成為主流趨勢。同時存儲與前端應用主機的網絡存儲協(xié)議開始采用NVMe over Fabrics(NVMe-oF)。

NVMe-oF是一種存儲網絡協(xié)議,通過網絡將NVMe命令傳送到遠程NVMe子系統(tǒng),以利用NVMe 全閃存的并行訪問和低延遲,該規(guī)范定義了一個協(xié)議接口,旨在與高性能fabric技術配合使用,包括通過實現(xiàn)RDMA技術的InfiniBand、RoCE v2、iWARP或TCP。

NVMe-oF是一種使用NVMe協(xié)議將訪問擴展到遠程存儲系統(tǒng)的非易失性存儲器(NVM)設備的方法。這使得前端接口能夠連接到存儲系統(tǒng)中,擴展到大量NVMe設備,并延長數(shù)據(jù)中心內可以訪問NVMe子系統(tǒng)的距離。NVMe-oF的目標是顯著改善數(shù)據(jù)中心網絡延遲,并為遠程NVMe設備提供近似于本地訪問的延遲,目標為10us。

我們知道AI對計算的需求非常大,目前主流的AI加速還是以GPU、FPGA和一些專門的AI芯片等為主。在GPU、AI芯片用于AI計算之前都是CPU承擔計算的任務,CPU的效率難以滿足需求,從而產生CPU+GPU+ASIC的異構計算。隨著DPU的出現(xiàn),這種異構計算的發(fā)展更加徹底,可以更大提供并行處理能力,適合大規(guī)模計算的發(fā)展。

a217cd2e-a8df-11ed-bfe3-dac502259ad0.png

支持Chiplet技術的超異構算力芯片,伴隨著AI/ML的發(fā)展將會得到更好的應用,而支持Die-To-Die互聯(lián)技術將能夠提供互聯(lián)其他AI芯片和算力單元的巨大能力,擺脫一直以來PCIe發(fā)展的限制。 ??拿芯啟源自身舉例,以支持高級AI為主要目標之一的芯啟源最新的DPU芯片,其架構中就應用Chiplet技術。不僅提升了自有智能網卡的性能,通過支持與第三方芯片的Die-To-Die互聯(lián),還可以集成更多的特定專業(yè)領域的芯片,比如AI訓練中的GPU芯片。

雖然PCIe非常的標準,但是帶寬非常有限的,PCIe Gen3的理論帶寬是32GB/s,PCIe Gen4的理論帶寬是64GB/s,而實測帶寬大概分別是24GB/s和48GB/s。

在AI訓練中,每完成一輪計算,都要同步更新一次參數(shù),也就是權系數(shù)。模型規(guī)模越大,參數(shù)規(guī)模一般也會更大,這樣算力芯片的效率會收到PCIe架構的限制,支持更高能力層次的互聯(lián)技術講徹底解決帶寬限制和瓶頸,極大提升單節(jié)點計算效率。

和ChatGPT聊了那么多,最后再讓我們來看看他/她對于DPU應用了解多少呢?

a2a5aea0-a8df-11ed-bfe3-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40246

    瀏覽量

    301854
  • DPU
    DPU
    +關注

    關注

    0

    文章

    415

    瀏覽量

    27075
  • chiplet
    +關注

    關注

    6

    文章

    496

    瀏覽量

    13622

原文標題:爆紅智能AI如何看待DPU ChatGPT這樣說

文章出處:【微信號:corigine,微信公眾號:芯啟源】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    OpenClaw火 潤和軟件面向行業(yè)的AI智能體專家,不止于“養(yǎng)龍蝦”

    OpenClaw的火,標志著AI正加速從“大語言模型”向“智能體”范式躍遷。作為面向行業(yè)的專業(yè)數(shù)智科技服務商,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)深耕企業(yè)數(shù)字化服務二十余載,已構建起從
    的頭像 發(fā)表于 03-16 17:52 ?1195次閱讀
    OpenClaw<b class='flag-5'>爆</b>火 潤和軟件面向行業(yè)的<b class='flag-5'>AI</b><b class='flag-5'>智能</b>體專家,不止于“養(yǎng)龍蝦”

    基于DPU智能盤框方案,華為如何大幅提升AI推理的效率?

    DPU
    腦極體
    發(fā)布于 :2026年01月20日 12:53:10

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設的產品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI分析與處理。CPU: 雙核A53,主要負責
    發(fā)表于 12-19 13:44

    電子寵物“賣了”,網“摩突突”BOM成本僅20多元

    平臺數(shù)據(jù)顯示,三季度電子寵物品類成交額同比增幅超250%,其中帶智能交互功能的產品占比達72%。進入“雙十一”購物節(jié),這一熱度進一步攀升,某品牌AI機器小狗預售量突破10萬臺,較去年同期增長300%。在電子寵物“賣”的熱潮下,
    的頭像 發(fā)表于 11-09 03:11 ?6565次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務為 AI 數(shù)據(jù)存儲、網絡和安全帶來突破性的加速。
    的頭像 發(fā)表于 11-03 14:48 ?1050次閱讀

    AI賦能6G與衛(wèi)星通信:開啟智能天網新時代

    的\"天網\"更加智能、可靠和高效。 AI驅動的網絡優(yōu)化:讓6G網絡\"聰明\"起來 想象一下,當城市中突然出現(xiàn)大型活動,如體育賽事或音樂節(jié),6G網絡如何應對激增的用戶
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    可以被稱為第一人稱視角。 第一人稱視角:指一個實體本身在觀察或經歷事物時,所能夠看到或感知到的角度。 二、AI感知技術與芯片 具身智能3個層次組成:感知層、認知層和決策行動層。 感知層: 感知層是具身
    發(fā)表于 09-18 11:45

    在學習D13的芯片配置,為什么我vscode,一堆,看著好煩,有沒有解決辦法

    在學習D13的芯片配置,為什么我vscode,一堆,看著好煩,有沒有解決辦法
    發(fā)表于 08-22 20:02

    利用NVIDIA DPU重塑網絡安全格局

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網絡、存儲和安全等領域的創(chuàng)新突破。
    的頭像 發(fā)表于 08-20 14:31 ?1424次閱讀

    AI 邊緣計算網關:開啟智能新時代的鑰匙?—龍興物聯(lián)

    在數(shù)字化浪潮的當下,AI 邊緣計算網關正逐漸嶄露頭角,成為眾多行業(yè)轉型升級的關鍵力量。它宛如一座智能橋梁,一端緊密連接著各類物理設備,如傳感器、攝像頭、工業(yè)機器等,負責收集豐富的數(shù)據(jù)信息;另一端則
    發(fā)表于 08-09 16:40

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(NLP)、深度
    發(fā)表于 07-16 15:29

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網絡即可實現(xiàn)智能功能的特性,在一些網絡條件受限或對數(shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    達實智能如何看待行業(yè)的發(fā)展

    智能化行業(yè)發(fā)展如何?在行業(yè)深耕30載的達實智能如何看待行業(yè)的發(fā)展?全新系列“劉磅解碼智能化”已上線,達實智能董事長劉磅將與大家分享
    的頭像 發(fā)表于 06-23 13:48 ?850次閱讀

    第三屆NVIDIA DPU黑客松開啟報名

    碰撞的絕佳機會。本次競賽采用開放式主題,參與者將通過 NVIDIA DOCA 軟件框架構建創(chuàng)新的加速應用程序,充分挖掘 NVIDIA BlueField DPUAI、網絡、存儲和安全等領域的強大潛能。
    的頭像 發(fā)表于 05-27 10:16 ?934次閱讀

    【解構·AI玩具】從“小智AI”引爆開發(fā)者熱潮說起

    一、AI玩具火,“小智AI”引爆全民熱潮 在眾多AI硬件產品當中,AI玩具曾長期被視為邊緣品類,相較于滿足功能性需求的
    發(fā)表于 05-20 09:20 ?2280次閱讀
    【解構·<b class='flag-5'>AI</b>玩具】從“小智<b class='flag-5'>AI</b>”引爆開發(fā)者熱潮說起