91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-02-03 17:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報(bào)道,在人工智能迅猛發(fā)展的當(dāng)下,AI推理芯片需求正呈爆發(fā)式增長。

AI推理,即支撐如ChatGPT這類AI模型響應(yīng)用戶問題和請求的計(jì)算過程。過去,英偉達(dá)在訓(xùn)練大型AI模型所需芯片領(lǐng)域占據(jù)主導(dǎo),其GPU憑借強(qiáng)大的海量數(shù)據(jù)處理能力,成為全球AI爆炸式增長的重要基石。但隨著AI不斷演進(jìn),重點(diǎn)正從大規(guī)模訓(xùn)練轉(zhuǎn)向?qū)σ延?xùn)練模型的推理和推斷,推理已然成為新的競爭戰(zhàn)場。業(yè)內(nèi)普遍分析,到2026年,全球AI推理需求將超越AI訓(xùn)練場景。

推理與訓(xùn)練對芯片要求差異明顯。訓(xùn)練側(cè)重海量數(shù)據(jù)處理,推理則對內(nèi)存需求更高,因芯片需花更多時(shí)間從內(nèi)存獲取數(shù)據(jù)。英偉達(dá)和AMD的GPU依賴外部內(nèi)存,這會(huì)增加處理時(shí)間,降低用戶與聊天機(jī)器人交互速度。以O(shè)penAI為例,其用于生成計(jì)算機(jī)代碼且大力推廣的產(chǎn)品Codex,部分性能不足就歸因于基于英偉達(dá)GPU的硬件。OpenAI首席執(zhí)行官Sam Altman稱,使用其編程模型的客戶愿為編碼速度支付高溢價(jià),為滿足需求,OpenAI最近與Cerebras達(dá)成合作。

自去年起,OpenAI積極尋找GPU替代方案,重點(diǎn)關(guān)注在同一塊硅片上集成大量內(nèi)存(SRAM)的芯片制造商。在每顆芯片上集成更多昂貴的SRAM,能在聊天機(jī)器人等AI系統(tǒng)處理海量用戶請求時(shí)帶來速度優(yōu)勢。

面對推理市場的巨大潛力,其他企業(yè)也紛紛布局。Anthropic的Claude和谷歌的Gemini等競爭產(chǎn)品,更多依賴谷歌自研的TPU進(jìn)行部署。TPU專為推理計(jì)算設(shè)計(jì),性能可能優(yōu)于英偉達(dá)GPU這類通用型AI芯片。

英偉達(dá)也未坐視不理。不久前,它以200億美元收購一家AI推理芯片初創(chuàng)企業(yè)Groq的技術(shù)授權(quán),并將核心團(tuán)隊(duì)招入麾下。Groq專注極致推理,其創(chuàng)始人Jonathan Ross帶領(lǐng)谷歌TPU原班人馬,耗時(shí)七年打造出LPU(語言處理單元)架構(gòu),曾宣稱推理性能是英偉達(dá)H100 GPU的10倍,成本僅為其十分之一。

國內(nèi)企業(yè)同樣在積極布局。曦望董事長徐冰預(yù)計(jì),到2030年,AI推理在整個(gè)AI計(jì)算市場將占80%份額,聚焦極致推理的AI芯片未來爆發(fā)性更強(qiáng)。1月27日,國產(chǎn)GPU廠商曦望發(fā)布新一代推理GPU芯片——啟望S3。這款專為大模型推理打造的定制化GPGPU芯片,在典型推理場景下,整體性價(jià)比較上一代提升超10倍。在算力與存儲(chǔ)設(shè)計(jì)上,支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4倍,有效緩解大模型推理的顯存瓶頸,成為國內(nèi)首款采用此顯存方案的芯片。在主流大模型推理中,單位Token成本較上一代降低約90%,極大推動(dòng)了大模型推理的大規(guī)模普惠應(yīng)用。

云天勵(lì)飛自2014年成立便持續(xù)投入AI推理芯片研發(fā),已推出四代基于深度神經(jīng)網(wǎng)絡(luò)架構(gòu)的自研NPU,并基于最新NPU架構(gòu)推出多款芯片,應(yīng)用于端側(cè)與邊緣側(cè)AI推理場景。公司副總裁鄭文先表示,正在研發(fā)的新一代芯片采用GPNPU架構(gòu),既適應(yīng)GPU的CUDA生態(tài),方便客戶模型牽引,又兼顧NPU的高效靈活,成本更具優(yōu)勢,符合未來大模型在端側(cè)與邊緣側(cè)規(guī)模化落地的需求。董事長陳寧博士稱,未來AI需求轉(zhuǎn)向推理,對AI芯片需求也將從訓(xùn)練芯片轉(zhuǎn)向推理芯片,GPNPU架構(gòu)是通用型大算力云端推理芯片架構(gòu)的最優(yōu)解,公司將全力投入大算力AI推理芯片研發(fā),打造極致推理效率和性價(jià)比的大模型云推理芯片。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39691

    瀏覽量

    301294
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10045
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    從英偉達(dá)到博通:OpenAI自研芯片版圖浮出水面,開啟推理效率革命

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)在人工智能大模型訓(xùn)練與推理成本高企、算力需求呈指數(shù)級增長的背景下,OpenAI與Broadcom(博通)于10月正式宣布達(dá)成一項(xiàng)史無前例的戰(zhàn)略合作:共同部
    的頭像 發(fā)表于 10-15 09:05 ?7854次閱讀
    從英偉達(dá)到博通:<b class='flag-5'>OpenAI</b>自研<b class='flag-5'>芯片</b>版圖浮出水面,開啟<b class='flag-5'>推理</b>效率革命

    Meta與NVIDIA達(dá)成多年戰(zhàn)略合作伙伴關(guān)系

    NVIDIA 今天宣布與 Meta 達(dá)成一項(xiàng)多年期、跨多代產(chǎn)品的戰(zhàn)略合作伙伴關(guān)系,涵蓋本地部署、云計(jì)算和 AI 基礎(chǔ)設(shè)施。
    的頭像 發(fā)表于 03-02 14:46 ?238次閱讀

    軟通動(dòng)力榮膺河南移動(dòng)2025年DICT金牌合作伙伴

    近日,以“金彩同行 智賦未來”為主題的河南移動(dòng)2025年DICT金牌合作伙伴交流暨AI+領(lǐng)域合作能力展示大會(huì)在鄭州舉行。作為河南移動(dòng)核心合作伙伴,軟通動(dòng)力受邀出席,并憑借在DICT領(lǐng)域
    的頭像 發(fā)表于 12-25 10:50 ?387次閱讀
    軟通動(dòng)力榮膺河南移動(dòng)2025年DICT金牌<b class='flag-5'>合作伙伴</b>

    軟通動(dòng)力榮膺螞蟻數(shù)科“領(lǐng)航AI Agent合作伙伴

    12月11日,首屆螞蟻數(shù)科生態(tài)合作伙伴大會(huì)在蘇州召開。大會(huì)以“與AI同行· 價(jià)值共生”為主題,匯聚數(shù)字科技產(chǎn)業(yè)鏈核心力量,共探AI大模型產(chǎn)業(yè)落地路徑與生態(tài)協(xié)同機(jī)遇,軟通動(dòng)力高級副總裁霍宇受邀出席會(huì)議
    的頭像 發(fā)表于 12-12 21:52 ?1310次閱讀

    AI推理需求爆發(fā)!高通首秀重磅產(chǎn)品,國產(chǎn)GPU的自主牌怎么打?

    推出,直接推動(dòng)AI推理市場的上揚(yáng),未來3-5年都是AI推理領(lǐng)域的規(guī)模應(yīng)用階段。不管是行業(yè)應(yīng)用,還是算力相關(guān)的芯片,都將大規(guī)模的圍繞
    的頭像 發(fā)表于 10-30 00:46 ?1.4w次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>需求</b><b class='flag-5'>爆發(fā)</b>!高通首秀重磅產(chǎn)品,國產(chǎn)GPU的自主牌怎么打?

    利爾達(dá)亮相2025中國移動(dòng)全球合作伙伴大會(huì),共創(chuàng)AI+時(shí)代新生態(tài)

    //10月10日至12日,以“碳硅共生合創(chuàng)AI+時(shí)代”為主題的2025中國移動(dòng)全球合作伙伴大會(huì)在廣州保利世貿(mào)博覽館盛大召開。作為中國移動(dòng)的重要合作伙伴之一,利爾達(dá)攜多款明星產(chǎn)品與解決方案驚艷亮相
    的頭像 發(fā)表于 10-16 09:03 ?720次閱讀
    利爾達(dá)亮相2025中國移動(dòng)全球<b class='flag-5'>合作伙伴</b>大會(huì),共創(chuàng)<b class='flag-5'>AI</b>+時(shí)代新生態(tài)

    AI業(yè)界新聞:OpenAI官宣自研首顆芯片 黃仁勛時(shí)隔9年再次給馬斯克“送貨”

    設(shè)計(jì)、博通負(fù)責(zé)制造與系統(tǒng)集成。博通與OpenAI已經(jīng)簽署戰(zhàn)略合作,OpenAI與博通就共同開發(fā)和供應(yīng)AI芯片達(dá)成了長期協(xié)議。 據(jù)悉,這是一款
    的頭像 發(fā)表于 10-14 18:42 ?1909次閱讀

    NVIDIA攜手OpenAI構(gòu)建AI基礎(chǔ)設(shè)施

    NVIDIA 首席執(zhí)行官黃仁勛、OpenAI 首席執(zhí)行官 Sam Altman 和 OpenAI 總裁 Greg Brockman 宣布了一項(xiàng)新的合作伙伴關(guān)系,旨在推動(dòng) OpenAI
    的頭像 發(fā)表于 09-23 14:38 ?905次閱讀

    SILEX希來科與QUALCOMM高通公司長達(dá)15年的戰(zhàn)略合作伙伴關(guān)系 高通認(rèn)證開發(fā)合作伙伴~高通官網(wǎng)能找到silex希來科

    2005年起一直從事高通創(chuàng)銳訊無線局域網(wǎng)/藍(lán)牙模塊的開發(fā)、銷售和支持。 響應(yīng)客戶需求,以自己公司的工廠和合作伙伴之間的協(xié)作構(gòu)建起供應(yīng)鏈,以“追求不掉線的無線”為目標(biāo),執(zhí)著于品質(zhì)的提升,并以一家足以將這些
    發(fā)表于 08-28 23:33

    SILEX希來科與高通公司長達(dá)15年的戰(zhàn)略合作伙伴關(guān)系 高通認(rèn)證開發(fā)合作伙伴

    SILEX希來科與高通公司長達(dá)15年的戰(zhàn)略合作伙伴關(guān)系 高通認(rèn)證開發(fā)合作伙伴
    的頭像 發(fā)表于 08-27 11:23 ?1884次閱讀

    AI+新能源,共創(chuàng)多贏!易事特集團(tuán)2025數(shù)字能源合作伙伴聯(lián)席大會(huì)圓滿舉行

    近日,中原腹地鄭州迎來了一場以“AI+新能源攜手創(chuàng)未來”為主題的行業(yè)盛會(huì)——2025易事特?cái)?shù)字能源合作伙伴聯(lián)席大會(huì)。易事特集團(tuán)數(shù)字能源核心團(tuán)隊(duì)繼在北京成功舉辦合作伙伴大會(huì)之后,再度集結(jié)行業(yè)合作
    的頭像 發(fā)表于 07-02 10:37 ?937次閱讀
    <b class='flag-5'>AI</b>+新能源,共創(chuàng)多贏!易事特集團(tuán)2025數(shù)字能源<b class='flag-5'>合作伙伴</b>聯(lián)席大會(huì)圓滿舉行

    2025聯(lián)想中國合作伙伴大會(huì)圓滿舉辦

    近日,“同心同行 弄潮AI新時(shí)代”為主題的2025聯(lián)想中國合作伙伴大會(huì)在上海圓滿舉辦。聯(lián)想重磅宣布,面向合作伙伴的大聯(lián)想4.0迎來重大升級,發(fā)布總額超10億元的合作伙伴激勵(lì)計(jì)劃。
    的頭像 發(fā)表于 05-12 11:14 ?1130次閱讀

    亞馬遜云科技發(fā)布“3+2”合作伙伴戰(zhàn)略 與合作伙伴加速前行

    北京 ——2025 年 4 月 25 日 在亞馬遜云科技中國合作伙伴峰會(huì)上,亞馬遜云科技發(fā)布“3+2”合作伙伴戰(zhàn)略,聚焦全行業(yè)轉(zhuǎn)型、生成式AI、云遷移和現(xiàn)代化三大業(yè)務(wù)戰(zhàn)略,并通過亞馬遜云
    發(fā)表于 04-25 14:43 ?1010次閱讀
    亞馬遜云科技發(fā)布“3+2”<b class='flag-5'>合作伙伴</b>戰(zhàn)略 與<b class='flag-5'>合作伙伴</b>加速前行

    AI驅(qū)動(dòng)生態(tài)升級 螢石2025渠道合作伙伴大會(huì)擘畫智能家居新藍(lán)圖

    3月29日,以“AI聚力智拓新局”為主題的2025螢石渠道合作伙伴大會(huì)在紹興隆重舉行。這場匯聚全國1000余位合作伙伴的行業(yè)盛會(huì),不僅是對2024年螢石卓越成績的復(fù)盤,更是面向AI時(shí)代
    的頭像 發(fā)表于 03-29 20:14 ?1277次閱讀
    <b class='flag-5'>AI</b>驅(qū)動(dòng)生態(tài)升級 螢石2025渠道<b class='flag-5'>合作伙伴</b>大會(huì)擘畫智能家居新藍(lán)圖

    研華科技亮相華為中國合作伙伴大會(huì)2025

    作為華為重要的APN合作伙伴,研華受邀參與“華為中國合作伙伴大會(huì)”,展示了基于昇騰310P平臺(tái)打造的邊緣AI解決方案及產(chǎn)品。
    的頭像 發(fā)表于 03-26 14:39 ?1237次閱讀