91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云天勵(lì)飛出席GAIR 2025 AI算力新十年專場(chǎng)

云天勵(lì)飛 ? 來源:云天勵(lì)飛 ? 2025-12-22 09:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

12月13日,GAIR 2025「AI 算力新十年」專場(chǎng)在深圳舉行。作為國內(nèi)前沿技術(shù)與產(chǎn)業(yè)變革的重要風(fēng)向標(biāo),GAIR大會(huì)歷經(jīng)七屆積淀,見證并推動(dòng)了中國 AI 產(chǎn)業(yè)從算法突破、硬件迭代,到商業(yè)落地的完整過程。本屆論壇直面智能體系的底層核心——算力,從架構(gòu)、生態(tài)、工具鏈到產(chǎn)業(yè)化落地,探尋未來十年的關(guān)鍵變量。

云天勵(lì)飛副總裁羅憶出席并發(fā)表主題演講,圍繞大模型從“訓(xùn)練競(jìng)賽”走向“推理規(guī)模化”的產(chǎn)業(yè)拐點(diǎn),分享了面向推理時(shí)代的關(guān)鍵判斷與實(shí)踐思考。

羅憶指出,過去幾年行業(yè)主要通過更大算力、更大數(shù)據(jù)、更大參數(shù)推動(dòng)智能上限持續(xù)提升,但隨著應(yīng)用從簡(jiǎn)單問答走向長(zhǎng)上下文、工具調(diào)用與更復(fù)雜的智能體形態(tài),產(chǎn)業(yè)關(guān)注點(diǎn)正在發(fā)生遷移:不再止步于“把模型煉得更強(qiáng)”,而是更強(qiáng)調(diào)“把推理做得更便宜、更穩(wěn)定、更可規(guī)模化交付”。

在這一背景下,大模型應(yīng)用面臨的核心挑戰(zhàn)正逐步呈現(xiàn)為“經(jīng)濟(jì)學(xué)困境”——模型規(guī)模擴(kuò)大帶來的算力與帶寬成本上升具有明顯的放大效應(yīng),只有通過稀疏化、蒸餾、量化等技術(shù)與工程優(yōu)化持續(xù)降低門檻,AI 才可能從“高成本探索”走向“規(guī)?;栈荨?。

圍繞推理時(shí)代的衡量標(biāo)準(zhǔn),羅憶進(jìn)一步強(qiáng)調(diào),競(jìng)爭(zhēng)指標(biāo)不應(yīng)僅停留在芯片的理論算力峰值,而應(yīng)回到“單位投入能夠產(chǎn)出多少有效 token”。

這意味著,系統(tǒng)瓶頸往往不在算力本身,而在內(nèi)存與互連帶寬,以及由此帶來的算力等待與利用率下降;在相近硬件條件下,誰能提升 MFU(算力/模型利用率)、減少無效等待,誰就更有機(jī)會(huì)把單位 token 成本攤薄到更具商業(yè)可行性的區(qū)間,從而支撐推理應(yīng)用的規(guī)?;涞亍?/p>

在國產(chǎn) AI 推理芯片的發(fā)展方向上,羅憶提出三點(diǎn)思路:一是加強(qiáng)軟件生態(tài)兼容,在更好承接算法迭代的同時(shí)提升算力利用效率;二是突破存儲(chǔ)與帶寬相關(guān)瓶頸,積極支持 3D memory 等技術(shù)路線;三是面向異構(gòu)計(jì)算持續(xù)優(yōu)化整體性價(jià)比,以更可持續(xù)的成本結(jié)構(gòu)推動(dòng)應(yīng)用滲透。

他同時(shí)表示,行業(yè)的共同目標(biāo)應(yīng)是讓推理服務(wù)的成本持續(xù)下探,并在未來三到五年推動(dòng)“百萬 token 成本降至 1 元以內(nèi)”成為可觸達(dá)的目標(biāo)區(qū)間,從而更好支撐“人工智能+”在千行百業(yè)的普及。

云天勵(lì)飛自2014年成立以來,一直堅(jiān)持算法與芯片的協(xié)同迭代,聚焦推理場(chǎng)景推動(dòng)技術(shù)與產(chǎn)品的持續(xù)演進(jìn)。目前,公司正探索面向云端推理的新型架構(gòu)方向——GPNPU,力求在兼顧通用性與效率的同時(shí),最大限度降低開發(fā)和遷移的門檻。

面向推理規(guī)模化的新階段,云天勵(lì)飛將繼續(xù)以“更高效、更普惠的推理算力”為目標(biāo),推動(dòng)從芯片到系統(tǒng)再到交付的工程能力建設(shè),與產(chǎn)業(yè)伙伴共同完善生態(tài)與應(yīng)用路徑,讓算力投入更高效地轉(zhuǎn)化為可度量、可復(fù)制的業(yè)務(wù)價(jià)值,形成從“算力基建”到“價(jià)值閉環(huán)”的正向循環(huán)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301304
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1527

    瀏覽量

    16739
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3647

    瀏覽量

    5176

原文標(biāo)題:GAIR 2025|從訓(xùn)練競(jìng)賽到推理經(jīng)濟(jì)學(xué),AI 算力進(jìn)入新十年變量期

文章出處:【微信號(hào):IntelliFusion2,微信公眾號(hào):云天勵(lì)飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百億Token一分錢!云天勵(lì)飛喊出“推理成本萬倍降”,公布三三芯路線圖

    勵(lì)飛再次闡述了GPNPU架構(gòu)的技術(shù)內(nèi)涵,并公開了未來三芯片路線圖,致力于成為“最懂AI的推理芯片領(lǐng)軍企業(yè)”。 ? GPNPU:打造中
    的頭像 發(fā)表于 02-09 14:54 ?4285次閱讀
    百億Token一分錢!<b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b>飛喊出“推理成本萬倍降”,公布三<b class='flag-5'>年</b>三芯路線圖

    云天勵(lì)飛正式舉辦大芯片戰(zhàn)略前瞻會(huì)

    2月3日,云天勵(lì)飛正式舉辦“大芯片戰(zhàn)略前瞻會(huì)”,首次對(duì)外公布未來三的大
    的頭像 發(fā)表于 02-06 17:23 ?3642次閱讀

    力爭(zhēng)百萬 Tokens 推理成本降低百倍:云天勵(lì)飛發(fā)布未來三芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    2月3日,云天勵(lì)飛正式舉辦“大芯片戰(zhàn)略前瞻會(huì)”,首次對(duì)外公布未來三的大
    的頭像 發(fā)表于 02-03 20:25 ?1928次閱讀
    力爭(zhēng)百萬 Tokens 推理成本降低百倍:<b class='flag-5'>云天</b><b class='flag-5'>勵(lì)</b>飛發(fā)布未來三<b class='flag-5'>年</b>大<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片戰(zhàn)略,首曝 DeepVerse 路線圖

    奇異摩爾入選2025度上海產(chǎn)業(yè)大經(jīng)典案例

    了智產(chǎn)業(yè)鏈的眾多知名企業(yè)與行業(yè)專家,共同探討產(chǎn)業(yè)發(fā)展新趨勢(shì)。會(huì)上,主辦方正式頒布了2025度上海
    的頭像 發(fā)表于 12-25 09:34 ?556次閱讀

    AI教父Hinton對(duì)話云天勵(lì)飛陳寧

    在大模型步入深水區(qū)的當(dāng)下,AI 的下一個(gè)臨界點(diǎn)究竟在哪里?在 2025 GIS 全球創(chuàng)新峰會(huì)現(xiàn)場(chǎng),深度學(xué)習(xí)奠基人、“AI 教父” Geoffrey Hinton 與云天
    的頭像 發(fā)表于 12-03 14:04 ?689次閱讀

    云天勵(lì)飛亮相2025中國國際半導(dǎo)體博覽會(huì)

    202511月23日,第二十二屆中國國際半導(dǎo)體博覽會(huì)(IC China 2025)在北京國家會(huì)議中心啟幕。在24日舉辦的 “人工智能及大模型芯片論壇” 上,云天
    的頭像 發(fā)表于 11-25 11:29 ?687次閱讀

    云天勵(lì)飛與金蝶達(dá)成戰(zhàn)略合作

    11月4日,在2025金蝶全球創(chuàng)見者大會(huì)上,云天勵(lì)飛與金蝶簽署戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 11-05 18:09 ?1666次閱讀

    云天勵(lì)飛出席第二屆灣區(qū)半導(dǎo)體產(chǎn)業(yè)投融資戰(zhàn)略發(fā)展論壇

    2025灣芯展同期舉辦的第二屆灣區(qū)半導(dǎo)體產(chǎn)業(yè)投融資戰(zhàn)略發(fā)展論壇上,云天勵(lì)飛董事長(zhǎng)兼CEO陳寧受邀出席并發(fā)表演講。
    的頭像 發(fā)表于 10-27 10:02 ?712次閱讀

    需求狂飆下的“效率競(jìng)賽”,國產(chǎn)AI芯片有何破局之道?

    %,同比上升12.8個(gè)百分點(diǎn)。 10月15日,在2025灣芯展上,云天勵(lì)飛副總裁羅憶給現(xiàn)場(chǎng)聽眾帶來《打造智時(shí)代的新質(zhì)生產(chǎn)》演講,他現(xiàn)場(chǎng)提
    的頭像 發(fā)表于 10-19 01:11 ?9800次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>需求狂飆下的“效率競(jìng)賽”,國產(chǎn)<b class='flag-5'>AI</b>芯片有何破局之道?

    云天勵(lì)飛亮相2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)

    2025灣區(qū)半導(dǎo)體產(chǎn)業(yè)生態(tài)博覽會(huì)(灣芯展)上,云天勵(lì)飛以“積木”為核心理念,攜全棧AI推理
    的頭像 發(fā)表于 10-16 17:45 ?998次閱讀

    云天勵(lì)飛正式加入OISA生態(tài)

    近日,云天勵(lì)飛正式加入 OISA 生態(tài),攜手產(chǎn)業(yè)伙伴共同推動(dòng)國產(chǎn) AI 芯片互聯(lián)體系建設(shè),為中國生態(tài)注入新的動(dòng)力。
    的頭像 發(fā)表于 10-11 13:59 ?640次閱讀

    云天勵(lì)飛亮相2025全球AI芯片峰會(huì)

    9 月 17 日,全球 AI 芯片峰會(huì)在上海舉行,云天勵(lì)飛董事長(zhǎng)兼 CEO 陳寧出席并發(fā)表演講。
    的頭像 發(fā)表于 09-17 17:56 ?1363次閱讀

    云天勵(lì)飛亮相SEMI-e 2025深圳國際半導(dǎo)體展

    9月10日,SEMI-e深圳國際半導(dǎo)體展暨2025集成電路產(chǎn)業(yè)創(chuàng)新展在深圳舉行。云天勵(lì)飛受邀出席同期舉辦的“端側(cè)AI芯片新架構(gòu)與新應(yīng)用專題研
    的頭像 發(fā)表于 09-12 14:31 ?1694次閱讀

    2025端側(cè)AI芯片爆發(fā):存一體、非Transformer架構(gòu)誰主浮沉?邊緣計(jì)算如何選型?

    各位技術(shù)大牛好!最近WAIC 2025上端側(cè)AI芯片密集發(fā)布,徹底打破傳統(tǒng)困局。各位大佬在實(shí)際項(xiàng)目中都是如何選型的呢?
    發(fā)表于 07-28 14:40

    云天勵(lì)飛出席2025亞布力論壇創(chuàng)新年會(huì)

    近日,2025 亞布力論壇第十一屆創(chuàng)新年會(huì)在杭州開幕,云天勵(lì)飛董事長(zhǎng)兼 CEO 陳寧博士受邀出席,分享了他對(duì)未來 AI 產(chǎn)業(yè)化發(fā)展的趨勢(shì)研判
    的頭像 發(fā)表于 07-10 11:36 ?1224次閱讀