2025年11月23日,第二十二屆中國國際半導(dǎo)體博覽會(IC China 2025)在北京國家會議中心啟幕。在24日舉辦的“人工智能及大模型芯片論壇” 上,云天勵飛智算研究院副院長沈宇亮發(fā)表主題演講,深度解析大模型時代推理算力變革趨勢,分享以 GPNPU 創(chuàng)新架構(gòu)為核心的全場景產(chǎn)品布局。
時代變局:推理需求爆發(fā),國產(chǎn)芯片迎戰(zhàn)略機(jī)遇
從AlexNet 開啟深度學(xué)習(xí),到 ChatGPT 引爆大模型革命,AI 已從感知智能邁入認(rèn)知智能,成為第四次工業(yè)革命核心驅(qū)動力。中國憑借數(shù)據(jù)規(guī)模、場景開放與工程化創(chuàng)新三重優(yōu)勢,正緊跟全球技術(shù)前沿,在AI賽道形成獨(dú)特競爭力。
2025年作為“AI Agent 落地元年”,大模型迭代周期壓縮至周甚至小時級,國內(nèi)外主流模型密集升級,開源低成本模型推動 AI 推理規(guī)?;l(fā)展,Token 消耗量指數(shù)級增長,算力需求重心從訓(xùn)練全面轉(zhuǎn)向推理。沈宇亮指出,AI 基礎(chǔ)設(shè)施已進(jìn)入以“高效推理”為核心訴求的算力基建2.0 時代,疊加海外高端 GPU 供應(yīng)受限與 “人工智能 +” 政策支持,國產(chǎn)推理芯片迎來前所未有的機(jī)遇。
技術(shù)破局:GPNPU架構(gòu)實(shí)現(xiàn)“百萬 Token”極致性價比
針對云端推理的性能、成本、精度挑戰(zhàn),云天勵飛創(chuàng)新提出GPNPU(General-Purpose Neural Processing Unit)架構(gòu),核心路徑是融合 GPU 通用性與 NPU 高能效。以 “算力積木” 設(shè)計(jì)和 3D 堆疊存儲為核心創(chuàng)新,聚焦提升 “資本開支Token轉(zhuǎn)化率” 與 “運(yùn)營開支 Token 轉(zhuǎn)化率”,通過全棧協(xié)同優(yōu)化,為大模型組合應(yīng)用與復(fù)合智能體部署提供核心算力支撐,實(shí)現(xiàn) “百萬Token的極致性價比”。
全場景布局:賦能AI 規(guī)模化落地
架構(gòu)創(chuàng)新是國產(chǎn)芯片差異化突破的關(guān)鍵。深耕AI芯片十余年的云天勵飛,已商用四代 NPU 架構(gòu)芯片,構(gòu)建起覆蓋云邊端全場景的推理芯片矩陣:面向云端大算力推理的“深穹”系列,為互聯(lián)網(wǎng)大廠與企業(yè)級用戶提供國產(chǎn)算力支撐;面向邊緣計(jì)算的“深界”系列,已應(yīng)用于家庭計(jì)算主機(jī)等產(chǎn)品開發(fā);面向具身智能的“深擎”系列,服務(wù)新興智能機(jī)器人領(lǐng)域。
正在研發(fā)的NOVA 500系列將全面升級 GPNPU 架構(gòu),通過3D堆疊存儲與軟硬協(xié)同設(shè)計(jì),實(shí)現(xiàn)生態(tài)兼容性、性能與能效三重提升;NOVA 600系列將探索光電一體化互聯(lián),構(gòu)建高性價比算力網(wǎng)絡(luò),力爭將每百萬 Token 推理成本降低百倍以上,降至分級成本水平。
未來,云天勵飛將持續(xù)深耕GPNPU 架構(gòu)迭代與產(chǎn)品創(chuàng)新,聚焦推理算力的性能突破與成本優(yōu)化,攜手產(chǎn)業(yè)鏈伙伴深化生態(tài)合作,構(gòu)建覆蓋“架構(gòu)-芯片-方案-應(yīng)用”的高效 AI 推理生態(tài),助力中國在第四次工業(yè)革命中搶占全球 AI 算力制高點(diǎn)。
-
半導(dǎo)體
+關(guān)注
關(guān)注
339文章
30725瀏覽量
264036 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265275 -
云天勵飛
+關(guān)注
關(guān)注
0文章
182瀏覽量
12650
原文標(biāo)題:IC China2025 | GPNPU架構(gòu)創(chuàng)新,引領(lǐng)AI算力基建2.0時代
文章出處:【微信號:IntelliFusion2,微信公眾號:云天勵飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
巨霖科技亮相2025中國國際半導(dǎo)體博覽會
愛芯元智亮相2025中國國際半導(dǎo)體博覽會
云天勵飛亮相2025中國國際半導(dǎo)體博覽會
評論