近日,阿里云重磅推出Qwen3 系列開源混合推理模型。用時不到1天,后摩智能自研NPU迅速實現(xiàn)Qwen3 系列模型(Qwen3 0.6B-14B)在端邊側(cè)的高效部署。這一成果充分彰顯了后摩智能NPU在生態(tài)適配性與快速響應(yīng)能力方面的顯著優(yōu)勢。
通義千問 Qwen3 系列作為國內(nèi)領(lǐng)先的混合推理模型,其亮點在于創(chuàng)造性地將 “快思考” 與 “慢思考” 集成進同一個模型架構(gòu)。對于簡單需求,可迅速做出低算力響應(yīng),實現(xiàn) “秒回”;面對復(fù)雜問題,能夠進行多步驟深度思考,逐步推導(dǎo)出合理答案。此外,Qwen3 系列基于海量多語言、多模態(tài)數(shù)據(jù)預(yù)訓(xùn)練,并經(jīng)過高質(zhì)量數(shù)據(jù)微調(diào),在人類偏好對齊方面表現(xiàn)出色,推理效率提升 3 倍,支持 API 商用及開源代碼庫,為用戶提供了靈活多樣的部署選擇。
后摩智能通過多種產(chǎn)品組合,為用戶提供豐富的高性能 AI 算力選擇?;谧匝?NPU,后摩智能推出了力謀SM30 計算模組、力謀LM30 智能加速卡及力謀BX30 計算盒子等產(chǎn)品,在政務(wù)、工業(yè)、消費、汽車等行業(yè)全面覆蓋端側(cè)與邊緣側(cè)的多樣化應(yīng)用場景。這些產(chǎn)品憑借其高性能、低功耗的特點,為 AI 技術(shù)的落地提供了堅實的算力基礎(chǔ),滿足了不同用戶在不同場景下的需求。
此前,后摩智能 NPU 已成功支持了 DeepSeek R1 Distilled 系列模型,展現(xiàn)出其在適配主流大模型方面的卓越性能和廣泛兼容性。此次適配通義千問 Qwen3 系列模型,進一步驗證了后摩智能 NPU 在處理復(fù)雜 AI 任務(wù)時的高效性和穩(wěn)定性,為國產(chǎn)技術(shù)棧的完整性與競爭力提供了有力證明。
未來,后摩智能將繼續(xù)深耕存算一體技術(shù),持續(xù)優(yōu)化 NPU 性能,加強與生態(tài)伙伴的合作,推動國產(chǎn) NPU 在 AI 領(lǐng)域的廣泛應(yīng)用。通過技術(shù)創(chuàng)新與生態(tài)共建,后摩智能致力于為更多用戶提供高效、普惠的 AI 算力解決方案。
-
模型
+關(guān)注
關(guān)注
1文章
3758瀏覽量
52131 -
阿里云
+關(guān)注
關(guān)注
3文章
1038瀏覽量
45738 -
NPU
+關(guān)注
關(guān)注
2文章
376瀏覽量
21120 -
后摩智能
+關(guān)注
關(guān)注
0文章
52瀏覽量
1713
原文標(biāo)題:后摩智能 NPU 率先完成阿里 Qwen3 系列模型的端邊側(cè)部署
文章出處:【微信號:后摩智能,微信公眾號:后摩智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
阿里巴巴發(fā)布通義千問旗艦推理模型Qwen3-Max-Thinking
阿里通義千問發(fā)布小尺寸模型Qwen3-4B,手機也能跑
廣和通加速通義千問Qwen3在端側(cè)全面落地
Intel OpenVINO? Day0 實現(xiàn)阿里通義 Qwen3 快速部署
MediaTek天璣9400率先完成阿里Qwen3模型部署
幾B都有!BM1684X一鍵適配全系列Qwen3
后摩智能NPU適配通義千問Qwen3系列模型
評論