91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程GPU率先支持Qwen3全系列模型

摩爾線程 ? 來源:摩爾線程 ? 2025-05-07 15:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,阿里云正式發(fā)布Qwen3系列的8款開源混合推理模型。摩爾線程團(tuán)隊(duì)在模型發(fā)布當(dāng)天,率先完成了Qwen3全系列模型在全功能GPU上的高效支持。這一成果充分展現(xiàn)了MUSA架構(gòu)及全功能GPU在生態(tài)兼容性和快速支持能力方面的卓越表現(xiàn)。MUSA架構(gòu)憑借其強(qiáng)大的易用性,不僅顯著降低了開發(fā)者在適配遷移過程中的工作量,更大幅提升了開發(fā)效率,為創(chuàng)新成果的快速落地提供了堅(jiān)實(shí)助力。

Qwen3作為國內(nèi)首個(gè)“混合推理模型”,創(chuàng)造性將“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,在推理、指令遵循、智能體功能和多語言支持方面取得了突破性的進(jìn)步。此次開源的兩款MoE模型是Qwen3-235B-A22B和Qwen3-30B-A3B;同時(shí)還包括六個(gè)Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

從官方發(fā)布的benchmark測試結(jié)果來看:Qwen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測試中,成績顯著高于OpenAI-o1及Deepseek-R1版本。Qwen3-32B在各項(xiàng)測試中成績同樣優(yōu)于OpenAI-o3-mini。

快速支持

開放體驗(yàn)Qwen3創(chuàng)新成果

摩爾線程現(xiàn)已將Qwen3系列模型的支持成果在“夸娥工場”開放上線?!翱涠鸸觥笔悄柧€程傾力打造的模型展示與體驗(yàn)中心,旨在為用戶提供基于夸娥(KUAE)智算集群支持的模型能力體驗(yàn)。用戶可通過訪問夸娥工場,親身體驗(yàn)Qwen3強(qiáng)大的推理模型性能與創(chuàng)新技術(shù)。

目前,主流推理引擎均可基于摩爾線程MUSA平臺(tái)運(yùn)行Qwen3系列模型。MUSA平臺(tái)憑借其卓越性能,能夠作為vLLM、Ollama、GPU Stack等各類主流開源推理引擎的后端,為Qwen3系列模型的高效運(yùn)行提供強(qiáng)大動(dòng)力。

例如,QWen3-235B-A22B(Qwen3系列最大參數(shù)量模型),基于vLLM-MUSA引擎在摩爾線程全功能GPU上穩(wěn)定運(yùn)行。

同時(shí),GPU Stack引擎與llama.cpp/ollama引擎也在摩爾線程圖形顯卡MTT S80上高效運(yùn)行,充分展現(xiàn)了MUSA平臺(tái)的廣泛兼容性與卓越性能。

共建開源生態(tài)

持續(xù)推動(dòng)國產(chǎn)GPU發(fā)展

摩爾線程積極響應(yīng)開源社區(qū)的號(hào)召,旨在賦能更多開發(fā)者基于國產(chǎn)全功能GPU進(jìn)行AI應(yīng)用創(chuàng)新。此前,在通義千問QwQ-32B發(fā)布當(dāng)日,摩爾線程就成功實(shí)現(xiàn)了Day-0支持,這一成果充分驗(yàn)證了先進(jìn)MUSA架構(gòu)和全功能GPU的技術(shù)成熟度與可靠性。

我們誠摯歡迎廣大開發(fā)者與用戶前往“夸娥工場”進(jìn)行體驗(yàn),與此同時(shí),開發(fā)者也可訪問摩爾線程GitHub社區(qū)與開發(fā)者社區(qū)了解更多:

摩爾線程始終致力于推動(dòng)開源生態(tài)的發(fā)展,通過技術(shù)開放與生態(tài)共建,加速國產(chǎn)全功能GPU在AI計(jì)算領(lǐng)域的規(guī)模化應(yīng)用,為更多用戶提供更智能、高效的解決方案。

關(guān)于摩爾線程

摩爾線程成立于2020年10月,以全功能GPU為核心,致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。

我們的目標(biāo)是成為具備國際競爭力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135412
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52093
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    6447

原文標(biāo)題:Day-0支持|摩爾線程GPU率先支持Qwen3全系列模型

文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    摩爾線程MTT S5000全面適配Qwen3.5三款新模型

    第一時(shí)間做出極速響應(yīng),宣布已在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,完成對(duì)這三款全新模型的全方位適配。 ? 此次高效支持充分展示了摩爾
    的頭像 發(fā)表于 02-26 16:23 ?320次閱讀

    摩爾線程快速完成對(duì)Qwen3.5模型全面適配

    2月17日,摩爾線程宣布已在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上完成對(duì)阿里最新大模型Qwen3.5的全方位適配。此次
    發(fā)表于 02-18 08:32 ?163次閱讀

    廣和通加速通義千問Qwen3在端側(cè)全面落地

    6月,廣和通宣布:率先完成通義千問Qwen3系列混合推理模型在高通QCS8550平臺(tái)端側(cè)的適配部署。廣和通通過定制化混合精度量化方案與創(chuàng)新硬件加速算法,成功突破
    的頭像 發(fā)表于 06-25 15:35 ?1121次閱讀

    壁仞科技完成Qwen3旗艦模型適配

    近日,在高效適配Qwen3系列模型推理后,壁仞科技宣布完成旗艦版Qwen3-235B-A22B模型的訓(xùn)練適配和優(yōu)化。由此,壁仞科技已實(shí)現(xiàn)
    的頭像 發(fā)表于 05-16 16:23 ?976次閱讀

    Arm CPU適配通義千問Qwen3系列模型

    近日,阿里巴巴開源了新一代通義千問模型 Qwen3,Arm 率先成為首批成功適配該模型的計(jì)算平臺(tái)廠商。與此同時(shí),Arm 面向人工智能 (AI) 框架開發(fā)者的開源計(jì)算內(nèi)核 Arm Kle
    的頭像 發(fā)表于 05-12 16:37 ?1438次閱讀

    Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 Qwen3 快速部署

    本文將以 Qwen3-8B 為例,介紹如何利用 OpenVINO 的 Python API 在英特爾平臺(tái)(GPU, NPU)Qwen3 系列模型
    的頭像 發(fā)表于 05-11 11:36 ?1708次閱讀
    Intel OpenVINO? Day0 實(shí)現(xiàn)阿里通義 <b class='flag-5'>Qwen3</b> 快速部署

    NVIDIA RTX 5880 Ada與Qwen3系列模型實(shí)測報(bào)告

    近日,阿里巴巴通義千問團(tuán)隊(duì)正式推出新一代開源大語言模型——Qwen3 系列,該系列包含 6 款 Dense 稠密模型和 2 款 MoE 混合
    的頭像 發(fā)表于 05-09 15:05 ?4343次閱讀
    NVIDIA RTX 5880 Ada與<b class='flag-5'>Qwen3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>實(shí)測報(bào)告

    NVIDIA使用Qwen3系列模型的最佳實(shí)踐

    阿里巴巴近期發(fā)布了其開源的混合推理大語言模型 (LLM) 通義千問 Qwen3,此次 Qwen3 開源模型系列包含兩款混合專家
    的頭像 發(fā)表于 05-08 11:45 ?2979次閱讀
    NVIDIA使用<b class='flag-5'>Qwen3</b><b class='flag-5'>系列</b><b class='flag-5'>模型</b>的最佳實(shí)踐

    MediaTek天璣9400率先完成阿里Qwen3模型部署

    通義大模型團(tuán)隊(duì)在天璣 9400 旗艦移動(dòng)平臺(tái)上率先完成 Qwen3(千問 3)的端側(cè)部署。未來,搭載天璣 9400 移動(dòng)平臺(tái)的設(shè)備可充分發(fā)揮端側(cè) AI 性能潛力,運(yùn)行千問
    的頭像 發(fā)表于 05-08 10:11 ?1293次閱讀

    后摩智能NPU適配通義千問Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列開源混合推理模型。用時(shí)不到1天,后摩智能自研NPU迅速實(shí)現(xiàn)Qwen3 系列
    的頭像 發(fā)表于 05-07 16:46 ?1379次閱讀

    寒武紀(jì)率先支持Qwen3全系列模型

    近日,阿里Qwen團(tuán)隊(duì)一口氣上新8大模型,Qwen3正式發(fā)布并全部開源。
    的頭像 發(fā)表于 05-07 15:51 ?1043次閱讀

    在openEuler上基于vLLM Ascend部署Qwen3

    近日,阿里巴巴正式發(fā)布新一代Qwen大語言模型系列Qwen3Qwen3-MoE),在模型規(guī)模
    的頭像 發(fā)表于 05-07 14:44 ?1830次閱讀
    在openEuler上基于vLLM Ascend部署<b class='flag-5'>Qwen3</b>

    中科曙光DeepAI深算智能引擎全面支持Qwen3

    日前,Qwen3正式發(fā)布并全部開源8款混合推理模型。作為Qwen系列中的最新一代大型語言模型Qwen3
    的頭像 發(fā)表于 05-06 15:17 ?1147次閱讀

    幾B都有!BM1684X一鍵適配全系列Qwen3

    Qwen3發(fā)布,大小尺寸通吃Qwen3一發(fā)布,登頂開源大模型排行榜!235B、32B、8B、4B、1.7B云邊端全尺寸模型,BF16和FP8兩種精度,一次性發(fā)布,無論云端大卡還是邊緣A
    的頭像 發(fā)表于 04-30 18:37 ?1495次閱讀
    幾B都有!BM1684X一鍵適配<b class='flag-5'>全系列</b><b class='flag-5'>Qwen3</b>

    壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持

    4月29日,阿里巴巴通義千問發(fā)布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”)。Qwen3發(fā)布后數(shù)小時(shí)內(nèi),壁仞科技完成
    的頭像 發(fā)表于 04-30 15:19 ?1573次閱讀