91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepSeek-R1全尺寸版本上線Gitee AI

OSC開(kāi)源社區(qū) ? 來(lái)源:Gitee AI ? 2025-02-07 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來(lái)源于Gitee AI,作者馬建倉(cāng)

繼 DeepSeek 全套蒸餾模型以及 V3 版本上線后,經(jīng)過(guò) Gitee AI 和沐曦團(tuán)隊(duì)兩天緊鑼密鼓的適配和機(jī)器籌備,DeepSeek-R1全尺寸版本現(xiàn)在已上線 Gitee AI 供開(kāi)發(fā)者們使用。

截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千問(wèn)蒸餾模型均實(shí)現(xiàn)了在國(guó)產(chǎn)沐曦訓(xùn)推一體 GPU 上成功運(yùn)行,且均已上線 Gitee AI 開(kāi)放使用體驗(yàn),國(guó)內(nèi) AI 全鏈路自主技術(shù)閉環(huán)踏出了巨大且關(guān)鍵的一步。在此特別感謝沐曦團(tuán)隊(duì)的技術(shù)支持以及來(lái)自上海加佳的算力支撐。

三大「殺手锏」成就國(guó)產(chǎn)模型新高度

DeepSeek-R1的性能相信大家已經(jīng)充分領(lǐng)教了,其「殺手锏」之一就是開(kāi)放了思維鏈輸出過(guò)程,用戶可以看到模型進(jìn)行推理時(shí)的每一步邏輯,告別了傳統(tǒng)大模型的「黑盒」問(wèn)題。

DeepSeek-R1另一個(gè)「殺手锏」則是在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI-o1 正式版。

DeepSeek-R1的第三個(gè)「殺手锏」無(wú)疑是開(kāi)放的許可證和用戶協(xié)議,模型開(kāi)源 License 統(tǒng)一使用 MIT,完全開(kāi)源,不限制商用,無(wú)需申請(qǐng)。

同時(shí),產(chǎn)品協(xié)議明確可「模型蒸餾」,明確允許用戶利用模型輸出、通過(guò)模型蒸餾等方式訓(xùn)練其他模型。

這三大「殺手锏」使得DeepSeek-R1不但擁有極高的透明度和易用性,也為開(kāi)發(fā)者提供了更靈活的訓(xùn)練和應(yīng)用方式,極大地加速了模型的落地與普及,迅速讓國(guó)產(chǎn)模型在世界 AI 競(jìng)爭(zhēng)格局中登上了新的制高點(diǎn)。

沐曦 GPU+曦源一號(hào)萬(wàn)卡集群=國(guó)產(chǎn)算力新標(biāo)桿

當(dāng)然,想要實(shí)現(xiàn)技術(shù)自主與獨(dú)立,僅有模型的領(lǐng)先還不夠,關(guān)鍵在于 AI 模型對(duì)國(guó)產(chǎn) GPU 的深度適配與高效運(yùn)行。

唯有 DeepSeek-R1 能夠在國(guó)產(chǎn) GPU 上穩(wěn)定運(yùn)行,中國(guó) AI 技術(shù)體系才能真正實(shí)現(xiàn)自主可控的完整閉環(huán)。

本次DeepSeek-R1部署采用了沐曦訓(xùn)推一體 GPU,使用完全自主研發(fā)的 GPU IP,擁有完整的知識(shí)產(chǎn)權(quán),并具備強(qiáng)大的多精度混合計(jì)算能力及高帶寬顯存支持。同時(shí),沐曦產(chǎn)品搭載先進(jìn)的時(shí)空互聯(lián)技術(shù)和全球兼容的 MXMACA 軟件棧,可廣泛應(yīng)用于智能、通用計(jì)算和數(shù)據(jù)處理等場(chǎng)景。

此外,由上海加佳智云數(shù)字科技有限公司運(yùn)營(yíng)的曦源一號(hào)國(guó)產(chǎn)替代萬(wàn)卡集群正以其卓越的性能為本次部署以及各類 AI 平臺(tái)、AI 模型及 AI 應(yīng)用提供強(qiáng)大的算力支持。

曦源一號(hào)國(guó)產(chǎn)替代算力集群是基于沐曦高性能 GPU 加速卡所構(gòu)建的一個(gè)開(kāi)放、標(biāo)準(zhǔn)、高效的計(jì)算架構(gòu),有效促進(jìn)了計(jì)算資源、數(shù)據(jù)資源與智能服務(wù)的全面整合。這種創(chuàng)新不僅提升了整體性能,也在 AI 實(shí)時(shí)推理、大規(guī)模模型訓(xùn)練等眾多領(lǐng)域展現(xiàn)出巨大的潛力,從而滿足了目前急需高效、穩(wěn)定計(jì)算能力的國(guó)內(nèi)市場(chǎng)。

Gitee AI——模型 API 新選擇

2024 年初上線以來(lái),Gitee AI 平臺(tái)以 Serverless API、模型引擎、AI 應(yīng)用為核心功能與服務(wù),致力于讓開(kāi)發(fā)者輕松構(gòu)建和部署 AI 應(yīng)用,為企業(yè)客戶提供更加智能、高效的 AI 應(yīng)用解決方案。

Gitee AI 的 Serverless API 提供了文本生成、視覺(jué)模型、圖像處理、語(yǔ)音識(shí)別、語(yǔ)音生成、向量與重排模型、代碼生成等 9 種類型共 54 個(gè)大模型的 API 使用。通過(guò)購(gòu)買模型資源包,即可通過(guò)極低的價(jià)格即可盡享眾多主流模型。

點(diǎn)擊文末閱讀原文訪問(wèn) Gitee AI,體驗(yàn)基于基于沐曦曦云 GPU 及曦源一號(hào)國(guó)產(chǎn)替代算力集群的DeepSeek-R1,使用 100% 國(guó)產(chǎn) AI 開(kāi)發(fā)應(yīng)用吧!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135416
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301318
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3751

    瀏覽量

    52093
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    835

    瀏覽量

    3250

原文標(biāo)題:繼V3之后,沐曦GPU再完成DeepSeek-R1全尺寸適配,已上線Gitee AI

文章出處:【微信號(hào):OSC開(kāi)源社區(qū),微信公眾號(hào):OSC開(kāi)源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度騰訊搶灘布局!DeepSeek-R1升級(jí)和開(kāi)源背后,國(guó)產(chǎn)AI的逆襲之路

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級(jí),當(dāng)前版本DeepSeek-R1-
    的頭像 發(fā)表于 06-03 06:34 ?6182次閱讀

    DeepSeek R1 MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀(jì)錄,Multi-Token Prediction (MTP) 實(shí)現(xiàn)了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4444次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> MTP在TensorRT-LLM中的實(shí)現(xiàn)與優(yōu)化

    速看!EASY-EAI教你離線部署Deepseek R1大模型

    1.Deepseek簡(jiǎn)介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研發(fā)的推理模型。DeepSeek-R1采用
    的頭像 發(fā)表于 07-25 15:22 ?1367次閱讀
    速看!EASY-EAI教你離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型

    信而泰×DeepSeekAI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理(
    發(fā)表于 07-16 15:29

    Arm Neoverse N2平臺(tái)實(shí)現(xiàn)DeepSeek-R1滿血版部署

    頗具優(yōu)勢(shì)。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺(tái)上使用開(kāi)源推理框架 llama.cpp 實(shí)現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務(wù)。
    的頭像 發(fā)表于 07-03 14:37 ?1235次閱讀
    Arm Neoverse N2平臺(tái)實(shí)現(xiàn)<b class='flag-5'>DeepSeek-R1</b>滿血版部署

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 GTC 2025
    的頭像 發(fā)表于 07-02 19:31 ?3290次閱讀
    NVIDIA Blackwell GPU優(yōu)化<b class='flag-5'>DeepSeek-R1</b>性能 打破<b class='flag-5'>DeepSeek-R1</b>在最小延遲場(chǎng)景中的性能紀(jì)錄

    SAP實(shí)施專家解答:如何用DeepSeek-R1實(shí)現(xiàn)需求溝通效率倍增

    工博科技分享AI工具鏈在IT項(xiàng)目中的深度應(yīng)用:通過(guò)DeepSeek-R1實(shí)現(xiàn)智能會(huì)議記錄結(jié)構(gòu)化(2小時(shí)會(huì)議5分鐘生成決策表)和精準(zhǔn)多語(yǔ)言文檔翻譯(錯(cuò)誤率降低14%),幫助IT團(tuán)隊(duì)將重復(fù)性工作耗時(shí)減少
    的頭像 發(fā)表于 04-28 09:13 ?699次閱讀

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】CPU部署DeekSeek-R1模型(1B和7B)

    一、DeepSeek簡(jiǎn)介 DeepSeek是由中國(guó)深度求索公司開(kāi)發(fā)的開(kāi)源大語(yǔ)言模型系列,其研發(fā)始于2023年,目標(biāo)是為學(xué)術(shù)界和產(chǎn)業(yè)界提供高效可控的AI基礎(chǔ)設(shè)施。R1系列作為其里程碑
    發(fā)表于 04-21 00:39

    如何基于Android 14在i.MX95 EVK上運(yùn)行Deepseek-R1-1.5B和性能

    圖標(biāo): 3. Download deepseek-R1 models through PocketPal 1. 打開(kāi) pocketPal 并單擊右下角的“轉(zhuǎn)到模型”按鈕。 2. 確保您可以訪問(wèn)
    發(fā)表于 04-04 06:59

    如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開(kāi)發(fā)的開(kāi)源推理模型,用于解決需要邏輯推理、數(shù)學(xué)問(wèn)題解決和實(shí)時(shí)決策的任務(wù)。
    的頭像 發(fā)表于 03-12 13:45 ?2370次閱讀
    如何使用OpenVINO運(yùn)行<b class='flag-5'>DeepSeek-R1</b>蒸餾模型

    在英特爾哪吒開(kāi)發(fā)套件上部署DeepSeek-R1的實(shí)現(xiàn)方式

    隨著人工智能技術(shù)的快速發(fā)展,企業(yè)對(duì) AI 模型的部署方式有了更多選擇。本地部署 DeepSeek-R1 模型具有以下顯著優(yōu)勢(shì),使其成為許多企業(yè)和開(kāi)發(fā)者的首選。
    的頭像 發(fā)表于 03-12 13:38 ?1114次閱讀
    在英特爾哪吒開(kāi)發(fā)套件上部署<b class='flag-5'>DeepSeek-R1</b>的實(shí)現(xiàn)方式

    DeepSeek-R1:別被它的光環(huán)迷了眼,這些能力局限你得知道!

    ,這款被吹上天的 AI,其實(shí)也有不少能力局限呢。今天,咱們就拋開(kāi)那些營(yíng)銷濾鏡,根據(jù)官方論文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs
    的頭像 發(fā)表于 03-11 17:19 ?1029次閱讀
    <b class='flag-5'>DeepSeek-R1</b>:別被它的光環(huán)迷了眼,這些能力局限你得知道!

    HarmonyOS NEXT開(kāi)發(fā)實(shí)戰(zhàn):DevEco Studio中DeepSeek的使用

    /completions; 點(diǎn)擊Body將model修改為deepseek-chat(對(duì)應(yīng)DeepSeek-V3)或者deepseek-reasoner(對(duì)應(yīng)DeepSeek-R1
    發(fā)表于 03-07 14:56

    實(shí)戰(zhàn)案例 | 299元國(guó)產(chǎn)工業(yè)級(jí)AI核心板部署DeepSeek-R1

    前言:在AIoT領(lǐng)域,搭載Ubuntu系統(tǒng)的眺望T527開(kāi)發(fā)板,僅憑2GB內(nèi)存便成功運(yùn)行15億參數(shù)的DeepSeek-R1輕量級(jí)大模型!在邊緣端上演一場(chǎng)算力革命,這一突破性進(jìn)展不僅刷新了邊緣AI設(shè)備
    的頭像 發(fā)表于 03-06 08:30 ?1440次閱讀
    實(shí)戰(zhàn)案例 | 299元國(guó)產(chǎn)工業(yè)級(jí)<b class='flag-5'>AI</b>核心板部署<b class='flag-5'>DeepSeek-R1</b>

    AI本土化版圖再拓展 三星Galaxy S25系列支持DeepSeek-R1

    S25系列正式接入了DeepSeek-R1大模型,令AI能力進(jìn)一步得到強(qiáng)化。目前,三星Galaxy S25系列用戶無(wú)需下載APP或注冊(cè)、登錄賬號(hào),只需將三星生活助手升級(jí)至最新版本,或在三星智慧主頁(yè)
    的頭像 發(fā)表于 03-05 17:43 ?847次閱讀
    <b class='flag-5'>AI</b>本土化版圖再拓展 三星Galaxy S25系列支持<b class='flag-5'>DeepSeek-R1</b>