91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

鯤云科技AI芯片CAISA 430成功適配DeepSeek R1模型

鯤云科技 ? 來源:鯤云科技 ? 2025-02-07 09:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

鯤云科技全新一代的可重構(gòu)數(shù)據(jù)流 AI 芯片 CAISA 430 成功適配 DeepSeek R1 蒸餾模型推理,這一創(chuàng)新舉措為大模型應(yīng)用的高效部署帶來了全新的解決方案,標(biāo)志著可重構(gòu)數(shù)據(jù)流 AI 技術(shù)與大模型融合發(fā)展的又一重要里程碑,也展示了鯤云科技的可重構(gòu)數(shù)據(jù)流技術(shù)的技術(shù)通用性和生態(tài)友好。

全新一代可重構(gòu)數(shù)據(jù)流 AI 芯片 CAISA 430

此次適配的 CAISA 430 芯片是鯤云科技基于第四代可重構(gòu)數(shù)據(jù)流架構(gòu)技術(shù)研發(fā),于 2023 年底回片,并于 2024 年實(shí)現(xiàn)量產(chǎn),相較于上一代產(chǎn)品,其實(shí)測性能、通用性等關(guān)鍵指標(biāo)實(shí)現(xiàn)了跨越性提升。該芯片采用國內(nèi)成熟的 12nm 制程工藝生產(chǎn),端到端芯片利用率最高可達(dá) 90%,有效算力指標(biāo)表現(xiàn)突出。此外,憑借鯤云自主研發(fā)的 RainBuilder 編譯工具鏈,CAISA 430 支持所有常用的 AI 算子和算法模型,展現(xiàn)出強(qiáng)大的通用性,可以滿足不同深度學(xué)習(xí)算法的推理需求。

7af83a84-e475-11ef-9310-92fbcf53809c.png

▲ Rainbuilder 編譯工具鏈

鯤云科技基于 CAISA 芯片推出了一系列 AI 算力產(chǎn)品,包括面向邊緣端、數(shù)據(jù)中心進(jìn)行深度學(xué)習(xí)推斷的 AI 專用計(jì)算加速的星空加速卡 X3、X3A、N460H,面向低算力場景的星空 X6A、N430S/P/E 邊緣小站,以及基于星空加速卡系列推出的智能計(jì)算服務(wù)器等,為計(jì)算機(jī)視覺、語音語義及大模型應(yīng)用提供高性能、低延時(shí)、高算力性價(jià)比的 AI 算力支持。

高效適配,為 DeepSeek R1 推理提供底層 AI 算力支持

DeepSeek R1 作為一款先進(jìn)的推理模型,基于 Transformer 架構(gòu),其參數(shù)規(guī)模龐大,對硬件的計(jì)算能力和內(nèi)存容量提出了極高要求。CAISA 430 芯片憑借其高算力性價(jià)比和強(qiáng)大的通用性,能夠?yàn)?DeepSeek R1 推理提供有力支持。CAISA 430 的高芯片利用率確保了在處理大規(guī)模模型時(shí)能夠充分利用硬件資源,減少計(jì)算資源的浪費(fèi),從而提高推理效率。同時(shí),CAISA 430 的可重構(gòu)數(shù)據(jù)流架構(gòu)能夠根據(jù) DeepSeek R1模型的特點(diǎn)進(jìn)行動(dòng)態(tài)配置,生成面向該模型的高性能定制化流水線,進(jìn)一步優(yōu)化推理性能。

7b11bcd4-e475-11ef-9310-92fbcf53809c.png

▲ DeepSeek R1 Llama 8B模型在RainBuilder上編譯過程圖示

鑒于 CAISA 430 強(qiáng)大的通用性,原生支持 DeepSeek R1 蒸餾模型的開源基礎(chǔ)模型,DeepSeek R1 的QWen和 Llama 模型可直接在 CAISA 430 上運(yùn)行,不需要復(fù)雜的適配工作,技術(shù)團(tuán)隊(duì)主要進(jìn)行了精度驗(yàn)證和性能優(yōu)化,適配模型包括已發(fā)布的 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Llama-70B。

7b2d1b28-e475-11ef-9310-92fbcf53809c.png

▲ DeepSeek R1 Llama 8B模型運(yùn)行圖示

大模型友好:助力 AI 應(yīng)用高效部署,加速人工智能落地

在大模型時(shí)代,如何高效地部署和運(yùn)行這些模型成為了一個(gè)關(guān)鍵問題。CAISA 430 芯片的適配為 DeepSeek R1 推理提供了更加靈活和高效的解決方案,能夠?yàn)椴煌?guī)模和需求的 AI 項(xiàng)目提供底層算力支持。

高精度和強(qiáng)大推理能力的應(yīng)用場景,CAISA 430 能夠充分發(fā)揮其高實(shí)測性能的優(yōu)勢,滿足 DeepSeek R1 模型的計(jì)算需求。

對資源有限的應(yīng)用場景,CAISA 430 的通用性和可重構(gòu)性讓用戶可以根據(jù)實(shí)際情況對模型進(jìn)行優(yōu)化和調(diào)整,降低硬件資源的消耗。

基于可重構(gòu)數(shù)據(jù)流架構(gòu)底層優(yōu)勢,適配后的CAISA430芯片算力產(chǎn)品的優(yōu)勢主要體現(xiàn)在:

產(chǎn)品形態(tài)多樣:支持邊緣盒子、一體機(jī)、AI 服務(wù)器、算力中心服務(wù)器集群等邊緣至中心不同產(chǎn)品形態(tài),適配不客戶不同場景的AI推理需求;

適配算法豐富:配套的星云 AI 開發(fā)平臺(tái)支持超過 400 種視覺模型、視覺大模型、大語言模型等算法模型,可靈活搭配按需使用,無論是復(fù)雜的視覺識(shí)別任務(wù)還是大規(guī)

模的語言處理應(yīng)用,都能高效運(yùn)行;

行業(yè)方案落地:配套的星空系列算力平臺(tái),提供深入行業(yè)、滿足行業(yè)需求的 AI 解決方案,當(dāng)前已落地覆蓋超過 30 個(gè)行業(yè),幫助客戶加速落地智能化項(xiàng)目。

截止到目前,CAISA 系列芯片產(chǎn)品已服務(wù)上千客戶,落地 5000+項(xiàng)目,實(shí)現(xiàn)規(guī)模化的業(yè)務(wù)落地,充分驗(yàn)證了商業(yè)可行性。

CAISA 芯片在短時(shí)間內(nèi)快速完成DeepSeek R1 大模型適配,充分展示了 CAISA 系列可重構(gòu)數(shù)據(jù)流架構(gòu)芯片在高算力利用率的同時(shí),可以做到對于深度學(xué)習(xí)算法的通用、便捷、快速支持,體現(xiàn)了 CAISA 芯片與工具鏈經(jīng)過 4 代架構(gòu)迭代后的深厚積累。未來,鯤云科技將沿著 CAISA 創(chuàng)新架構(gòu)的全新技術(shù)路線,提供下一代計(jì)算平臺(tái)基座,加速千行百業(yè)人工智能產(chǎn)品落地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301304
  • 鯤云科技
    +關(guān)注

    關(guān)注

    0

    文章

    60

    瀏覽量

    4536
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    835

    瀏覽量

    3249

原文標(biāo)題:鯤云科技CAISA 430適配DeepSeek R1推理,開啟高效AI應(yīng)用新時(shí)代

文章出處:【微信號(hào):鯤云科技,微信公眾號(hào):鯤云科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    【硬核搭檔】迅為RK3588成功適配飛牛FnNAS,你的私有迎來性能猛獸!

    【硬核搭檔】迅為RK3588成功適配飛牛FnNAS,你的私有迎來性能猛獸!
    的頭像 發(fā)表于 02-25 15:43 ?552次閱讀
    【硬核搭檔】迅為RK3588<b class='flag-5'>成功</b><b class='flag-5'>適配</b>飛牛FnNAS,你的私有<b class='flag-5'>云</b>迎來性能猛獸!

    科技AI視頻解決方案推動(dòng)食品安全智慧監(jiān)管

    深圳作為全國科技創(chuàng)新高地,持續(xù)推動(dòng)人工智能技術(shù)在城市治理中的深度應(yīng)用。科技憑借自主研發(fā)的可重構(gòu)數(shù)據(jù)流 AI 芯片 CAISA 及多場景算
    的頭像 發(fā)表于 08-20 17:50 ?1330次閱讀

    如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量

    開源 DeepSeek R1 模型的創(chuàng)新架構(gòu)包含多頭潛在注意力機(jī)制 (MLA) 和大型稀疏混合專家模型 (MoE),其顯著提升了大語言模型
    的頭像 發(fā)表于 08-12 15:19 ?4258次閱讀
    如何在NVIDIA Blackwell GPU上優(yōu)化<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>吞吐量

    速看!EASY-EAI教你離線部署Deepseek R1模型

    1.Deepseek簡介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研發(fā)的推理模型。
    的頭像 發(fā)表于 07-25 15:22 ?1365次閱讀
    速看!EASY-EAI教你離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    DeepSeek開源新版R1 媲美OpenAI o3

    ;還有一些網(wǎng)友的實(shí)測評價(jià)都顯示,?DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性價(jià)比的平替。 此外,關(guān)于DeepSeek
    的頭像 發(fā)表于 05-29 11:23 ?1095次閱讀

    瑞薩RZ/V2H平臺(tái)支持部署離線版DeepSeek -R1大語言模型

    瑞薩RZ/V2H平臺(tái)支持部署離線版DeepSeek -R1大語言模型
    的頭像 發(fā)表于 05-13 17:07 ?1630次閱讀
    瑞薩RZ/V2H平臺(tái)支持部署離線版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大語言<b class='flag-5'>模型</b>

    DeepSeek R1模型本地部署與產(chǎn)品接入實(shí)操

    針對VS680/SL1680系列大算力芯片,我們的研發(fā)團(tuán)隊(duì)正在研究將蒸餾后的輕量級DeepSeek模型DeepSeek-R1-Distill-Qwen-1.5B)部署到SOC本地,以
    的頭像 發(fā)表于 04-19 16:32 ?755次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>本地部署與產(chǎn)品接入實(shí)操

    SL1680 SoC本地運(yùn)行DeepSeek R1 1.5B大模型

    深蕾半導(dǎo)體SL1680 SoC本地成功運(yùn)行DeepSeek R1 Distill Qwen2.5 1.5B大模型,展示了執(zhí)行過程及本地小參數(shù)大模型
    的頭像 發(fā)表于 04-17 17:09 ?932次閱讀
    SL1680 SoC本地運(yùn)行<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 1.5B大<b class='flag-5'>模型</b>

    科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本

    本篇分析來自科大訊飛技術(shù)團(tuán)隊(duì),深度解析了DeepSeek-V3 / R1 推理系統(tǒng)成本,旨在助力開發(fā)者實(shí)現(xiàn)高性價(jià)比的MoE集群部署方案。感謝訊飛研究院副院長&AI工程院常務(wù)副院長龍明康、AI
    的頭像 發(fā)表于 04-15 13:46 ?4002次閱讀
    科大訊飛深度解析<b class='flag-5'>DeepSeek</b>-V3/<b class='flag-5'>R1</b>推理系統(tǒng)成本

    ORinNano離線部署Deepseek R1模型教程

    ORinNano離線部署Deepseek R1模型教程
    的頭像 發(fā)表于 04-10 15:32 ?1344次閱讀
    ORinNano離線部署<b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>教程

    如何基于Android 14在i.MX95 EVK上運(yùn)行Deepseek-R1-1.5B和性能

    圖標(biāo): 3. Download deepseek-R1 models through PocketPal 1. 打開 pocketPal 并單擊右下角的“轉(zhuǎn)到模型”按鈕。 2. 確保您可以訪問
    發(fā)表于 04-04 06:59

    南京市政務(wù)基于華為Stack成功部署DeepSeek滿血版大模型

    近期,南京市政務(wù)基于華為Stack成功部署上線滿血版DeepSeek-R1-671B,實(shí)現(xiàn)了“南京+DeepSeek滿血版”的人工智能政
    的頭像 發(fā)表于 03-31 09:30 ?1001次閱讀

    顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 DeepSeek R1 32B 蒸餾模型體驗(yàn)

    今年春節(jié)后,DeepSeek R1 風(fēng)暴般地席卷全國,小到手機(jī) App,大到新能源汽車,似乎一夜間所有產(chǎn)品都接入了 DeepSeek R1。不得不說
    的頭像 發(fā)表于 03-18 12:06 ?1973次閱讀
    顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 32B 蒸餾<b class='flag-5'>模型</b>體驗(yàn)

    如何使用OpenVINO運(yùn)行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型,用于解決需要邏輯推理、數(shù)學(xué)問題解決和實(shí)時(shí)決策的任務(wù)。
    的頭像 發(fā)表于 03-12 13:45 ?2370次閱讀
    如何使用OpenVINO運(yùn)行<b class='flag-5'>DeepSeek-R1</b>蒸餾<b class='flag-5'>模型</b>

    實(shí)戰(zhàn)案例 | 299元國產(chǎn)工業(yè)級AI核心板部署DeepSeek-R1

    前言:在AIoT領(lǐng)域,搭載Ubuntu系統(tǒng)的眺望T527開發(fā)板,僅憑2GB內(nèi)存便成功運(yùn)行15億參數(shù)的DeepSeek-R1輕量級大模型!在邊緣端上演一場算力革命,這一突破性進(jìn)展不僅刷新了邊緣A
    的頭像 發(fā)表于 03-06 08:30 ?1438次閱讀
    實(shí)戰(zhàn)案例 | 299元國產(chǎn)工業(yè)級<b class='flag-5'>AI</b>核心板部署<b class='flag-5'>DeepSeek-R1</b>