91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

杭州靈汐類腦智算集群實(shí)現(xiàn)大模型快速推理

北京靈汐科技有限公司 ? 來源:腦啟社區(qū) ? 2025-08-18 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于腦啟社區(qū),作者腦啟社區(qū)

據(jù)悉,“杭州靈汐類腦智算集群”已于7月底實(shí)現(xiàn)了大模型快速推理API的企業(yè)服務(wù)試運(yùn)行。該集群由杭州靈汐類腦科技有限公司牽頭搭建運(yùn)營(yíng),中國(guó)電信、中國(guó)電子科技南湖研究院以及腦啟社區(qū)作為合作方參與,由杭州電信具體承擔(dān)集成建設(shè)。該集群部署在中國(guó)電信杭州智算中心,算力規(guī)模超200POPS。這也是類腦智算集群在全球范圍內(nèi),首次以支持大模型快速推理的方式,走向商用試運(yùn)行。

作為類腦智能技術(shù)的創(chuàng)新應(yīng)用成果,該智算集群具有”存算一體、眾核并行、稀疏計(jì)算、事件驅(qū)動(dòng)”的特性,可顯著提升計(jì)算效率、大幅降低能耗,實(shí)現(xiàn)大語言模型推理的“一快、一低、一降”:一是推理速度快,單用戶的推理延遲控制在毫秒級(jí)別,速度性能相對(duì)于傳統(tǒng)方案有明顯優(yōu)勢(shì)(可流暢響應(yīng)實(shí)時(shí)交互及長(zhǎng)本文深度推理),告別卡頓;二是首token延遲低,可降至百毫秒乃至十毫秒級(jí);三是智算集群的功耗大幅下降,較業(yè)界同等推理算力水平可降低功耗二分之一至三分之二以上。異構(gòu)融合類腦芯片具有兼容PyTorch框架的類CUDA軟件棧,可直接服務(wù)于多類開源大模型的快速推理、而不需要轉(zhuǎn)換類腦算法。

當(dāng)前,大模型推理普遍存在吞吐速度慢(每秒十到幾十詞輸出)和高延遲問題(常常超過1秒甚至數(shù)秒),對(duì)眾多行業(yè)場(chǎng)景構(gòu)成了制約。在此背景下,靈汐科技基于類腦智能技術(shù)給出了“高實(shí)時(shí)、高吞吐、低延遲”的推理服務(wù)解決方案,將在金融應(yīng)用、情感陪聊、快速導(dǎo)覽、大規(guī)模數(shù)據(jù)標(biāo)注以及無人機(jī)實(shí)時(shí)航拍處理、災(zāi)害預(yù)警與應(yīng)急處置等領(lǐng)域場(chǎng)景逐步落地。據(jù)介紹,該智算集群(中心)將持續(xù)升級(jí),新一代類腦智算高密度計(jì)算平臺(tái)也將在近期正式發(fā)布推出,集群能效比預(yù)計(jì)將進(jìn)一步提升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 集群
    +關(guān)注

    關(guān)注

    0

    文章

    142

    瀏覽量

    17659
  • 靈汐科技
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    1511
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3647

    瀏覽量

    5176

原文標(biāo)題:首次商用試運(yùn)行,類腦智算集群支持大模型快速推理服務(wù)

文章出處:【微信號(hào):北京靈汐科技有限公司,微信公眾號(hào):北京靈汐科技有限公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    功耗腰斬,延遲毫秒!杭州搶先手,押注計(jì)算

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近期,杭州市正式出臺(tái)《關(guān)于支持智能未來產(chǎn)業(yè)創(chuàng)新發(fā)展的若干措施》(以下簡(jiǎn)稱“措施”),明確提出重點(diǎn)支持機(jī)接口與
    的頭像 發(fā)表于 12-28 09:31 ?2222次閱讀
    功耗腰斬,延遲毫秒!<b class='flag-5'>杭州</b>搶先手,押注<b class='flag-5'>類</b><b class='flag-5'>腦</b>計(jì)算

    中科曙光3套scaleX萬卡超集群落地國(guó)家超互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)

    2月5日,由中科曙光提供的3套萬卡超集群系統(tǒng)在國(guó)家超互聯(lián)網(wǎng)鄭州核心節(jié)點(diǎn)同時(shí)上線試運(yùn)行,成為全國(guó)首個(gè)實(shí)現(xiàn)3萬卡部署、且實(shí)際投入運(yùn)營(yíng)的最大國(guó)產(chǎn)AI力池,全面覆蓋萬億參數(shù)
    的頭像 發(fā)表于 02-09 10:32 ?458次閱讀

    從訓(xùn)練到推理:大模型力需求的新拐點(diǎn)已至

    在大模型產(chǎn)業(yè)發(fā)展的早期階段,行業(yè)焦點(diǎn)主要集中在大模型訓(xùn)練所需的力投入。一個(gè)萬億參數(shù)大模型的訓(xùn)練可能需要數(shù)千張GPU芯片連續(xù)運(yùn)行數(shù)月,成本高達(dá)數(shù)千萬甚至上億元。但隨著大
    的頭像 發(fā)表于 02-05 16:07 ?780次閱讀
    從訓(xùn)練到<b class='flag-5'>推理</b>:大<b class='flag-5'>模型</b><b class='flag-5'>算</b>力需求的新拐點(diǎn)已至

    LLM推理模型是如何推理的?

    過程與核心見解拆解。一、核心論點(diǎn)與總覽LRM(如o1,R1)的“推理”能力提升,并非源于模型學(xué)會(huì)了人類式的邏輯推理,而是通過兩主要技術(shù)手段,優(yōu)化了生成過程,使其
    的頭像 發(fā)表于 01-19 15:33 ?469次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    杭州電信集群正式發(fā)布

    2025年12月11日,杭州電信集群
    的頭像 發(fā)表于 12-23 16:19 ?371次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、芯片

    。是實(shí)現(xiàn)芯片的基本模型。SNN中的神經(jīng)元通過短的電脈沖相互溝通,脈沖之間的時(shí)間間隔起著重要作用。 最有利于硬件實(shí)現(xiàn)的脈沖神經(jīng)元
    發(fā)表于 09-17 16:43

    啟社區(qū)第二屆智能創(chuàng)新大賽正式啟動(dòng)

    機(jī)智能全國(guó)重點(diǎn)實(shí)驗(yàn)室、北京科技、中國(guó)電信杭州中心協(xié)辦。旨在挖掘剛需應(yīng)用,形成一批可規(guī)
    的頭像 發(fā)表于 08-18 16:11 ?1328次閱讀

    科技與廣電五舟達(dá)成戰(zhàn)略合作

    2025年8月15日,北京科技有限公司與廣州廣電五舟科技股份有限公司經(jīng)友好協(xié)商,現(xiàn)已達(dá)成戰(zhàn)略合作協(xié)議。雙方結(jié)合各自優(yōu)勢(shì),進(jìn)一步聚焦國(guó)產(chǎn)力底座構(gòu)建、行業(yè)解決方案優(yōu)化,在
    的頭像 發(fā)表于 08-18 16:05 ?1244次閱讀

    科技斬獲第三屆“華彩杯”力大賽東區(qū)決賽二等獎(jiǎng)

    2025年7月10-11日,第三屆“華彩杯”力大賽東區(qū)決賽專題賽暨頒獎(jiǎng)典禮在杭州舉行?!?b class='flag-5'>靈科技
    的頭像 發(fā)表于 08-04 14:45 ?1308次閱讀

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過遠(yuǎn)程力平臺(tái)預(yù)置的模型鏡像與AI工具,僅需50%的GPU力即可解鎖大模型
    的頭像 發(fā)表于 07-30 21:44 ?898次閱讀

    模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型推理過程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來了挑戰(zhàn)。為了解決這一問題,本文將探討大模型
    發(fā)表于 07-03 19:43

    億鑄科技入圍工信部力強(qiáng)基揭榜行動(dòng)

    、網(wǎng)絡(luò)、計(jì)算的協(xié)同優(yōu)化,旨在通過模型加速與調(diào)度加速等創(chuàng)新方法,實(shí)現(xiàn)大規(guī)模異構(gòu)集群在大模型推理
    的頭像 發(fā)表于 06-30 14:57 ?1093次閱讀

    DeepSeek推動(dòng)AI力需求:800G光模塊的關(guān)鍵作用

    限制力提升的瓶頸。800G光模塊通過更高的傳輸速率,能夠支持大規(guī)模GPU集群間的數(shù)據(jù)傳輸,保證各節(jié)點(diǎn)之間的快速互聯(lián)和低延遲通信,從而提升整個(gè)系統(tǒng)的計(jì)算效率與吞吐量。對(duì)于DeepSeek等超大
    發(fā)表于 03-25 12:00

    YOLOv5中rgb888p_size這個(gè)參數(shù)要與模型推理和訓(xùn)練的尺寸一致嗎?一致會(huì)達(dá)到更好的效果?

    YOLOv5中rgb888p_size這個(gè)參數(shù)要與模型推理和訓(xùn)練的尺寸一致嗎,一致會(huì)達(dá)到更好的效果
    發(fā)表于 03-11 08:12

    科技開源深度學(xué)習(xí)應(yīng)用開發(fā)平臺(tái)BIDL

    富案例等問題,一直制約著其廣泛應(yīng)用。為了突破這一瓶頸,科技聯(lián)合啟社區(qū)正式宣布開源深度學(xué)習(xí)應(yīng)用開發(fā)平臺(tái)BIDL(Brain-insp
    的頭像 發(fā)表于 03-05 09:13 ?1787次閱讀
    <b class='flag-5'>靈</b><b class='flag-5'>汐</b>科技開源<b class='flag-5'>類</b><b class='flag-5'>腦</b>深度學(xué)習(xí)應(yīng)用開發(fā)平臺(tái)BIDL