色涩五月天婷婷,黄色特级a电影网址

以下文章來源于腦啟社區(qū)，作者腦啟社區(qū)

據(jù)悉，“杭州靈汐類腦智算集群”已于7月底實(shí)現(xiàn)了大模型快速推理API的企業(yè)服務(wù)試運(yùn)行。該集群由杭州靈汐類腦科技有限公司牽頭搭建運(yùn)營(yíng)，中國(guó)電信、中國(guó)電子科技南湖研究院以及腦啟社區(qū)作為合作方參與，由杭州電信具體承擔(dān)集成建設(shè)。該集群部署在中國(guó)電信杭州智算中心，算力規(guī)模超200POPS。這也是類腦智算集群在全球范圍內(nèi)，首次以支持大模型快速推理的方式，走向商用試運(yùn)行。

作為類腦智能技術(shù)的創(chuàng)新應(yīng)用成果，該智算集群具有”存算一體、眾核并行、稀疏計(jì)算、事件驅(qū)動(dòng)”的特性，可顯著提升計(jì)算效率、大幅降低能耗，實(shí)現(xiàn)大語言模型推理的“一快、一低、一降”：一是推理速度快，單用戶的推理延遲控制在毫秒級(jí)別，速度性能相對(duì)于傳統(tǒng)方案有明顯優(yōu)勢(shì)（可流暢響應(yīng)實(shí)時(shí)交互及長(zhǎng)本文深度推理），告別卡頓；二是首token延遲低，可降至百毫秒乃至十毫秒級(jí)；三是智算集群的功耗大幅下降，較業(yè)界同等推理算力水平可降低功耗二分之一至三分之二以上。異構(gòu)融合類腦芯片具有兼容PyTorch框架的類CUDA軟件棧，可直接服務(wù)于多類開源大模型的快速推理、而不需要轉(zhuǎn)換類腦算法。

當(dāng)前，大模型推理普遍存在吞吐速度慢（每秒十到幾十詞輸出）和高延遲問題（常常超過1秒甚至數(shù)秒），對(duì)眾多行業(yè)場(chǎng)景構(gòu)成了制約。在此背景下，靈汐科技基于類腦智能技術(shù)給出了“高實(shí)時(shí)、高吞吐、低延遲”的推理服務(wù)解決方案，將在金融應(yīng)用、情感陪聊、快速導(dǎo)覽、大規(guī)模數(shù)據(jù)標(biāo)注以及無人機(jī)實(shí)時(shí)航拍處理、災(zāi)害預(yù)警與應(yīng)急處置等領(lǐng)域場(chǎng)景逐步落地。據(jù)介紹，該智算集群（中心）將持續(xù)升級(jí)，新一代類腦智算高密度計(jì)算平臺(tái)也將在近期正式發(fā)布推出，集群能效比預(yù)計(jì)將進(jìn)一步提升。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

集群

集群

+關(guān)注

關(guān)注
0

文章
142

瀏覽量
17659
靈汐科技

靈汐科技

+關(guān)注

關(guān)注
0

文章
18

瀏覽量
1511
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3647

瀏覽量
5176

原文標(biāo)題：首次商用試運(yùn)行，類腦智算集群支持大模型快速推理服務(wù)

文章出處：【微信號(hào)：北京靈汐科技有限公司，微信公眾號(hào)：北京靈汐科技有限公司】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

杭州靈汐類腦智算集群實(shí)現(xiàn)大模型快速推理

評(píng)論