91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

升騰910和含光800性能對(duì)比 昇騰910和含光800性能對(duì)比

工程師鄧生 ? 2023-08-31 17:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有網(wǎng)友關(guān)注升騰910和含光800性能對(duì)比;升騰910一般認(rèn)為就是華為的昇騰910;而含光800則是阿里巴巴發(fā)布的含光800AI芯片。

2019年9月25日,阿里巴巴發(fā)布含光800AI芯片;含光800是高性能的AI推理芯片。該芯片推理性能達(dá)到78563 IPS,能效比500 IPS/W。

含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過推理加速等技術(shù)有效解決芯片性能瓶頸問題;軟件層面集成了達(dá)摩院先進(jìn)算法,針對(duì)CNN及視覺類算法深度優(yōu)化計(jì)算、存儲(chǔ)密度,可實(shí)現(xiàn)大網(wǎng)絡(luò)模型在一顆NPU上完成計(jì)算。

含光800AI芯片相比傳統(tǒng)GPU算力,性價(jià)比提升100%。根據(jù)云棲大會(huì)的現(xiàn)場(chǎng)演示結(jié)果顯示,比如拍立淘商品庫(kù)每天新增10億商品圖片,使用傳統(tǒng)GPU算力識(shí)別需要1小時(shí),使用含光800后可縮減至5分鐘。

據(jù)阿里介紹含光NPU采用TSMC 12nm工藝制程,可提供全球最高單芯片AI推理性能。 在HGAI模型的推理應(yīng)用中,含光NPU每秒鐘可處理高達(dá)78000 IPS的圖片,是同類處理器的數(shù)十倍性能。

目前含光800目前已被應(yīng)用到阿里巴巴旗下的的多個(gè)業(yè)務(wù)場(chǎng)景,比如圖像視頻分析、城市大腦、搜索優(yōu)化等等。

2019年8月23日,華為發(fā)布AI芯片Ascend 910(昇騰910)。

據(jù)華為官方介紹,昇騰910AI處理器,基于自研華為達(dá)芬奇架構(gòu)3D Cube技術(shù),實(shí)現(xiàn)業(yè)界最佳AI性能與能效,架構(gòu)靈活伸縮,支持云邊端全棧全場(chǎng)景應(yīng)用。

除了基于達(dá)芬奇架構(gòu)的AI核外,昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器(Task Scheduler),因而具有自我管理能力,可以充分發(fā)揮其高算力的優(yōu)勢(shì)。

昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構(gòu)建橫向擴(kuò)展(Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口,片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4.0的吞吐量比上一代提升一倍。

昇騰910算力是國(guó)際頂尖AI芯片的2倍,相當(dāng)50個(gè)當(dāng)前最新最強(qiáng)的CPU;其訓(xùn)練速度,也比當(dāng)前最新最強(qiáng)的芯片提升了50%-100%。同時(shí)華為還發(fā)布了配套的新一代AI開源計(jì)算框架MindSpore。兩者搭配性能最大化利用芯片算力。

新一代的AI開源計(jì)算框架MindSpore創(chuàng)新編程范式,使得工程師更容易使用;該計(jì)算框架可滿足終端、邊緣計(jì)算、云全場(chǎng)景需求,能更好保護(hù)數(shù)據(jù)隱私;可開源,形成廣闊應(yīng)用生態(tài)。

昇騰910半精度(FP16)算力達(dá)256 TFLOPS。(還有一個(gè)說法是昇騰910的半精度(FP16)算力達(dá)到320 TFLOPS);而整數(shù)精度(INT8)算力達(dá)到 640 TOPS,(還有一個(gè)說法是整數(shù)精度(INT8)算力達(dá)到512 Tera-OPS;小編認(rèn)為一個(gè)數(shù)值可能是設(shè)計(jì)參數(shù)值,一個(gè)可能是極值)功耗 310W,采用 7nm 先進(jìn)工藝。此外,昇騰 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,為構(gòu)建橫向擴(kuò)展 (Scale Out)和縱向擴(kuò)展(Scale Up)系統(tǒng)提供了靈活高效的方法。

比如華為的Atlas 900 AI訓(xùn)練集群,算力達(dá)到了256 PFLOPS。要實(shí)現(xiàn)這樣的算力,如果采用通用CPU需要6195個(gè)機(jī)柜,用GPU需要208個(gè)機(jī)柜,而NPU如昇騰只要128個(gè)機(jī)柜,這歸功于昇騰架構(gòu)對(duì)深度學(xué)習(xí)業(yè)務(wù)的優(yōu)化。而且最終,華為只用了16個(gè)機(jī)柜來實(shí)現(xiàn)。

此外,昇騰910為國(guó)產(chǎn)AI芯片助力,華為盤古大模型從算力(昇騰算力,昇騰的底層架構(gòu)也是華為自創(chuàng)的)、芯片使能、AI框架(MindSpore AI計(jì)算框架)到AI平臺(tái)(AI開發(fā)生產(chǎn)線ModelArts)實(shí)現(xiàn)了全棧自主創(chuàng)新。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252404
  • RISC-V
    +關(guān)注

    關(guān)注

    48

    文章

    2887

    瀏覽量

    53043
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2128

    瀏覽量

    36793
  • 昇騰910
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    7191
  • 含光800
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    1810
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    分立式與集成式差分放大器的性能對(duì)比

    本期,為大家?guī)淼氖恰斗至⑹脚c集成式差分放大器對(duì)比》,介紹了集成式差分放大器與分立式方案的實(shí)測(cè)性能對(duì)比,以解決高精度電壓/電流檢測(cè)應(yīng)用中如何選擇更優(yōu)實(shí)施方案的問題。
    的頭像 發(fā)表于 01-26 16:53 ?8298次閱讀
    分立式與集成式差分放大器的<b class='flag-5'>性能對(duì)比</b>

    隔離探頭與傳統(tǒng)高壓差分探頭在SiC/GaN測(cè)試中的性能對(duì)比

    高壓差分探頭通過差分放大和電阻分壓實(shí)現(xiàn)信號(hào)提取,具有高共模抑制比但無法完全隔離;隔離探頭采用電--電轉(zhuǎn)換,實(shí)現(xiàn)完全電氣隔離,適合高電壓測(cè)量,但帶寬較低。
    的頭像 發(fā)表于 01-07 15:41 ?255次閱讀

    CW32L012與STM32G431的CORDIC三角函數(shù)運(yùn)算性能對(duì)比

    CORDIC協(xié)處理器的三角運(yùn)算性能對(duì)比對(duì)比結(jié)果出乎意料。 一、硬件架構(gòu) 二、運(yùn)算100W次SIN30度與COS30度的代碼實(shí)現(xiàn) 1.CW32L012 CW32L012的CORDIC提供某些數(shù)學(xué)函數(shù)
    的頭像 發(fā)表于 12-29 15:55 ?2510次閱讀
    CW32L012與STM32G431的CORDIC三角函數(shù)運(yùn)算<b class='flag-5'>性能對(duì)比</b>

    潤(rùn)和軟件AIRUNS訓(xùn)推一體化平臺(tái)與910C芯片深度適配

    近日,在江蘇鯤鵬?生態(tài)創(chuàng)新中心的全程支持下,江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)自主研發(fā)的AIRUNS訓(xùn)推一體化平臺(tái)完成與搭載9
    的頭像 發(fā)表于 12-22 14:51 ?660次閱讀
    潤(rùn)和軟件AIRUNS訓(xùn)推一體化平臺(tái)與<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>910</b>C芯片深度適配

    太誘電感與村田電感的性能對(duì)比及選型

    太誘與村田電感的性能對(duì)比及選型分析 一、高頻性能對(duì)比 村田電感 高頻結(jié)構(gòu)優(yōu)勢(shì) :高頻電路用電感以繞線型(LQW系列)和薄膜型(LQP系列)為主。繞線型采用氧化鋁芯與銅線螺旋結(jié)構(gòu),Q值極高(典型值
    的頭像 發(fā)表于 12-09 16:21 ?684次閱讀
    太誘電感與村田電感的<b class='flag-5'>性能對(duì)比</b>及選型

    不同輻照度和溫度下,TOPCon與PERC晶硅伏組件的電性能對(duì)比

    伏應(yīng)用中,額定功率相同的不同類型晶硅組件在實(shí)際運(yùn)行中發(fā)電量存在差異,這一現(xiàn)象對(duì)新興TOPCon與傳統(tǒng)PERC技術(shù)的性能評(píng)估提出了迫切需求。由于缺乏TOPCon組件長(zhǎng)期戶外發(fā)電的充分?jǐn)?shù)據(jù),其在實(shí)際
    的頭像 發(fā)表于 11-10 09:03 ?671次閱讀
    不同輻照度和溫度下,TOPCon與PERC晶硅<b class='flag-5'>光</b>伏組件的電<b class='flag-5'>性能對(duì)比</b>

    薄膜電阻與陶瓷電容性能對(duì)比

    薄膜電阻與陶瓷電容在性能上各有優(yōu)勢(shì),薄膜電阻以高精度、低溫漂、低噪聲見長(zhǎng),適用于精密測(cè)量與高頻電路;陶瓷電容則以高頻特性、微型化與高可靠性為核心優(yōu)勢(shì),廣泛應(yīng)用于電源管理與射頻電路。以下是對(duì)兩者的詳細(xì)
    的頭像 發(fā)表于 11-04 16:33 ?638次閱讀
    薄膜電阻與陶瓷電容<b class='flag-5'>性能對(duì)比</b>

    國(guó)產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“算力是AI的命門”,但國(guó)產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思910B,實(shí)測(cè)下來有點(diǎn)超出預(yù)期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發(fā)表于 10-27 13:12

    DSP芯片與800G模塊的核心關(guān)系:Transmit Retimed DSP、LPO與LRO方案的探討

    本文深入探討DSP芯片在800G模塊中的核心作用,包括Transmit Retimed DSP架構(gòu)與新興LPO/LRO方案的對(duì)比分析。DSP在信號(hào)均衡、誤碼控制與長(zhǎng)距離傳輸中不可或缺,而LPO/LRO以低功耗優(yōu)勢(shì)適用于短距互聯(lián)
    的頭像 發(fā)表于 09-10 16:32 ?2486次閱讀
    DSP芯片與<b class='flag-5'>800</b>G<b class='flag-5'>光</b>模塊的核心關(guān)系:Transmit Retimed DSP、LPO與LRO方案的探討

    DLP? LightCrafter? DLPC910評(píng)估模塊技術(shù)解析與應(yīng)用指南

    Texas Instruments DLPLCRC910EVM評(píng)估模塊基于 DLP? LightCrafter? DLPC910控制器。DLPLCRC910EVM參考設(shè)計(jì)可幫助使用DLPC91
    的頭像 發(fā)表于 08-20 11:31 ?1162次閱讀
    DLP? LightCrafter? DLPC<b class='flag-5'>910</b>評(píng)估模塊技術(shù)解析與應(yīng)用指南

    睿海光電800G模塊助力全球AI基建升級(jí)

    在全球數(shù)字化轉(zhuǎn)型加速的背景下,超高速模塊作為數(shù)據(jù)中心與AI算力網(wǎng)絡(luò)的核心部件,正經(jīng)歷從400G向800G、1.6T的迭代浪潮。在這一賽道中,深圳市睿海光電科技有限公司(以下簡(jiǎn)稱“睿海光電”)憑借
    發(fā)表于 08-13 19:05

    投入式水位計(jì)與傳統(tǒng)浮子式儀器性能對(duì)比分析

    在水位監(jiān)測(cè)領(lǐng)域,投入式水位計(jì)與浮子式儀器是兩類主流設(shè)備。南京峟思將從工程實(shí)用性角度出發(fā),對(duì)兩者進(jìn)行五大核心性能對(duì)比,為巖土工程、水利安全監(jiān)測(cè)領(lǐng)域的采購(gòu)及技術(shù)人員提供客觀參考。一、測(cè)量原理與精度投入式
    的頭像 發(fā)表于 07-28 13:44 ?453次閱讀
    投入式水位計(jì)與傳統(tǒng)浮子式儀器<b class='flag-5'>性能對(duì)比</b>分析

    AIWA PX910 維修手冊(cè)

    AIWA PX910 維修手冊(cè)
    發(fā)表于 06-09 15:01 ?4次下載

    800KVA伏儲(chǔ)能并網(wǎng)變壓器性能全解析

    800KVA伏儲(chǔ)能并網(wǎng)變壓器知識(shí)科普:技術(shù)、性能、選配與容量配置——卓爾凡電力科技的卓越之選 一、引言 在全球?qū)η鍧嵞茉吹男枨笕找嬖鲩L(zhǎng)的今天,13650169149卓爾凡伏儲(chǔ)能并網(wǎng)
    的頭像 發(fā)表于 04-11 10:57 ?1289次閱讀
    <b class='flag-5'>800</b>KVA<b class='flag-5'>光</b>伏儲(chǔ)能并網(wǎng)變壓器<b class='flag-5'>性能</b>全解析

    DeepSeek推動(dòng)AI算力需求:800G模塊的關(guān)鍵作用

    : 飛速(FS)模塊支持最新的標(biāo)準(zhǔn)協(xié)議,確保與多種現(xiàn)有設(shè)備和網(wǎng)絡(luò)架構(gòu)的兼容性,并支持驗(yàn)證告警、DDM數(shù)據(jù)及模塊識(shí)別的準(zhǔn)確性,保障系統(tǒng)正常運(yùn)行。這一特性使得飛速(FS)800G模塊品質(zhì)可靠,
    發(fā)表于 03-25 12:00