91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM開發(fā)“混合精度內(nèi)存計算”,能耗降低了80倍

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-04-27 17:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

IBM Research 稱,已經(jīng)開發(fā)出了一種內(nèi)存計算新方法,可以為微軟和谷歌尋求的高性能和機(jī)器學(xué)習(xí)應(yīng)用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上發(fā)表的一篇論文中,IBM 研究人員描述了這種新的 “混合精度內(nèi)存計算” 方法。

IBM 關(guān)注傳統(tǒng)計算體系結(jié)構(gòu)的不同看法,在這種體系結(jié)構(gòu)中,軟件需要在單獨的 CPURAM 單元之間進(jìn)行數(shù)據(jù)傳輸。

據(jù) IBM 稱,這種被稱為 “馮·諾依曼” 的體系結(jié)構(gòu)設(shè)計,為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)應(yīng)用制造了一個瓶頸,這些應(yīng)用需要在處理單元和內(nèi)存單元之間進(jìn)行更大的數(shù)據(jù)傳輸。傳輸數(shù)據(jù)也是一個耗能的過程。

應(yīng)對這一挑戰(zhàn),IBM 給出的一種方法是模擬相變內(nèi)存(PCM)芯片,該芯片目前還處于原型階段,500 萬個納米級 PCM 器件組成 500×2000 交叉陣列。

PCM 的一個關(guān)鍵優(yōu)勢是可以處理大多數(shù)密集型數(shù)據(jù)處理,而無需將數(shù)據(jù)傳輸?shù)?CPU 或 GPU,這樣以更低的能量開銷實現(xiàn)更快速的處理。

IBM 的 PCM 單元將作為 CPU 加速器,就像微軟用于加速 Bing 和加強(qiáng)機(jī)器學(xué)習(xí)的 FPGA 芯片一樣。

據(jù) IBM 稱,研究表明在某些情況下,其 PCM 芯片能夠以模擬的方式進(jìn)行操作,執(zhí)行計算任務(wù),并提供與 4 位 FPGA 存儲器芯片相當(dāng)?shù)臏?zhǔn)確度,但能耗降低了 80 倍。

模擬 PCM 硬件并不適合高精度計算。所幸的是,數(shù)字型 CPU 和 GPU 是適合的,IBM 認(rèn)為混合架構(gòu)可以實現(xiàn)更高性能、更高效率和更高精度的平衡。

這種設(shè)計將大部分處理留給內(nèi)存,然后將較輕的負(fù)載交給 CPU 進(jìn)行一系列的精度修正。

根據(jù) IBM 蘇黎世實驗室的電氣工程師、也是該論文的主要作者 Manuel Le Gallo 稱,這種設(shè)計有助于云中的認(rèn)知計算,有助于釋放對高性能計算機(jī)的訪問。

Le Gallo 表示:“憑借我們現(xiàn)在的精確度,我們可以將能耗降低到是使用高精度 GPU 和 CPU 的 1/6?!?/p>

“所以我們的想法是,為了應(yīng)對模擬計算中的不精確性,我們將其與標(biāo)準(zhǔn)處理器結(jié)合起來。我們要做的是將大量計算任務(wù)轉(zhuǎn)移到 PCM 中,但同時得到最終的結(jié)果是精確的?!?/p>

這種技術(shù)更適合于如數(shù)字圖像識別等應(yīng)用,其中誤解少數(shù)像素并不會妨礙整體識別,此外還有一些醫(yī)療應(yīng)用。

“你可以用低精度完成大量計算——以模擬的方式,PCM 會非常節(jié)能——然后使用傳統(tǒng)處理器來提高精度?!?/p>

對于只有 1 兆字節(jié)大小的 IBM 原型內(nèi)存芯片,現(xiàn)在還處于初期階段。為了適用于現(xiàn)代數(shù)據(jù)中心的規(guī)?;瘧?yīng)用,它需要達(dá)到千兆字節(jié)的內(nèi)存量級,分布在數(shù)萬億個 PCM 中。

盡管如此,IBM 認(rèn)為可以通過構(gòu)建更大規(guī)模的 PCM 設(shè)備或使其中 PCM 并行運(yùn)行來實現(xiàn)這一目標(biāo)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1868

    瀏覽量

    77024
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11285

    瀏覽量

    225144
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5199

    瀏覽量

    135530

原文標(biāo)題:IBM 取得內(nèi)存計算新突破,AI 訓(xùn)練能耗降低 80 倍

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    全球唯一?IBM更新量子計算路線圖:2029年交付!

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近年來,量子計算似乎正在取得越來越多突破,國內(nèi)外都涌現(xiàn)出不少的技術(shù)以及產(chǎn)品突破。作為量子計算領(lǐng)域的先驅(qū)之一,IBM近日公布了其量子計算路線圖,宣布將在20
    的頭像 發(fā)表于 06-15 00:01 ?9142次閱讀
    全球唯一?<b class='flag-5'>IBM</b>更新量子<b class='flag-5'>計算</b>路線圖:2029年交付!

    深度解析REF80:超精密電壓參考的卓越之選

    的溫度漂移和出色的長期穩(wěn)定性,為各類高精度應(yīng)用提供了可靠的解決方案。 文件下載: ref80.pdf 1. REF80的核心特性 1.1 超精密輸出與低元件需求 REF80提供7.6V
    的頭像 發(fā)表于 03-02 10:15 ?150次閱讀

    如何使用EtherCAT總線網(wǎng)關(guān)與福TwinCAT3系列PLC通訊

    01 概述 EtherCAT (以太網(wǎng)控制自動化技術(shù)) 是由德國福公司開發(fā)的、基于以太網(wǎng)的開放現(xiàn)場總線系統(tǒng),EtherCAT為系統(tǒng)的實時性能和拓?fù)涞撵`活性樹立了新的標(biāo)準(zhǔn),同時,它還符合甚至降低了
    的頭像 發(fā)表于 01-15 13:51 ?1695次閱讀
    如何使用EtherCAT總線網(wǎng)關(guān)與<b class='flag-5'>倍</b>福TwinCAT3系列PLC通訊

    為什么FPU在MCU中很重要呢?

    模式,從而降低了整體能耗。雖然 FPU 本身工作時功耗比普通邏輯高,但快速完成任務(wù)帶來的節(jié)能效果通常更顯著。 提高精度和確定性: 專用硬件設(shè)計通常能更精確地遵循 IEEE 754 標(biāo)準(zhǔn),并提供更可預(yù)測
    發(fā)表于 11-18 07:05

    一文了解Mojo編程語言

    和 MLIR(多級中間表示)技術(shù),Mojo 的性能接近 C++,甚至在某些任務(wù)中比 Python 快數(shù)萬。 支持直接操作硬件資源,如內(nèi)存管理和 SIMD(單指令多數(shù)據(jù))指令,適合高性能計算需求。 系統(tǒng)級
    發(fā)表于 11-07 05:59

    IBM與Anthropic達(dá)成戰(zhàn)略合作

    近日,在面向全球開發(fā)者與技術(shù)專家的年度盛會 TechXchange 2025 期間,IBM(紐約證券交易所代碼:IBM)與Anthropic 宣布達(dá)成戰(zhàn)略合作:IBM 將 Anthro
    的頭像 發(fā)表于 10-15 17:55 ?706次閱讀

    能耗數(shù)據(jù)采集能夠計算碳排放嗎

    能耗數(shù)據(jù)采集 能夠 為計算碳排放提供關(guān)鍵基礎(chǔ),但需結(jié)合額外的參數(shù)和轉(zhuǎn)換模型才能實現(xiàn)精準(zhǔn)計算。以下是具體分析: 一、能耗數(shù)據(jù)與碳排放的直接關(guān)聯(lián) 碳排放的核心來源是能源消耗過程中化石燃料的
    的頭像 發(fā)表于 09-12 17:42 ?1798次閱讀

    長電科技光電合封解決方案降低數(shù)據(jù)互連能耗

    今年以來,光電合封(Co-packaged Optics,CPO)技術(shù)加速邁向產(chǎn)業(yè)化:國際巨頭推出交換機(jī)CPO方案降低數(shù)據(jù)互連能耗;國內(nèi)企業(yè)則在集成光引擎等產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)突破。作為先進(jìn)封裝技術(shù)的領(lǐng)軍
    的頭像 發(fā)表于 09-05 15:46 ?4431次閱讀

    芯原超低能耗NPU可為移動端大語言模型推理提供超40 TOPS算力

    AI需求而設(shè)計,不僅能夠為AI PC等終端設(shè)備提供強(qiáng)勁算力支持,而且能夠應(yīng)對智慧手機(jī)等移動終端對低能耗更為嚴(yán)苛的挑戰(zhàn)。 芯原的超低能耗NPU IP具備高度可配置、可擴(kuò)展的架構(gòu),支持混合精度
    的頭像 發(fā)表于 06-11 10:47 ?886次閱讀

    RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    與低功耗。相比傳統(tǒng)四核A72方案(如RK3399),單線程性能提升80%,多線程任務(wù)處理能力翻倍。 6TOPS獨立NPU: 支持INT8/INT16混合精度計算,可直接部署YOLOv
    發(fā)表于 04-15 10:48

    邊緣網(wǎng)關(guān)如何降低能耗數(shù)據(jù)延遲?

    邊緣計算網(wǎng)關(guān)在能耗數(shù)據(jù)采集場景中可以通過以下方式降低數(shù)據(jù)延遲: 1. 分布式計算架構(gòu):邊緣計算網(wǎng)關(guān)采用分布式
    的頭像 發(fā)表于 04-10 17:55 ?582次閱讀

    NRF54系列藍(lán)牙芯片的DK開發(fā)板工具介紹

    , Thread和Matter。 集成了頻率為128MHz的Arm Cortex-M33處理器,處理能力比nRF52840提高了一,同時降低了功耗。擁有1.5MB非易失性存儲器和256KB RAM,可同時
    發(fā)表于 03-26 22:24

    如何通過電源濾波器的優(yōu)化設(shè)計來降低其自身的能耗

    電源濾波器是電子設(shè)備穩(wěn)定運(yùn)行的重要組件,但其自身能耗問題不容忽視。通過選擇低損耗的電感和電容,優(yōu)化散熱設(shè)計和布局,可以顯著降低元件的損耗。此外,合理調(diào)整參數(shù)也有助于降低能耗
    的頭像 發(fā)表于 03-16 16:53 ?730次閱讀
    如何通過電源濾波器的優(yōu)化設(shè)計來<b class='flag-5'>降低</b>其自身的<b class='flag-5'>能耗</b>?

    IBM完成對 HashiCorp 的收購,打造全面的端到端混合云平臺

    (紐約證券交易所代碼:IBM)日前宣布已完成對?HashiCorp 的收購。HashiCorp?的產(chǎn)品可自動化和保護(hù)支撐混合云應(yīng)用程序和生成式 AI 的基礎(chǔ)設(shè)施。兩家公司的能力將共同幫助客戶加速創(chuàng)新
    的頭像 發(fā)表于 03-12 11:37 ?977次閱讀
    <b class='flag-5'>IBM</b>完成對 HashiCorp 的收購,打造全面的端到端<b class='flag-5'>混合</b>云平臺