91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

這個計算世界的一個關(guān)鍵的未來要素是移動數(shù)據(jù)

M8kW_icbank ? 來源:半導(dǎo)體行業(yè)觀察 ? 2019-12-10 14:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關(guān)于這個計算世界的一個關(guān)鍵的未來要素是移動數(shù)據(jù)。移動數(shù)據(jù)需要功率,以至于從內(nèi)存中調(diào)用數(shù)據(jù)要比實際對其進行“計算”消耗更多的功率。這就是我們有緩存的原因,但即使有緩存,也需要對CPU進行廣泛的管理。對于簡單的操作,如位轉(zhuǎn)移或和操作,目標是將計算能力轉(zhuǎn)移到主DRAM本身,這樣它就不必來回穿梭。今年在Hot Chips, UPMEM是第一批展示新技術(shù)的公司之一。

對于任何已經(jīng)完成任何形式的通用計算的人來說,通過算法推送一堆輸入來獲得結(jié)果,對于編寫代碼的人來說,通常有兩個高級的心理階段需要克服:首先是讓它工作,其次是優(yōu)化它。算法需要產(chǎn)生正確的結(jié)果,越快越好 - 慢速正確的結(jié)果通常是無用的,而快速的錯誤的結(jié)果也是無用的。如果能夠以更低的功率完成,那么也會減少開銷。

In-Memory Processing或“Processing In-Memory”背后的想法是,當內(nèi)存仍在DRAM中時,應(yīng)該完成一些簡單的整數(shù)或浮點運算 - 無需將其推送到CPU操作,然后將其發(fā)回。如果數(shù)據(jù)可以保留在那里并進行更新,則可以節(jié)省時間和功耗,而不會影響結(jié)果?;蛘撸绻Y(jié)果被發(fā)送回主存儲器并且最終的XOR應(yīng)用于存儲器中的數(shù)據(jù),則可以減少CPU上的計算。這可以釋放主CPU核心來執(zhí)行其他與計算相關(guān)的事情,或者如果它是一個限制因素,則會減少有效內(nèi)存帶寬。

UPMEM所做的是在DRAM工藝節(jié)點上開發(fā)內(nèi)置于DRAM芯片本身的數(shù)據(jù)處理單元(DPU)。每個DPU可以訪問64 MB的DRAM,并且相當于該內(nèi)存的1 GB / s帶寬。DPU構(gòu)建在一個干凈的32位ISA上,具有大量優(yōu)化功能,例如0循環(huán)條件jmps,組合SHIFT + X指令(如SHIFT + ADD或SHIFT + SUB),基本邏輯指令,SHIFT和rotate指令。編程模型使得基于c語言的庫能夠處理所有常見問題,UPMEM預(yù)計大多數(shù)應(yīng)用程序需要幾百行代碼,少數(shù)人組成的團隊只需2-4周就可以更新軟件。

UPMEM所報的大數(shù)字包括更好的TCO、更好的ROI,以及潛在的100億美元目標市場。我們會在適當?shù)臅r候討論這些。

(我個人更喜歡PIM-DIMM這個名字)

UPMEM提出的是一種類似于DDR4 RDIMM的標準產(chǎn)品,每個64MB的內(nèi)存都可以訪問它的一個DPU。DPU內(nèi)置于DRAM本身,使用內(nèi)存制造節(jié)點。例如,UPMEM正在宣傳它正在制作一個4 Gb DDR4-2400芯片,用于嵌入8個DPU 512 MB的模塊, DPU以500 MHz運行。UPMEM計劃將這4個Gb芯片中的16個放入單個DDR4 RDIMM模塊中,提供8 GB模塊,內(nèi)置128個DPU。

目標是最終生產(chǎn)128 GB模塊,總共2048個DPU。在DPU與其64 MB內(nèi)存之間的有效1 GB / s帶寬下,這意味著DPU與內(nèi)存之間的有效帶寬為2 TB / s。由于DPU的工作方式,這是必需的,這將在下面解釋。 處理器和技術(shù)已獲得專利,但UPMEM表示,他們正在與內(nèi)存供應(yīng)商合作開發(fā)20nm級工藝。添加DPU內(nèi)核可以增加非常小的裸片面積,并且可以在2-3個金屬層內(nèi)啟用,因為邏輯的密度小于前沿邏輯實現(xiàn)的密度。與領(lǐng)先的CPU實現(xiàn)相比,我們的想法是實現(xiàn)10倍的總能效和可擴展性。

目前,UPMEM為客戶提供軟件模擬和硬件FPGA驗證模擬器 - 實際上,感興趣的各方可以在AWS f1.16x大型實例上模擬UPMEM平臺。實際的PIM-DRAM模塊樣品將在第三季度向高端客戶發(fā)貨,隨著更多公司對此感興趣并加入,我們計劃在明年繼續(xù)推廣。UPMEM引用性能示例表示,他們已經(jīng)看到基因組模式匹配的速度提高了22x-25x,數(shù)據(jù)庫索引搜索的吞吐量提高了18倍,延遲為原來的1/100,索引搜索應(yīng)用程序的TCO提高了14倍。

在成本方面,UPMEM沒有說明計劃以多少價格出售其技術(shù),但與其他解決方案相比,UPMEM有望成為一個邊際成本。在一次演示中,該公司表示,他們的解決方案可以用一個400美元的增強內(nèi)存解決方案替代一個潛在的40000美元的服務(wù)器,并指出使用PIM在軟件許可、數(shù)據(jù)中心空間和功耗/效率方面產(chǎn)生了連鎖反應(yīng)。

UPMEM提供了一些關(guān)于電力消耗的數(shù)據(jù)。在這張幻燈片中,該公司比較了兩臺服務(wù)器,一臺帶有pimm - dram,另一臺沒有。在這種情況下,“DRAM到處理器的64位操作數(shù)”召回需要在常規(guī)服務(wù)器上運行3000個pJ,將數(shù)據(jù)從DRAM中取出,并傳遞到緩存中,而在PIM-DRAM上,只需將數(shù)據(jù)移動到DPU上,同樣的操作只需要150個pJ的能量。DPU上的操作本身實際上需要2倍的功率(20 pJ與10 pJ相比),但是總的功率效率增益是170 pJ vs 3010 pJ,或者略低于20x。

這張幻燈片指出的一件可能令人困惑的事情是服務(wù)器的功耗——常規(guī)服務(wù)器列出的功耗只有300W,但是PIM解決方案的功耗高達700W。這是因為在UPMEM的解決方案下,每個DRAM模塊的功耗將會增加。

UPMEM提出的第一個產(chǎn)品模塊是前面提到的8 GB DDR4-2400模塊,其中128個DPU各自覆蓋64 MB內(nèi)存并以500 MHz運行。對于單個4 Gb裸片(其中16個在8 GB模塊中,18個用于RDIMM ECC),我們?nèi)匀惶幱? cm2的常規(guī)裸片尺寸,但每個芯片所需的功率約為1.2瓦。

如果我們研究所有16/18芯片,我們可以看到每個8GB的模塊將是19.2-21.6瓦。對于DRAM來說,這是一個很大的功耗,而且實際上超過了DDR4插槽的額定范圍。從這個角度來看,Intel的512GB Optane模塊有一個18w的運行模式,服務(wù)器可以冷卻到18w,但是也可以低到12w。UPMEM并沒有說明它是否能夠通過降低DPU頻率來降低每個模塊的功率。

UPMEM的目標是用PIM-DRAM模塊替換服務(wù)器中的DRAM模塊。該公司表示,DDR4接口并不適合這類事情,但他們已經(jīng)解決了這個問題。在一份簡報中,該公司指出,目前至少需要為一個操作系統(tǒng)安裝非PIM-DRAM。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DRAM
    +關(guān)注

    關(guān)注

    41

    文章

    2396

    瀏覽量

    189309
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11294

    瀏覽量

    225341
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3215

    瀏覽量

    76407

原文標題:關(guān)于內(nèi)存內(nèi)計算,這家公司有新想法

文章出處:【微信號:icbank,微信公眾號:icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    聚芯微電子邀您共赴MWC 2026世界移動通信大會

    2026年3月,全球通信行業(yè)的目光將再次聚焦西班牙巴塞羅那——2026年世界移動通信大會(MWC 2026)即將盛大啟幕。作為全球移動通信領(lǐng)域最具影響力的盛會,MWC每年匯聚來自世界
    的頭像 發(fā)表于 03-02 16:50 ?781次閱讀

    世界移動通信大會|開啟無線測試與人工智能融合的未來篇章

    世界移動通信大會 (MWC) 云集了塑造未來的前沿無線創(chuàng)新技術(shù)。在人工智能正深刻變革著設(shè)備連接方式與性能表現(xiàn)的今天,確保在實際應(yīng)用場景中獲得可靠結(jié)果變得比以往任何時候都更為關(guān)鍵。 Li
    的頭像 發(fā)表于 02-12 14:34 ?564次閱讀

    網(wǎng)絡(luò)接口:數(shù)字世界的“門鈴”,你了解多少?

    。要把計算機接入互聯(lián)網(wǎng),需要配置四關(guān)鍵要素:IP地址、子網(wǎng)掩碼、網(wǎng)關(guān)地址和DNS服務(wù)器地址。 IP地址就像是網(wǎng)絡(luò)世界的“家庭地址”,能唯
    發(fā)表于 11-26 18:53

    《AI芯片:科技探索與AGI愿景》—— 勾勒計算未來的戰(zhàn)略羅盤

    、數(shù)據(jù)與算力三者間錯綜復(fù)雜的共生關(guān)系,并前瞻性地討論了能耗、倫理與全球競爭等關(guān)鍵議題。 書中幅AGI技術(shù)演進路線圖(如圖2)令人印象深刻,它清晰地標定了我們從“深度學習爆發(fā)”到“具身智能”,最終邁向
    發(fā)表于 09-17 09:32

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    新信息的情況下持續(xù)學習和改進的AI計算方式。 終身短發(fā)怎么保持已有知識和技能的有效性呢 ①知識蒸餾:將已有知識從模型轉(zhuǎn)移到另一個模型 ②知識更新:根據(jù)新知識更新已有知識 ③知識重組
    發(fā)表于 09-14 14:04

    影響保護元器件的可靠性以及保護響應(yīng)時間的關(guān)鍵要素有哪些?

    影響保護元器件的可靠性以及保護響應(yīng)時間的關(guān)鍵要素?
    發(fā)表于 09-08 06:45

    聲智科技聲學模型賦予AI感知物理世界

    在科技浪潮的尖端,新時代正悄然開啟。NVIDIA創(chuàng)始人黃仁勛曾預(yù)言,未來通用人工智能(AGI)將不再局限于虛擬世界,而是能夠與物理世界
    的頭像 發(fā)表于 09-02 17:46 ?1476次閱讀

    有方科技引領(lǐng)城市感知數(shù)據(jù)要素化創(chuàng)新實踐

    基于有方科技城域物聯(lián)感知平臺的“車輛涉水救援與理賠佐證場景解決方案”成功入選長沙市第批合格公共數(shù)據(jù)資源開發(fā)利用場景解決方案。該方案在本月長沙市城市防汛過程中發(fā)揮出了關(guān)鍵作用,這標志著有方科技在推動
    的頭像 發(fā)表于 07-26 15:00 ?934次閱讀

    自動駕駛中常提的世界模型是啥?

    種對外部環(huán)境進行抽象和建模的技術(shù),讓自動駕駛系統(tǒng)在簡潔的內(nèi)部“縮影”里,對真實世界進行描述與預(yù)測,從而為感知、決策和規(guī)劃等關(guān)鍵環(huán)節(jié)提供有力支持。 什么是
    的頭像 發(fā)表于 06-24 08:53 ?1194次閱讀
    自動駕駛中常提的<b class='flag-5'>世界</b>模型是<b class='flag-5'>個</b>啥?

    Si-IGBT+SiC-MOSFET并聯(lián)混合驅(qū)動逆變器設(shè)計的關(guān)鍵要素

    Si-IGBT+SiC-MOSFET并聯(lián)混合驅(qū)動逆變器設(shè)計的關(guān)鍵要素
    的頭像 發(fā)表于 06-06 08:25 ?3306次閱讀
    Si-IGBT+SiC-MOSFET并聯(lián)混合驅(qū)動逆變器設(shè)計的<b class='flag-5'>關(guān)鍵</b><b class='flag-5'>要素</b>

    【HarmonyOS NEXT】關(guān)鍵資產(chǎn)存儲開發(fā)案例

    false; } } ![](<> \"點擊并拖拽以移動\") 3.5 removeSync 刪除資產(chǎn)數(shù)據(jù) /** * 刪除關(guān)鍵資產(chǎn) * @param
    發(fā)表于 05-16 16:21

    文帶你了解工業(yè)計算機尺寸

    項艱巨的任務(wù)。本博客將指導(dǎo)您了解關(guān)鍵的工業(yè)計算機尺寸、使用案例。關(guān)鍵工業(yè)計算機外形要素及其使用
    的頭像 發(fā)表于 04-24 13:35 ?1079次閱讀
    <b class='flag-5'>一</b>文帶你了解工業(yè)<b class='flag-5'>計算</b>機尺寸

    解碼未來:數(shù)字編碼器如何重塑智能世界

    標題:《解碼未來:數(shù)字編碼器如何重塑智能世界》 在數(shù)字化浪潮席卷全球的今天,每一個微小的信號轉(zhuǎn)換都可能成為推動技術(shù)革命的關(guān)鍵。而在這場無聲的變革中,數(shù)字編碼器——
    的頭像 發(fā)表于 04-07 08:44 ?812次閱讀
    解碼<b class='flag-5'>未來</b>:數(shù)字編碼器如何重塑智能<b class='flag-5'>世界</b>

    SMT貼片加工中的那些關(guān)鍵要素,你了解嗎?

    站式PCBA智造廠家今天為大家講講SMT貼片加工流程中的關(guān)鍵要素有哪些?SMT貼片加工流程中的關(guān)鍵要素。隨著電子產(chǎn)品日益小型化、輕量化的發(fā)
    的頭像 發(fā)表于 04-01 09:46 ?983次閱讀

    邊緣計算 vs. 云計算,誰才是工業(yè)物聯(lián)網(wǎng)的未來?

    在物聯(lián)網(wǎng)的浪潮中,邊緣計算正以超低延遲、高效網(wǎng)絡(luò)和增強安全性,重新定義數(shù)據(jù)處理方式。無論是工業(yè)控制還是商業(yè)應(yīng)用,邊緣計算都是邁向智能化未來關(guān)鍵
    的頭像 發(fā)表于 03-26 11:13 ?881次閱讀
    邊緣<b class='flag-5'>計算</b> vs. 云<b class='flag-5'>計算</b>,誰才是工業(yè)物聯(lián)網(wǎng)的<b class='flag-5'>未來</b>?