91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探究GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(下)

Achronix ? 來源:Achronix ? 作者:黃侖 ? 2021-12-03 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

接上一篇。。。。。。

5.

GDDR6技術(shù)細(xì)節(jié)以及Clamshell模式

GDDR6它是采用16n Prefetch結(jié)構(gòu),一次寫操作或者讀操作的數(shù)據(jù)是16n。每個GDDR6顆粒有兩個獨立的通道,每個獨立的通道訪問獨立的內(nèi)存空間。對于每個通道,讀或者寫的位寬是256bit或者32Byte。P-to-S converter是一個并變串的轉(zhuǎn)換器,把每個256bit位寬的數(shù)據(jù)轉(zhuǎn)換成16位總線,每位總線上傳輸16bit的數(shù)據(jù)。這樣GDDR6每個通道最小的訪問粒度是256bit或者32Byte。

根據(jù)GDDR6這樣16n 預(yù)取結(jié)構(gòu),內(nèi)部存儲陣列如果訪問周期是1ns,則I/O上的數(shù)據(jù)率則是16Gbps。

一個GDDR6控制器支持兩個獨立通道,一個GDDR6顆粒也是兩個獨立的通道,所以在通常模式下,一個GDDR6控制器對應(yīng)一個GDDR6的顆粒,用x16模式,實現(xiàn)最高512Gb/s的帶寬。

因為目前市面上GDDR6顆粒的最大容量是16Gb,在有些應(yīng)用中如果對容量有一定的要求,可以使用一種叫Clamshell的連接方式,如圖7[5]所示,每個GDDR6控制器連接兩個GDDR6顆粒,每個GDDR6的顆粒用x8模式,這樣在這種Clamshell模式下,帶寬不變,但是支持的GDDR6的容量翻倍了。

6.

GDDR6在7t1500上的讀寫效率

最后,我們測試一下7t1500上GDDR6控制器的讀寫效率,所有的測試結(jié)果基于仿真數(shù)據(jù)。因為7t1500包含了片上網(wǎng)絡(luò)(NoC),并且NoC已經(jīng)實現(xiàn)了仲裁,時鐘域轉(zhuǎn)換的邏輯,我們用三個用戶邏輯通過NoC去訪問同一個GDDR6 Channel,得到的綜合讀寫效率更能反映用戶實際運用中的場景。

在不同的突發(fā)長度和不同的地址訪問方式下的測試結(jié)果如圖所示。

1b445d18-52b8-11ec-b2e9-dac502259ad0.png

圖9 GDDR6讀寫效率

后面我們會繼續(xù)深入了解Speedster 7t FPGA芯片上的一些特性,以及這些特性如何運用在數(shù)據(jù)加速和網(wǎng)絡(luò)加速中,敬請期待。如需更多信息或者有任何疑問您可以通過Achronix公眾號里的聯(lián)系方式聯(lián)系我們,也可訪問Achronix公司官方網(wǎng)站http://www.achronix.com

如果需要進(jìn)一步聯(lián)絡(luò)Achronix中國區(qū)技術(shù)和產(chǎn)品應(yīng)用團(tuán)隊,請發(fā)送郵件到:dawson.guo@achronix.com。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94744
  • 仿真
    +關(guān)注

    關(guān)注

    54

    文章

    4480

    瀏覽量

    138208
  • FPGA芯片
    +關(guān)注

    關(guān)注

    4

    文章

    250

    瀏覽量

    40996

原文標(biāo)題:GDDR6給FPGA帶來的大帶寬存儲優(yōu)勢以及性能測試(下)

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AMD 推出第二代 Kintex UltraScale+ 中端FPGA,助力智能高性能系統(tǒng)

    · 新款FPGA 可為下一代醫(yī)療、工業(yè)、測試與測量以及廣播系統(tǒng)提供高帶寬、實時性能與廣泛連接。 · 借助成熟的工具、先進(jìn)的安全特性
    的頭像 發(fā)表于 02-04 16:11 ?4.7w次閱讀
    AMD 推出第二代 Kintex UltraScale+ 中端<b class='flag-5'>FPGA</b>,助力智能高<b class='flag-5'>性能</b>系統(tǒng)

    性能網(wǎng)絡(luò)存儲設(shè)計:NVMe-oF IP的實現(xiàn)探討

    ,給出如何測試,以及結(jié)果。 https://www.bilibili.com/video/BV1f6mbBeEiH/?spm_id_from=333.337.search-card.all.click&vd_source
    發(fā)表于 12-19 18:45

    HBM量價齊飛,UFS加速普及:存儲狂飆的“最后質(zhì)檢”攻堅戰(zhàn)

    HBM 量價齊飛、UFS 4.1 普及推動存儲技術(shù)狂飆,卻凸顯燒錄與測試這一 “最后質(zhì)檢” 難題。高端存儲性能競賽(HBM4 帶寬 2TB/
    的頭像 發(fā)表于 12-18 11:15 ?423次閱讀

    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    昆侖芯R200加速卡基于7nm XPU-R架構(gòu),在150W功耗提供256 TOPS INT8算力,側(cè)重高性能推理。配備最高32GB GDDR6內(nèi)存(512GB/s帶寬)及108路視頻
    的頭像 發(fā)表于 12-14 13:12 ?1589次閱讀
    昆侖芯R200 AI加速卡技術(shù)規(guī)格解析

    如何利用Verilog HDL在FPGA上實現(xiàn)SRAM的讀寫測試

    本篇將詳細(xì)介紹如何利用Verilog HDL在FPGA上實現(xiàn)SRAM的讀寫測試。SRAM是一種非易失性存儲器,具有高速讀取和寫入的特點。在FPGA中實現(xiàn)SRAM讀寫
    的頭像 發(fā)表于 10-22 17:21 ?4336次閱讀
    如何利用Verilog HDL在<b class='flag-5'>FPGA</b>上實現(xiàn)SRAM的讀寫<b class='flag-5'>測試</b>

    FPGA測試DDR帶寬跑不滿的常見原因及分析方法

    FPGA測試 DDR 帶寬時,帶寬無法跑滿是常見問題。下面我將從架構(gòu)、時序、訪問模式、工具限制等多個維度,系統(tǒng)梳理導(dǎo)致 DDR 帶寬
    的頭像 發(fā)表于 10-15 10:17 ?1022次閱讀

    【上海晶珩睿莓1開發(fā)板試用體驗】5、網(wǎng)絡(luò)性能測試

    定的結(jié)果、JSON 輸出(便于腳本化)以及更好的單次測試控制。 主要用途: 測量點對點帶寬(客戶端 ? 服務(wù)端) 測試不同協(xié)議(TCP/UDP)的吞吐量與丟包情況 驗證鏈路質(zhì)量、MTU
    發(fā)表于 08-19 10:25

    AI狂飆, FPGA會掉隊嗎? ()

    上篇和中篇,我們介紹了FPGA的四大特點,以及這些特點所帶來的市場和應(yīng)用機(jī)會,概述如下:硬件可編程:通信網(wǎng)絡(luò),芯片驗證等;并行和實時:視頻圖像處理,AI推理等;高集成度:工業(yè)機(jī)器人,激光雷達(dá)等
    的頭像 發(fā)表于 08-11 09:25 ?3897次閱讀
    AI狂飆, <b class='flag-5'>FPGA</b>會掉隊嗎? (<b class='flag-5'>下</b>)

    電極阻抗測試儀精度0.1%怎么選?行業(yè)工程師避坑指南

    :Bamtone班通的TDR阻抗測試儀基于時域反射原理設(shè)計,具有高帶寬特性,適用于PCB硬板、FPC軟板阻抗條快速測試以及高頻電纜、雙絞線、電線電纜的阻抗
    發(fā)表于 07-28 10:13

    PCIe協(xié)議分析儀能測試哪些設(shè)備?

    場景:監(jiān)測GPU與主機(jī)之間的PCIe通信,分析數(shù)據(jù)傳輸效率、延遲和帶寬利用率。 應(yīng)用價值:優(yōu)化大規(guī)模AI訓(xùn)練任務(wù)的數(shù)據(jù)加載和模型參數(shù)同步,例如在多GPU系統(tǒng)中測試PCIe交換機(jī)的性能和穩(wěn)定性。
    發(fā)表于 07-25 14:09

    簡單認(rèn)識高帶寬存儲

    HBM(High Bandwidth Memory)即高帶寬存儲器,是一種基于 3D 堆疊技術(shù)的高性能 DRAM(動態(tài)隨機(jī)存取存儲器)。其核心設(shè)計是通過硅通孔(TSV)和微凸塊(Mic
    的頭像 發(fā)表于 07-18 14:30 ?4257次閱讀

    性能低功耗雙核Wi-Fi6+BLE5.3二合一

    功耗無線專業(yè)知識,最大限度地發(fā)揮Wi-Fi和BLE在各種應(yīng)用中的超低功耗優(yōu)勢。作為一款支持BLE模式和Wi-Fi 6雙頻連接的模塊,它采用獨立天線設(shè)計,互不干擾,為用戶提供了更加穩(wěn)定和可靠的無線連接性能
    發(fā)表于 06-28 21:42

    RDMA簡介1之RDMA開發(fā)必要性

    靈活性、高并行能力及可高度定制化的特點,能夠在各種應(yīng)用場景實現(xiàn)高帶寬的數(shù)據(jù)采集、存儲及傳輸。然而FPGA并不擅長進(jìn)行數(shù)據(jù)存儲工作,僅在內(nèi)部
    發(fā)表于 06-03 14:38

    如何用LOTO示波器測量變壓器帶寬?

    的擴(kuò)展頻率范圍內(nèi),該模塊仍展現(xiàn)出較為良好的信號輸出特性。 后進(jìn)行對比測試,對共模電感磁環(huán)、驅(qū)動隔離變壓器,進(jìn)口共模濾波模塊以及 LOTO 注入變壓器的帶寬性能進(jìn)行了評估,如下圖所示
    發(fā)表于 05-08 17:33

    HBM新技術(shù),橫空出世:引領(lǐng)內(nèi)存芯片創(chuàng)新的新篇章

    隨著人工智能、高性能計算(HPC)以及數(shù)據(jù)中心等領(lǐng)域的快速發(fā)展,對內(nèi)存帶寬和容量的需求日益增長。傳統(tǒng)的內(nèi)存技術(shù),如DDR和GDDR,已逐漸難以滿足這些新興應(yīng)用對高
    的頭像 發(fā)表于 03-22 10:14 ?4851次閱讀
    HBM新技術(shù),橫空出世:引領(lǐng)內(nèi)存芯片創(chuàng)新的新篇章