91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

傳統(tǒng)用于數(shù)字設(shè)計的CPU是否已經(jīng)達(dá)到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自Synopsys的官方文章:

在數(shù)字設(shè)計的Implementation過程中,從RTL到GDSII的每一步都是高度計算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評估數(shù)百個partition的各種布局方案。一旦確定了布局方案,接下來就是進(jìn)行每個partition內(nèi)的其余步驟,以實(shí)現(xiàn)全芯片的implementation和signoff。由于每一步的計算需求已經(jīng)很高,并且還要乘以partition的數(shù)量,這就引發(fā)了一個問題:傳統(tǒng)用于數(shù)字設(shè)計的CPU是否已經(jīng)達(dá)到了容量極限?GPU是否能夠滿足計算需求?

如今,GPU以其處理人工智能機(jī)器學(xué)習(xí)、游戲和高性能計算等要求最為苛刻的工作負(fù)載而聞名。隨著芯片越來越大、越來越復(fù)雜,也許也是時候考慮用GPU來完成數(shù)字芯片設(shè)計的Implementation了。

CPU在EDA工作負(fù)載中的容量挑戰(zhàn)

CPU長期以來被認(rèn)為是計算機(jī)的“大腦”。擁有數(shù)十億個晶體管和多個處理核心,如今的CPU非常適合完成廣泛的任務(wù),并且能夠快速完成。另一方面,GPU最初是為特定目的設(shè)計的,但隨著時間的推移,它們也轉(zhuǎn)變?yōu)橥ㄓ玫牟⑿?a target="_blank">處理器。

一般來講,EDA工具都是在基于x86處理器的CPU上運(yùn)行的。然而,隨著多芯片設(shè)計等復(fù)雜架構(gòu)變得越來越普遍,我們正在接近CPU計算容量的限制。考慮到芯片設(shè)計團(tuán)隊始終面臨的上市時間壓力,利用額外的工具和技術(shù)來加速芯片設(shè)計過程的任何方面都是有意義的。在驗(yàn)證和分析方面,新思科技的PrimeSim和VCS仿真流程已經(jīng)從GPU加速中受益。雖然數(shù)字設(shè)計流程中的每個任務(wù)并不是都非常適合GPU,但有些任務(wù)確實(shí)可以加速。

最先進(jìn)的高性能數(shù)據(jù)中心x86 CPU核心平均有64到128個核心,每個box最多約有200個核心。需要更多核心的任務(wù)需要分布在許多box上;如果網(wǎng)絡(luò)不夠快,這會產(chǎn)生一些開銷。RTL到GDSII流程和優(yōu)化技術(shù)包含許多相互依賴性。為了使流程中的每個任務(wù)能夠成功并行執(zhí)行,作業(yè)分布在CPU box之間的數(shù)據(jù)共享必須非??焖?,延遲要小。然而,實(shí)際上,網(wǎng)絡(luò)延遲會妨礙周轉(zhuǎn)時間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴(kuò)展。每個核心執(zhí)行的操作更少,而且非常微小,以至于你可以在一個插座中擁有數(shù)萬個核心,以提供巨大的處理能力,同時保持可管理的占用空間。能夠從大規(guī)模并行性中受益的任務(wù)非常適合GPU。然而,這樣的任務(wù)也必須是主要單向的,因?yàn)槿魏螞Q策和迭代都會減慢進(jìn)程和/或需要回到CPU進(jìn)行“如果那么”決策。這排除了許多RTL到GDSII數(shù)字implementation流程中的任務(wù),盡管并非所有任務(wù)都不適合。

使用GPU加速加快布局過程

在數(shù)字設(shè)計流程中,自動布局是已經(jīng)展示出在GPU上運(yùn)行前景的一項(xiàng)任務(wù)。在商業(yè)環(huán)境中運(yùn)行的原型中,新思科技的Fusion Compiler GPU加速布局技術(shù)相比CPU,已經(jīng)展示出顯著的周轉(zhuǎn)時間優(yōu)勢:

使用GPU放置一個3nm GPU流處理器設(shè)計,包含1.4M個可放置的標(biāo)準(zhǔn)單元和20個可放置的硬宏,僅需38秒,相比之下,CPU驅(qū)動的布局需要13分鐘

使用GPU放置一個12nm汽車CPU設(shè)計,包含2.9M個可放置的標(biāo)準(zhǔn)單元和200個可放置的硬宏,僅需82秒,相比之下,CPU驅(qū)動的布局需要19分鐘

結(jié)合新思科技DSO.ai的AI驅(qū)動自動設(shè)計空間優(yōu)化,我們預(yù)計將在相同的完成時間線上將AI驅(qū)動的搜索空間擴(kuò)大15倍到20倍。這樣做可以使設(shè)計團(tuán)隊實(shí)現(xiàn)更好的功耗、性能和面積(PPA)結(jié)果。

在許多方面,由于對最終設(shè)計PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計算資源通常與強(qiáng)大的CPU計算集群分開,單個designer使用基于GPU的布局技術(shù)也能具有很高的生產(chǎn)力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動設(shè)計數(shù)據(jù)引入的延遲可能會限制吞吐量優(yōu)勢。

新的數(shù)據(jù)中心SoC正在設(shè)計中,CPU和GPU資源之間具有統(tǒng)一內(nèi)存,用于TB級工作負(fù)載。這些新興架構(gòu)消除了利用GPU加速所需的設(shè)計數(shù)據(jù)移動,并將允許我們考慮在數(shù)字設(shè)計流程中應(yīng)用GPU加速的其他位置,特別是當(dāng)設(shè)計師可以將GPU與AI驅(qū)動的implementation工具配對時,可以進(jìn)行更快、更廣泛的探索和更好的結(jié)果。隨著像新思科技.ai這樣的AI驅(qū)動的全棧EDA流程解決方案產(chǎn)生更好的PPA結(jié)果、更快的達(dá)到目標(biāo)時間和更高的工程生產(chǎn)力,人們只能想象GPU加速的加入將如何進(jìn)一步改變芯片設(shè)計。

總結(jié)

雖然芯片設(shè)計過程中的仿真部分對于在GPU上運(yùn)行并不陌生,但很快數(shù)字設(shè)計流程的各個方面也將有機(jī)會利用GPU加速。對于大型芯片或復(fù)雜架構(gòu)(如多芯片設(shè)計),CPU在運(yùn)行RTL到GDSII流程時所需的計算容量正在耗盡,無法達(dá)到期望的速度。憑借其可擴(kuò)展性和處理能力,GPU有可能提供更快的周轉(zhuǎn)時間和更好的芯片結(jié)果。使用GPU驅(qū)動的放置器進(jìn)行的原型實(shí)驗(yàn)已經(jīng)將布局速度提高了多達(dá)20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個強(qiáng)大的組合,以提高PPA(功耗、性能和面積)和上市時間。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片設(shè)計
    +關(guān)注

    關(guān)注

    15

    文章

    1155

    瀏覽量

    56676
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50091

    瀏覽量

    265241
  • RTL
    RTL
    +關(guān)注

    關(guān)注

    1

    文章

    394

    瀏覽量

    62644
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136923
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6516

原文標(biāo)題:GPU可以加速芯片設(shè)計的Implementaion嗎?

文章出處:【微信號:傅里葉的貓,微信公眾號:傅里葉的貓】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    吉時利數(shù)字源表2602B在電池容量測試中的應(yīng)用解析

    鋰離子電池作為現(xiàn)代電子設(shè)備核心動力源,其容量衰減直接影響設(shè)備續(xù)航能力。吉時利數(shù)字源表2602B憑借其高精度測量與多通道并行測試能力,為電池性能評估提供了全新技術(shù)路徑。本文從測試原理、操作步驟及數(shù)據(jù)分析維度,系統(tǒng)闡述2602B在電池容量
    的頭像 發(fā)表于 01-08 17:47 ?1088次閱讀
    吉時利<b class='flag-5'>數(shù)字</b>源表2602B在電池<b class='flag-5'>容量</b>測試中的應(yīng)用解析

    華為數(shù)字能源圓滿完成智能組串式構(gòu)網(wǎng)型儲能極限耐火試驗(yàn)

    華為數(shù)字能源在國際權(quán)威的獨(dú)立保障和風(fēng)險管理機(jī)構(gòu)DNV和第三方認(rèn)證機(jī)構(gòu)TüV南德的全程見證下,圓滿完成基于最新版UL9540A的華為智能組串式構(gòu)網(wǎng)型儲能大規(guī)模極限耐火試驗(yàn)。
    的頭像 發(fā)表于 01-07 09:49 ?289次閱讀

    備用電池的容量和環(huán)境兼容性對電能質(zhì)量在線監(jiān)測裝置的精度有何影響?

    備用電池的 容量 和 環(huán)境兼容性 均通過 影響供電穩(wěn)定性 間接作用于電能質(zhì)量在線監(jiān)測裝置的精度 —— 容量決定供電 “持續(xù)穩(wěn)定性”,環(huán)境兼容性決定供電 “動態(tài)穩(wěn)定性”,兩者共同保障裝置核心元件
    的頭像 發(fā)表于 11-27 18:00 ?1340次閱讀
    備用電池的<b class='flag-5'>容量</b>和環(huán)境兼容性對電能質(zhì)量在線監(jiān)測裝置的精度有何影響?

    【「高速數(shù)字設(shè)計(基礎(chǔ)篇)」閱讀體驗(yàn)】第六章 去耦電容的容量需求分析

    去耦電容容量別瞎猜!《高速數(shù)字設(shè)計》第6章教你量化計算,精準(zhǔn)選型 在高速數(shù)字電路設(shè)計中,去耦電容選多大容量是個難點(diǎn)?!陡咚?b class='flag-5'>數(shù)字設(shè)計》第6章“
    發(fā)表于 11-19 20:48

    串聯(lián)諧振試驗(yàn)裝置的核心工作邏輯是什么?和傳統(tǒng)耐壓設(shè)備比優(yōu)勢在哪?

    ,通常 50-100 倍)。? 對比傳統(tǒng)工頻耐壓設(shè)備,優(yōu)勢堪稱 “降維打擊”:傳統(tǒng)設(shè)備需大電源容量(如測 3km 10kV 電纜需 500kVA 以上),體積堪比冰箱且重量超 200kg;而武漢特高壓串聯(lián)
    發(fā)表于 10-11 15:40

    如何判斷電能質(zhì)量在線監(jiān)測裝置的測量精度是否達(dá)到標(biāo)準(zhǔn)?

    判斷電能質(zhì)量在線監(jiān)測裝置的測量精度是否達(dá)到標(biāo)準(zhǔn),需圍繞 “ 標(biāo)準(zhǔn)限值明確→實(shí)驗(yàn)室精準(zhǔn)校準(zhǔn)→現(xiàn)場工況驗(yàn)證→數(shù)據(jù)溯源閉環(huán) ” 的邏輯,結(jié)合國家 / 國際標(biāo)準(zhǔn)(如 GB/T 19862-2016、IEC
    的頭像 發(fā)表于 09-26 14:11 ?735次閱讀

    高壓二極管應(yīng)用中,是否有足夠銅箔/散熱片,結(jié)溫是否接近極限?

    MDD辰達(dá)半導(dǎo)體FAE,我們往往會追溯到一個核心問題——是否有足夠銅箔/散熱片支撐散熱,器件結(jié)溫是否已經(jīng)接近極限。一、結(jié)溫與器件可靠性的關(guān)系結(jié)溫(Tj)是指二極管P
    的頭像 發(fā)表于 09-17 11:42 ?833次閱讀
    高壓二極管應(yīng)用中,<b class='flag-5'>是否</b>有足夠銅箔/散熱片,結(jié)溫<b class='flag-5'>是否</b>接近<b class='flag-5'>極限</b>?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會方便很多
    發(fā)表于 09-17 06:36

    CCG3PA是否支持發(fā)起B(yǎng)IST 共享容量消息?

    我正在使用CCG3PA ,我想發(fā)起B(yǎng)IST 共享容量消息。我檢查了 CCG3PA 的 API 文檔和 PD 堆棧,但找不到任何與啟動BIST 共享容量模式相關(guān)的枚舉或 API。 CCG3PA是否支持發(fā)起B(yǎng)IST 共享
    發(fā)表于 07-23 07:07

    極限電流與氧分壓傳感器區(qū)別解析

    極限電流型氧傳感器與氧分壓型氧傳感器在原理、結(jié)構(gòu)及應(yīng)用上存在顯著差異,具體區(qū)別如下:工作原理01極限電流型氧傳感器:基于電化學(xué)泵原理,施加外部電壓使氧氣在電極間遷移,當(dāng)電壓足夠高時,電流達(dá)到
    的頭像 發(fā)表于 05-19 13:26 ?757次閱讀
    <b class='flag-5'>極限</b>電流與氧分壓傳感器區(qū)別解析

    SMA 連接器功率容量的演進(jìn):從傳統(tǒng)設(shè)計到新型材料的突破

    SMA連接器功率容量傳統(tǒng)設(shè)計的艱難摸索到新型材料驅(qū)動下的突破發(fā)展,是一部不斷創(chuàng)新、持續(xù)進(jìn)取的科技進(jìn)步史。伴隨材料科學(xué)與制造技術(shù)的持續(xù)革新,德索的SMA連接器功率容量也將不斷躍上新臺階,為微波、射頻等前沿領(lǐng)域注入源源不斷的發(fā)展動
    的頭像 發(fā)表于 05-14 09:10 ?604次閱讀
    SMA 連接器功率<b class='flag-5'>容量</b>的演進(jìn):從<b class='flag-5'>傳統(tǒng)</b>設(shè)計到新型材料的突破

    自動駕駛安全程度達(dá)到99%是否就足夠了?

    [首發(fā)于智駕最前沿微信公眾號]五一假期,閑來無事,想到一個問題,現(xiàn)在監(jiān)管部門對于自動駕駛的要求已經(jīng)非常嚴(yán)苛,那自動駕駛要達(dá)到什么程度才算足夠安全?如果達(dá)到99%,是否就可以商用了?抑或
    的頭像 發(fā)表于 05-03 08:42 ?710次閱讀

    從RF到HDMI:傳統(tǒng)接口的現(xiàn)代優(yōu)化

    射頻(RF)、復(fù)合視頻(RCA)、S-Video和視頻色差是幾種傳統(tǒng)的視頻接口。盡管這些接口在一些舊設(shè)備或特定應(yīng)用場景中仍然被使用,但隨著數(shù)字技術(shù)的發(fā)展,它們的使用頻率已經(jīng)顯著下降?,F(xiàn)代顯示設(shè)備
    的頭像 發(fā)表于 04-15 11:50 ?1592次閱讀
    從RF到HDMI:<b class='flag-5'>傳統(tǒng)</b>接口的現(xiàn)代優(yōu)化

    多芯光纖MCF(Multicore Fiber)互聯(lián)

    隨著人工智能AI技術(shù)的迅猛發(fā)展,數(shù)據(jù)處理需求和通信容量的增長達(dá)到了前所未有的規(guī)模。特別是在大數(shù)據(jù)分析、深度學(xué)習(xí)和云計算等領(lǐng)域,通信系統(tǒng)對高速、高帶寬的要求越來越高。傳統(tǒng)單模光纖
    發(fā)表于 04-01 11:33

    多芯光纖MCF(Multicore Fiber)互聯(lián)

    隨著人工智能AI技術(shù)的迅猛發(fā)展,數(shù)據(jù)處理需求和通信容量的增長達(dá)到了前所未有的規(guī)模。特別是在大數(shù)據(jù)分析、深度學(xué)習(xí)和云計算等領(lǐng)域,通信系統(tǒng)對高速、高帶寬的要求越來越高。傳統(tǒng)單模光纖
    的頭像 發(fā)表于 04-01 11:14 ?1263次閱讀
    多芯光纖MCF(Multicore Fiber)互聯(lián)