91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

應(yīng)對分支預(yù)測有哪些優(yōu)化措施

麥辣雞腿堡 ? 來源:軒哥談芯 ? 作者:義軒 ? 2023-11-29 17:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

應(yīng)對分支預(yù)測有哪些優(yōu)化措施

下面再來看一下分支預(yù)測,這也是 ChatGPT 給出的一個簡易答案

// 不利于流水線的循環(huán)結(jié)構(gòu)
for (int i = 0; i < N; ++i) {
    if (condition) {
        // 循環(huán)體
    }
}


// 更有利于流水線的循環(huán)結(jié)構(gòu)
if (condition) {
    for (int i = 0; i < N; ++i) {
        // 循環(huán)體
    }
}

上面的案例就是說明,我們應(yīng)該在循還外進(jìn)行條件判斷,這樣即便是預(yù)測失敗概率 10%,也只有 10%的回滾情況,但是如果放到循環(huán)體內(nèi)部,那么這個 10%的回滾操作將被執(zhí)行 N 次。

除了把判斷語句從循環(huán)體中挪出來,還有一些小的技巧供大家參考一下。

合并條件,盡可能減少分支預(yù)測失敗時對效率的影響

優(yōu)化前:

if(case1){    if( case2 )    {        do();    }}

優(yōu)化后:

if( case1 && case2 ){    do();}

優(yōu)化前:

if( case1 == 0 && case2 == 0 && case3 == 0 ){    do();}

優(yōu)化后:

if( ( case1 | case2 | case3 ) == 0 ){    do();}

跳轉(zhuǎn)避免分支預(yù)測

if else改寫成switch形式(switch使用的指針 list 進(jìn)行跳轉(zhuǎn)的指令,直接跳轉(zhuǎn)到對應(yīng)分支)。這樣就相當(dāng)于將多個函數(shù)使用函數(shù)指針的形式存儲到數(shù)組中,然后通過 case 查表,直接進(jìn)行調(diào)用。

直接運(yùn)算,避免判斷

先說明一些基本位運(yùn)算知識:

|x| > > 31 = 0     // 非負(fù)數(shù)右移31為一定為0
~(|x| > > 31) = -1 // 0取反為-1


-|x| > > 31 = -1   // 負(fù)數(shù)右移31為一定為0xffff = -1
~(-|x| > > 31) = 0 // -1取反為0


-1 = 0xffff
-1 & x = x        // 以-1為mask和任何數(shù)求與,值不變

如對于

if(value < 0 ) value = 0

可改成

value &= ~(value > > 31 )

再比如:

if (data[c] >= 128){    sum += data[c];}

可以優(yōu)化為:

int t = (data[c] - 128) >> 31; // 非負(fù)數(shù)右移 310,負(fù)數(shù)右移則為 -1sum += ~t & data[c];     // 這里利用 0 和 -1,正好等同于條件,大于 128 忽略,小于 128
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20255

    瀏覽量

    252321
  • mcu
    mcu
    +關(guān)注

    關(guān)注

    147

    文章

    18925

    瀏覽量

    398257
  • 預(yù)測
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    12605
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    CPU分支預(yù)測對程序的影響

    分支預(yù)測的英文名字是“Branch Prediction”,如果大家在Google上搜索這個關(guān)鍵字,可以看到關(guān)于分支預(yù)測的很多內(nèi)容。不過,要搞清楚
    發(fā)表于 09-23 14:11 ?1521次閱讀

    如何統(tǒng)計蜂鳥E203的分支預(yù)測率?

    想請問大家如何統(tǒng)計蜂鳥E203的分支預(yù)測率,我嘗試在exu_commit模塊里統(tǒng)計,但是發(fā)現(xiàn)預(yù)測率都有寫問題,想請教以下大家
    發(fā)表于 06-10 07:05

    基于全局預(yù)測歷史的gshare分支預(yù)測器的實(shí)現(xiàn)細(xì)節(jié)

    為“taken”,否則為“not taken”。 下圖為GShare分支預(yù)測的具體架構(gòu)圖。 主要模塊分支歷史寄存器BHR 分支歷史
    發(fā)表于 10-22 06:50

    提高條件分支指令預(yù)測正確率的方法

    寄存器,分別用于記錄條件分支指令個數(shù)branch_num和預(yù)測失敗次數(shù)prmiss_num。 上圖為運(yùn)行coremark測試程序的波形圖,最后預(yù)測成功率超過百分之九十。而初始版本的E203處理器
    發(fā)表于 10-22 08:22

    蜂鳥E203簡單分支預(yù)測的改進(jìn)

    是最簡單的靜態(tài)分支預(yù)測,其預(yù)測的命中率并不是很高,因此流水線常常需要因?yàn)闆_刷而浪費(fèi)很多周期,導(dǎo)致CPU的性能下降。因此,針對題目通過對E203微架構(gòu)進(jìn)行優(yōu)化提升處理器性能的要求,我們想
    發(fā)表于 10-24 07:45

    嵌入式處理器動態(tài)分支預(yù)測機(jī)制研究與設(shè)計

    嵌入式處理器動態(tài)分支預(yù)測機(jī)制研究與設(shè)計針對嵌入式處理器的特定應(yīng)用環(huán)境,通過對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法的改進(jìn),結(jié)合定制的分支目標(biāo)緩沖,提出一種復(fù)合式動態(tài)分支預(yù)
    發(fā)表于 10-06 09:53

    如何應(yīng)對歐盟玩具安全新指令的措施

    歐盟玩具安全新指令的措施實(shí)施后,相關(guān)企業(yè)應(yīng)何應(yīng)對呢?北測檢測作為第三方權(quán)威檢測機(jī)構(gòu),建議相關(guān)企業(yè)積極應(yīng)對歐盟玩具安全新指令的措施,盡量做到以下幾點(diǎn):  1.加快了解國際玩具標(biāo)準(zhǔn)體系。玩
    發(fā)表于 01-18 11:22

    優(yōu)化技巧:提前if判斷幫助CPU分支預(yù)測

    摘要: 在stackoverflow上有一個非常有名的問題:為什么處理有序數(shù)組要比非有序數(shù)組快?,可見分支預(yù)測對代碼運(yùn)行效率非常大的影響。要提高代碼執(zhí)行效率,一個重要的原則就是盡量避免CPU把
    發(fā)表于 06-13 16:27

    如何對分布式天線系統(tǒng)(DAS)進(jìn)行優(yōu)化?

    什么是分布式天線系統(tǒng)?如何對分布式天線系統(tǒng)(DAS)進(jìn)行優(yōu)化?
    發(fā)表于 05-24 06:03

    對高級持久性威脅(APT)什么應(yīng)對措施

    高級持久性威脅(APT)的特點(diǎn)是什么?對高級持久性威脅(APT)什么應(yīng)對措施
    發(fā)表于 05-24 06:40

    什么是內(nèi)存優(yōu)化?那些優(yōu)化措施?

    什么是內(nèi)存優(yōu)化那些優(yōu)化措施?
    發(fā)表于 01-14 06:22

    安騰處理器中多級分支預(yù)測機(jī)制

    分支預(yù)測技術(shù)可消除分支指令之后損失的周期,防止流水線斷流。高比率的分支預(yù)測精確度是高性能微處理器性能的保證。本文詳細(xì)分析了安騰處理器(Ita
    發(fā)表于 08-21 12:11 ?12次下載

    揭秘LDO的噪音類型及應(yīng)對措施

    揭秘LDO的噪音類型及應(yīng)對措施
    發(fā)表于 02-09 17:05 ?7次下載

    CPU中什么是分支預(yù)測

    什么是分支預(yù)測 在超標(biāo)量的流水線架構(gòu)上,我們得知,CPU 在運(yùn)行指令的時候,會在一個時鐘上做多個操作,也就是涉及到調(diào)用前后相關(guān)的指令,比如我們在一個簡單的判斷語句中。 if (n > 0 ) { n
    的頭像 發(fā)表于 11-29 17:22 ?1805次閱讀

    EMI(電磁干擾):原理、影響與應(yīng)對措施?

    EMI(電磁干擾):原理、影響與應(yīng)對措施?|深圳比創(chuàng)達(dá)電子EMC
    的頭像 發(fā)表于 03-26 11:22 ?5425次閱讀
    EMI(電磁干擾):原理、影響與<b class='flag-5'>應(yīng)對</b><b class='flag-5'>措施</b>?