91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

硬件異構(gòu):兩種不同的內(nèi)核

中科院半導(dǎo)體所 ? 來源:老石談芯 ? 作者:老石 ? 2022-04-13 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說起近年來CPU領(lǐng)域的進展,很多人都知道蘋果的M1系列芯片、以及它取得了多少多少提升。相比之下,老牌CPU廠商英特爾的關(guān)注度卻越來越低,最主要的原因就是這個牙膏廠擠牙膏的速度太慢了。

不過,在英特爾發(fā)布了最新的12代酷睿處理器之后,事情就完全不一樣了。 國內(nèi)外很多知名UP主都對它做了極其深入的性能測試,并且有點出乎意料地收獲了幾乎一邊倒的好評。很多人甚至說,英特爾這次把牙膏擠爆了、12代酷睿會幫助英特爾重新走回巔峰。

如果你對電腦或者數(shù)碼產(chǎn)品不是特別熟悉,可能會問:一個產(chǎn)品的正常升級換代,取得性能提升不是很正常的嗎? 升級帶來性能提升是正常的,但取得這么大的性能提升就不那么“正?!绷?,英特爾必然做對了什么事情。

所以問題來了,12代酷睿究竟做對了什么?究竟是一不小心走運擠爆了牙膏,還是發(fā)現(xiàn)了能夠源源不斷產(chǎn)生新牙膏的方法?

先說結(jié)論,我認為英特爾找到了一個新配方,能持續(xù)大幅提升芯片的性能。這個配方的名字,叫芯片架構(gòu)的創(chuàng)新。而這個配方最重要的那味藥,就是異構(gòu)。 問題又來了,異構(gòu)究竟是什么東西?它為什么能幫助12代酷睿取得了如此大的提升?更重要的是對于普通消費者來說,怎么才能用得上這種創(chuàng)新?對于我們來說又有什么具體的意義?今天的文章我們就來好好說說這些問題。

什么是異構(gòu)

先來看看“異構(gòu)”這個詞到底是什么意思。從字面意思來看,異就是不同,構(gòu)就是架構(gòu)或者結(jié)構(gòu),所以異構(gòu)其實就是“不同的結(jié)構(gòu)”。它的反義詞是同構(gòu),也就是“相同的結(jié)構(gòu)”。

如果你沒聽說過這兩個詞也完全沒關(guān)系,其實在我們?nèi)粘I钪嘘P(guān)于異構(gòu)和同構(gòu)的例子是有很多的。就拿我們家里的裝修和收納舉例,以前很多房屋裝修都是同樣的風(fēng)格,看起來像是一個模子印出來的。收納也很簡單,比如廚房里都用一樣的四四方方的櫥柜,去收納各種鍋碗瓢盆。這其實就是同構(gòu)。

但是我們在實際應(yīng)用中就發(fā)現(xiàn),這種結(jié)構(gòu)并不好用。因為我們有各種各樣的鍋碗瓢盆,放在同樣的櫥柜里就會導(dǎo)致有的地方放不下,有的地方卻太空了。所以很多現(xiàn)代化的裝修,都是針對不同的廚具去針對性的設(shè)計收納空間,并且能最大限度的利用空間。這種方式其實就是異構(gòu)。 同樣的例子還有很多,比如一列火車里有一等二等餐車臥鋪這樣不同的車廂,而不全都是相同的座位,這就是一種異構(gòu)。我們吃的飯也有川菜粵菜漢堡炸雞這樣不同的菜系和品種,而不都是大鍋飯,所以這也是一種異構(gòu)。

所以從廣義上來看,只要不是同構(gòu),就是異構(gòu)。 但是,異構(gòu)其實還有更進一步的意思。比如機場的行李管理系統(tǒng),會把行李按照不同的航班進行調(diào)度,同一個航班,也會按艙位的不同進行先后處理。比如我們在等行李的時候,頭等艙的行李會先出來,而我們坐經(jīng)濟艙的往往要等很久才能等到自己的行李。這里其實就是在異構(gòu)這個概念里,增加了優(yōu)先級和調(diào)度的概念。也就是說,由于結(jié)構(gòu)的不同,對它的處理和應(yīng)用的方式也是不同的。

再拿前面的廚房收納來舉例,我們會把盤子放在櫥柜的抽屜里,但是應(yīng)該先放大盤子、再放小盤子,這樣才不會倒。放玻璃杯的時候,抽屜肯定就放不下了,所以應(yīng)該放在杯具專用的地方,可能很窄很高,正好能放下杯子。所以這些不同結(jié)構(gòu)的櫥柜和抽屜,就組成了一個異構(gòu)的收納體系。 回到前面的問題,我們?yōu)槭裁匆卯悩?gòu)呢?和同構(gòu)相比,異構(gòu)更加高效,每個部分各司其職,就像玩游戲的時候用的一套連招,能夠最大限度地發(fā)揮它的力量。

但使用異構(gòu)的另一方面原因,其實是由于當(dāng)技術(shù)發(fā)展到一定程度的時候,不可避免的遇到很多限制。很多年前,傳統(tǒng)地提升CPU性能的方法,就是堆料,也就是不斷增加CPU核心的數(shù)量,從而讓性能隨著核心數(shù)的增加而線性增加。多核架構(gòu)在十幾年前就是非常熱門的研究方向,人們認為,只要能夠編寫和運行并行軟件,就可以將處理器架構(gòu)直接擴展到數(shù)千個核心。

當(dāng)然了現(xiàn)實總是非常殘酷。在之前的文章里介紹過,當(dāng)時還在德州大學(xué)奧斯丁分校的道格博格爾教授寫了一篇文章,研究并提出了所謂的“暗硅效應(yīng)”。

a0c31cc2-bacd-11ec-aa7f-dac502259ad0.png

它說的是雖然可以不斷增加核心數(shù)量,但由于功耗的限制,我們卻無法讓這些核心同時工作。這就像一個大樓有很多房間,但由于供電量有限,我們無法同時開啟每個房間的燈,這就讓這個大樓在夜里看起來有很多黑暗的部分,這也是暗硅這個詞得名的原因。

暗硅效應(yīng)的提出,完全改變了芯片產(chǎn)業(yè)發(fā)展的方向。人們意識到即使不斷的堆核,并且開發(fā)出了并行軟件,這種同構(gòu)的方法帶來的性能提升也會非常有限。所以異構(gòu)計算就應(yīng)運而生了。事實上,在計算機領(lǐng)域,異構(gòu)計算是一個近年來非常熱門的方向,就是因為異構(gòu)計算能夠充分利用CPU、GPU、FPGA、ASIC等等不同芯片結(jié)構(gòu)的特點,相互取長補短,從而實現(xiàn)更加高性能低功耗的計算系統(tǒng)。

對于CPU設(shè)計本身,也慢慢出現(xiàn)了異構(gòu)的方法。比如手機的處理器絕大多數(shù)都是基于ARM的架構(gòu),它就采用了大小核的設(shè)計。在蘋果的M1芯片里,也采用了類似的設(shè)計方法。這些都不是新鮮事兒了。

但是新鮮的是,在x86架構(gòu)的CPU里,12代酷睿Alder Lake是第一次嘗試了這種性能核+能效核的異構(gòu)方法,結(jié)構(gòu)就取得了非常好的效果。

硬件異構(gòu):兩種不同的內(nèi)核

Alder Lake最主要的特點,就是采用了性能核+能效核的架構(gòu)設(shè)計。它最大的特點就是有很強的擴展性和靈活性。

a0e1d50e-bacd-11ec-aa7f-dac502259ad0.png

比如全系列Alder Lake都是采用了相似的設(shè)計,不管是臺式機、筆記本還是超輕薄的商務(wù)本,CPU架構(gòu)都是相同的,只不過兩種類型的核心數(shù)量有區(qū)別。比如桌面端CPU最高可以支持8個性能核、8個能效核,面向筆記本的12代酷睿又分成了HPU三個子系列:H系列面向高性能移動平臺,可以支持4~6個性能核、4~8個能效核,最多14核20線程;面向高性能筆記本的P系列也是如此,性能核支持2~6個,能效核都為8個;而主打輕薄筆記本的U系列,最多支持2個性能核、8個能效核。使用這樣的設(shè)計,就能根據(jù)特定的應(yīng)用場景,針對性的配置芯片核心的數(shù)量和種類,以取得性能和功耗的平衡和優(yōu)化。

Alder Lake的能效核代號為Gracemont。值得注意的是,它并沒有采用業(yè)界通用的“低功耗”內(nèi)核的這個說法,而是稱為“高能效”,這其實代表著Gracemount能夠很好的平衡性能和功耗這兩個非常重要但貌似相互矛盾的性能指標(biāo)。

在之前架構(gòu)日的文章里詳細介紹過,Gracemount在架構(gòu)設(shè)計上也有很多創(chuàng)新和進步,比如在前端設(shè)計里采用了64KB指令緩存,并且進一步優(yōu)化了分支預(yù)測單元。此外它還包含了兩個3寬度的亂序解碼器,這也是英特爾能效核的主要特點,它不僅可以單周期完成高達六個指令的解碼,也可以在兩個解碼器集群之間做負載均衡和亂序執(zhí)行,進一步提升操作的并行性,從而提升性能。能效核的后端也提升了寬度,并且集成了多種整型、浮點型、還有向量運算單元,支持不同形式的運算和指令集擴展。

對于性能核來說,提升就更明顯了。Alder Lake里的性能核代號為Goldencove,它的設(shè)計目標(biāo)非常明確,就是對單線程性能的極致擴展。比如它前后端的流水線、執(zhí)行單元、亂序窗口、片上緩存和存儲系統(tǒng)都采用了更寬和更深的設(shè)計,它還集成了機器學(xué)習(xí)的方法,來更智能的做分支預(yù)測和流水線資源的釋放,進一步提升系統(tǒng)的吞吐量。

打個簡單的比方,如果我們把CPU比作水龍頭,指令和數(shù)據(jù)就是水龍頭里流的水。這次性能核就把水龍頭的水管做的更寬了,口做的更大了,而且加入了很多智能化的水量控制系統(tǒng),就讓整體的流量變的更大了。

12代酷睿是英特爾首個采用混合架構(gòu)的CPU產(chǎn)品,除了性能核與能效核之外,它還集成了對DDR4和DDR5等種內(nèi)存架構(gòu)的支持,也支持Wifi6E、Thunderbolt4、PCIe5.0x16等等這些最新的接口和數(shù)據(jù)傳輸技術(shù)。所有的這些單元都是以模塊化的方式進行集成,這樣和異構(gòu)的內(nèi)核一起,進一步提升了CPU架構(gòu)的擴展性,也能非常靈活的應(yīng)對不同終端的實際需求。

對異構(gòu)的軟硬件支持

有了不同的處理器內(nèi)核和硬件模塊其實還不夠,為了組成一個高效運轉(zhuǎn)的異構(gòu)芯片,同樣重要的其實是如何把它們充分利用起來。 再拿我們裝修房子的例子,就算按現(xiàn)代的標(biāo)準裝修了整間屋子,如果住的人不知道怎么用,把東西到處亂放,那么到頭來屋子里肯定還是一團糟。這個時候我們可以咨詢專門的收納師,或者直接請他們來幫忙進行收納。 芯片設(shè)計也是這樣,這里的收納師,其實有兩層,一個是調(diào)度器,另一個是操作系統(tǒng)。在12代酷睿里,英特爾特別提出了一個叫做線程調(diào)度器的結(jié)構(gòu)。這也是一個全新的結(jié)構(gòu),我總結(jié)了它的3個主要特點。

a1566874-bacd-11ec-aa7f-dac502259ad0.png

首先,它存在于操作系統(tǒng)和內(nèi)核架構(gòu)之間,能在納秒級別、非常精確地監(jiān)測線程和內(nèi)核的運行情況。然后根據(jù)這些信息,它能為操作系統(tǒng)提供動態(tài)反饋,從而幫助操作系統(tǒng)做出最優(yōu)的調(diào)度決定。最后,它可以可以對工作負載做實時分析,確保第一時間把正確的線程分配到正確的核心。

比如對于性能要求比較高的應(yīng)用,就會被優(yōu)先放在性能核上運行,一些后臺任務(wù)就會被放在能效核上運行,從而實現(xiàn)多任務(wù)的并行處理。如果這個時候有優(yōu)先級更高的高性能應(yīng)用出現(xiàn),線程調(diào)度器也可以幫助操作系統(tǒng)來決定,將性能核上的哪些線程轉(zhuǎn)移到能效核上運行。整個調(diào)度的過程都是動態(tài)完成的,可以根據(jù)不同的應(yīng)用靈活變化,不依賴某種固定的調(diào)度算法。

有了硬件調(diào)度器,軟件開發(fā)者就不需要糾結(jié)如何進行線程調(diào)度和資源分配了,也不需要修改已有的代碼去支持12代酷睿的異構(gòu)架構(gòu)。同時,使用專門的硬件單元去做線程和內(nèi)核的調(diào)度,也可以更好的保證調(diào)度的性能和準確性。

當(dāng)然了,操作系統(tǒng)還是需要對這個硬件調(diào)度器進行深度適配的。微軟新推出的Windows11,就有對線程調(diào)度器的優(yōu)化支持,這個其實也是windows11的一個重要特性。 所以有了軟硬件對異構(gòu)的支持,就可以充分發(fā)揮異構(gòu)的優(yōu)勢。就像前面提到的機場的行李管理系統(tǒng)一樣,這其實是一種進化版的異構(gòu),可以根據(jù)優(yōu)先級進行任務(wù)的合理調(diào)度和資源分配,并且?guī)矶嗳蝿?wù)的處理優(yōu)勢。

除了H系列之外,12代酷睿還有兼顧性能和功耗的P系列、以及面向低功耗的U系列,分別適合輕內(nèi)容制作和對移動辦公有剛需的人群。

結(jié)語

總之,異構(gòu)就是12代酷睿取得大幅能效提升的最主要原因。它不僅有能效核+性能核的混合設(shè)計模式,還有配合它進行性能釋放的線程調(diào)度器和操作系統(tǒng)的支持。有理由相信,這種異構(gòu)的模式也將會成為未來CPU芯片設(shè)計的主流趨勢。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54017

    瀏覽量

    466308
  • 異構(gòu)計算
    +關(guān)注

    關(guān)注

    2

    文章

    112

    瀏覽量

    17184

原文標(biāo)題:異構(gòu)計算,只是大小核罷了?

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    TVS vs TSS 兩種保護機制的深度博弈

    在現(xiàn)代電子設(shè)備日益精密、工作環(huán)境愈發(fā)復(fù)雜的背景下,電路安全問題尤其是雷擊和瞬態(tài)過壓(Surge)防護,已成為產(chǎn)品設(shè)計中不可忽視的重要環(huán)節(jié)。其中,TVS(瞬態(tài)電壓抑制器)與TSS(晶閘管浪涌抑制器)是兩種廣泛應(yīng)用的浪涌保護器件。盡管二者均服務(wù)于同一目標(biāo)——保障電路
    的頭像 發(fā)表于 02-12 15:23 ?778次閱讀
    TVS vs TSS <b class='flag-5'>兩種</b>保護機制的深度博弈

    全方位解析:什么是異構(gòu)開發(fā)板?為什么選GM-3568JHF?

    異構(gòu)開發(fā)板集成兩種或多種處理器,如ARM與FPGA。ARM負責(zé)通用控制,F(xiàn)PGA加速特定工作,二者協(xié)同保證系統(tǒng)靈活性與高性能。與普通開發(fā)板相比,異構(gòu)開發(fā)板功能更靈活,效率更高,適合復(fù)雜任務(wù)
    的頭像 發(fā)表于 12-19 15:04 ?7114次閱讀
    全方位解析:什么是<b class='flag-5'>異構(gòu)</b>開發(fā)板?為什么選GM-3568JHF?

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應(yīng)用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功能預(yù)覽版;其二
    的頭像 發(fā)表于 11-30 09:28 ?431次閱讀

    兩種電流檢測電路設(shè)計方案 高側(cè) 低側(cè) 最高耐壓90V

    常用的電流檢測電路有兩種,一是低壓側(cè)電流檢測,另一是高壓側(cè)電流檢測。 實現(xiàn)方法: 兩種電流檢測電路工作原理一致,都是將采集到的電流以電壓的形式呈現(xiàn),對電壓信號進行放大,送入ADC處
    的頭像 發(fā)表于 11-24 16:16 ?1174次閱讀
    <b class='flag-5'>兩種</b>電流檢測電路設(shè)計方案 高側(cè) 低側(cè) 最高耐壓90V

    用PLC實現(xiàn)卷徑計算的兩種算法

    卷徑計算,是動態(tài)計算如鋼卷,紙卷等存料量的一方法,它是實現(xiàn)張力控制和自動充放料、以及甩尾控制的重要前提。卷徑計算目前主流的方法有兩種,一是根據(jù)機列速度(產(chǎn)線速度)和和被測卷的轉(zhuǎn)動角速度求得;另一
    的頭像 發(fā)表于 11-14 16:54 ?2097次閱讀
    用PLC實現(xiàn)卷徑計算的<b class='flag-5'>兩種</b>算法

    ADI GMSL技術(shù)兩種視頻數(shù)據(jù)傳輸模式的區(qū)別

    本文深入介紹GMSL技術(shù),重點說明用于視頻數(shù)據(jù)傳輸?shù)南袼啬J胶退淼滥J街g的差異。文章將闡明這兩種模式之間的主要區(qū)別,并探討成功實施需要注意的具體事項。
    的頭像 發(fā)表于 10-10 13:49 ?2326次閱讀
    ADI GMSL技術(shù)<b class='flag-5'>兩種</b>視頻數(shù)據(jù)傳輸模式的區(qū)別

    兩種TVS有啥不同?

    當(dāng)我們查看TVS二極管的規(guī)格書,常會看到有以下兩種種引腳功能標(biāo)識圖:對于初學(xué)者,看到感到疑惑,他們一樣嗎?他們有啥區(qū)別?為啥有的個尖頭往外,陽極連在一起,有的個尖頭往里,陰極連在一起?一連三問。EMC小哥根據(jù)自己經(jīng)驗略作分析
    的頭像 發(fā)表于 09-15 20:27 ?804次閱讀
    這<b class='flag-5'>兩種</b>TVS有啥不同?

    兩種散熱路徑的工藝與應(yīng)用解析

    背景:兩種常見的散熱設(shè)計思路 在大電流或高功率器件應(yīng)用中,散熱和載流能力是PCB設(shè)計中必須解決的難題。常見的兩種思路分別是: 厚銅板方案:通過整體增加銅箔厚度(如3oz、6oz甚至更高),增強導(dǎo)熱
    的頭像 發(fā)表于 09-15 14:50 ?793次閱讀

    CMOS 2.0與Chiplet兩種創(chuàng)新技術(shù)的區(qū)別

    摩爾定律正在減速。過去我們靠不斷縮小晶體管尺寸提升芯片性能,但如今物理極限越來越近。在這樣的背景下,兩種創(chuàng)新技術(shù)站上舞臺:CMOS 2.0 和 Chiplet(芯粒)。它們都在解決 “如何讓芯片更強” 的問題,但思路卻大相徑庭。
    的頭像 發(fā)表于 09-09 15:42 ?1030次閱讀

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】+兩種開發(fā)板間的比較

    之所以產(chǎn)生出在兩種開發(fā)板間進行比較的想法,是與當(dāng)初申請的一個想法相關(guān)的就是,就是利用該開發(fā)板來完成一個考生識別的作品。 但在后來的資料分析時才發(fā)現(xiàn),它可能并不具備這方面的基礎(chǔ)。這就有請我們的下一
    發(fā)表于 07-17 21:40

    貼片晶振中兩種常見封裝介紹

    貼片晶體振蕩器作為關(guān)鍵的時鐘頻率元件,其性能直接關(guān)系到系統(tǒng)運行的穩(wěn)定性。今天,凱擎小妹帶大家聊聊貼片晶振中兩種常見封裝——金屬面封裝與陶瓷面封裝。
    的頭像 發(fā)表于 07-04 11:29 ?1269次閱讀
    貼片晶振中<b class='flag-5'>兩種</b>常見封裝介紹

    異構(gòu)計算解決方案(兼容不同硬件架構(gòu))

    異構(gòu)計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術(shù)與實踐方案如下: 一、硬件架構(gòu)設(shè)計 異構(gòu)處理
    的頭像 發(fā)表于 06-23 07:40 ?867次閱讀

    兩種驅(qū)動方式下永磁直線開關(guān)磁鏈電機的研究

    摘要:永磁開關(guān)磁鏈電機數(shù)學(xué)模型可以等效為永磁無刷電機,普遍采用方波驅(qū)動方式。在有限元基礎(chǔ)上分析6/7極直線式磁鏈電機反電勢波形,采用方波和正弦波驅(qū)動方式,比較兩種方式下的電流、電壓、平均推力大小
    發(fā)表于 06-09 16:18

    兩種感應(yīng)電機磁鏈觀測器的參數(shù)敏感性研究

    模式和發(fā)電模式下對閉環(huán)電壓電流模型磁鏈觀測器和滑模磁鏈觀測器參數(shù)敏感性進行了研究,通過仿真和實驗比較了這兩種觀測器對定、轉(zhuǎn)子電阻及勵磁電感的敏感性。同時還研究了基于這兩種觀測器的模型參考自適應(yīng)系統(tǒng)
    發(fā)表于 06-09 16:16

    銣原子鐘與CPT原子鐘:兩種時間標(biāo)準的區(qū)別

    在物理學(xué)的世界中,精密的時間測量是至關(guān)重要的。這就需要一個高度準確且穩(wěn)定的時間標(biāo)準,這就是原子鐘。今天我們將探討兩種重要的原子鐘:銣原子鐘和CPT原子鐘,以及它們之間的主要區(qū)別。首先,我們來了解一下
    的頭像 發(fā)表于 05-22 15:49 ?749次閱讀
    銣原子鐘與CPT原子鐘:<b class='flag-5'>兩種</b>時間標(biāo)準的區(qū)別