確保將最高質(zhì)量的產(chǎn)品運(yùn)往市場(chǎng),并保證它們?cè)谄渖芷趦?nèi)持續(xù)工作,是汽車(chē)芯片制造商的首要目標(biāo)。的確,我們需要大力改進(jìn)和加強(qiáng)制造測(cè)試程序,以使整個(gè)芯片種群中的潛在故障少之又少。然而,高質(zhì)量的生產(chǎn)必須遵循現(xiàn)場(chǎng)可靠性;制定戰(zhàn)略和活動(dòng)來(lái)面對(duì)前方生命周期的關(guān)鍵問(wèn)題也具有非常高的優(yōu)先地位。
本文的貢獻(xiàn)包括以下幾個(gè)方面的描述和結(jié)果:(1)一種非常精確的方法來(lái)評(píng)估FLASH制造測(cè)試的功耗;(2)一種有效的多核基于軟件的自檢生成策略,面向人工智能的計(jì)算機(jī)體系結(jié)構(gòu);(3)一個(gè)高水平和非??焖俚南到y(tǒng)級(jí)芯片的架構(gòu)仿真器,用于原型設(shè)計(jì)輻照實(shí)驗(yàn)和預(yù)測(cè)運(yùn)動(dòng)結(jié)果,對(duì)處理器和外圍核心的單一事件設(shè)置具有良好的準(zhǔn)確等級(jí)。
I.簡(jiǎn)介
詳細(xì)介紹了重新調(diào)整制造測(cè)試流程的最佳做法,通過(guò)考慮克服結(jié)構(gòu)測(cè)試在線(xiàn)限制的測(cè)試技術(shù)來(lái)達(dá)到標(biāo)準(zhǔn)預(yù)期,并節(jié)省時(shí)間和計(jì)算資源來(lái)評(píng)估利用所有系統(tǒng)級(jí)芯片(SoC)功能的汽車(chē)應(yīng)用的穩(wěn)健性,包括CPU和外圍核心。
第二節(jié)介紹了如何對(duì)嵌入式FLASH存儲(chǔ)器的制造測(cè)試進(jìn)行非常準(zhǔn)確的功率表征。正如后面所詳述的那樣,該技術(shù)的目標(biāo)是測(cè)量一個(gè)復(fù)合DfT模式的電流吸收,該模式可以通過(guò)調(diào)整固件來(lái)滿(mǎn)足不同的期望。為了在測(cè)試執(zhí)行過(guò)程中設(shè)置正確的測(cè)試電壓裕度,并允許詳細(xì)說(shuō)明與FLASH測(cè)試并行進(jìn)行的其他測(cè)試,澄清該評(píng)估是至關(guān)重要的。In?neon科技公司報(bào)告了有關(guān)嵌入式FLASH存儲(chǔ)器測(cè)試的數(shù)據(jù),顯示了各種測(cè)試固件版本的功耗趨勢(shì)。
第三節(jié)說(shuō)明了如何為一個(gè)包括幾個(gè)計(jì)算核心的面向人工智能的設(shè)備創(chuàng)建一個(gè)基于軟件的自我測(cè)試套件。網(wǎng)表的大小和復(fù)雜性是這個(gè)方向的主要關(guān)注點(diǎn);可能的自動(dòng)化和巧妙的分級(jí)程序是本節(jié)討論的關(guān)鍵點(diǎn)。Dolphin設(shè)計(jì)公司對(duì)其汽車(chē)AI芯片所報(bào)告的結(jié)果表明,基于軟件的自我測(cè)試策略是可擴(kuò)展的,并適用于大型多處理器設(shè)備的適當(dāng)在線(xiàn)測(cè)試策略。然而,產(chǎn)生的功能測(cè)試程序可用于補(bǔ)充制造測(cè)試期間的結(jié)構(gòu)方法,即查看系統(tǒng)級(jí)測(cè)試覆蓋率。
第四節(jié)完成了本文所描述的方法和策略的概述。在這一部分,重點(diǎn)是瞬態(tài)故障的影響,并提出了一種方法來(lái)估計(jì)可能影響整個(gè)系統(tǒng)級(jí)芯片(SoC)的單一事件顛覆的影響。所描述的解決方案是基于一個(gè)仿真引擎,能夠快速重現(xiàn)包括處理器和外設(shè)核心在內(nèi)的SoC的行為;在特殊情況下,Xilinx Zynq UltraScale+ MPSoC是通過(guò)使用QEMU平臺(tái)進(jìn)行仿真的,QEMU平臺(tái)是以這樣一種方式進(jìn)行檢測(cè)的,它可以在應(yīng)用程序的執(zhí)行過(guò)程中注入瞬時(shí)故障效應(yīng)。通過(guò)使用這樣的環(huán)境,有可能獲得快速、略微不準(zhǔn)確的關(guān)于瞬態(tài)故障對(duì)功能的影響的的估計(jì)。因此,這種方法可以對(duì)輻照實(shí)驗(yàn)中觀(guān)察到的故障水平進(jìn)行原始但非常便宜的預(yù)測(cè)。
第五節(jié)得出了一些結(jié)論,并強(qiáng)調(diào)了汽車(chē)主題的合理看法。
II.嵌入式FLASH的功率表征測(cè)試
每個(gè)內(nèi)存測(cè)試的特點(diǎn)是有一定的電流消耗水平。通常,這種水平在測(cè)試執(zhí)行過(guò)程中不是恒定的,而且在許多情況下,峰值可能會(huì)出現(xiàn)在平均水平上。了解產(chǎn)生這些峰值的原因是很重要的,即識(shí)別相關(guān)的IR-droop問(wèn)題可能會(huì)減少矯枉過(guò)正,并使更多的測(cè)試并行化,可能允許在同一時(shí)間測(cè)試不同的芯片部件,以減少測(cè)試時(shí)間。
在這些段落中,我們專(zhuān)注于FLASH存儲(chǔ)器測(cè)試,特別是尋找有關(guān)所謂的 "驗(yàn)證測(cè)試 "技術(shù)的功率信息,該技術(shù)旨在測(cè)試存儲(chǔ)在片上系統(tǒng)(SoC)中的FLASH存儲(chǔ)器陣列。對(duì)測(cè)試步驟中的功耗水平進(jìn)行認(rèn)真的調(diào)查,也可以對(duì)測(cè)試條件的余量達(dá)到更高的置信度,這也是達(dá)到大批量制造質(zhì)量的一個(gè)不可缺少的因素。 隨著測(cè)試場(chǎng)景變得復(fù)雜,超出功率限制的風(fēng)險(xiǎn)也會(huì)相應(yīng)增加。
如今,集成在SoC中的嵌入式可測(cè)試性設(shè)計(jì)(DFT)功能可能是非常復(fù)合的,因此功率表征可能會(huì)被所有這些組件污染。為了更好地了解每個(gè)角色者在所考慮的測(cè)試場(chǎng)景中的貢獻(xiàn),調(diào)試設(shè)置變得非常重要。在接下來(lái)的段落中,我們將描述如何收集英飛凌Aurix系統(tǒng)在多種條件下運(yùn)行時(shí)的重要功率測(cè)量數(shù)據(jù)。
圖1?總體環(huán)境和工作原則
如圖1所示,Aurix FLASH存儲(chǔ)器測(cè)試涉及許多電路。高速和背對(duì)背的訪(fǎng)問(wèn)是由一個(gè)可編程的內(nèi)置自檢(可編程BIST)授予的,它由一個(gè)Tricore處理器核心控制。PBIST功能允許在不同條件下進(jìn)行驗(yàn)證測(cè)試,如內(nèi)部電壓和頻率參數(shù)。 在我們的工作中,主要調(diào)查了CPU組件行為的影響,因?yàn)樗诩働BIST功率特性方面引入了一個(gè)額外的電流消耗因素。
為了識(shí)別功率峰值并確定其最大振幅,我們?cè)u(píng)估了幾個(gè)CPU固件版本。圖2總結(jié)了一組測(cè)量的構(gòu)架: 1) 未經(jīng)優(yōu)化的CPU固件版本,該版本 a) 不斷地輪詢(xún)PBIST以獲取故障信息 b) 包括調(diào)試功能,如跟蹤特殊用途寄存器的讀寫(xiě)操作 c) 實(shí)施高水平的嵌套功能,以達(dá)到重復(fù)使用的目的。 2) 減少對(duì)PBIST的輪詢(xún)頻率 3) 利用在輪詢(xún)事件之間進(jìn)入的空閑模式 4) 通過(guò) "簡(jiǎn)化 "的代碼(但不太通用)最小化上下文切換事件。
圖2 固件級(jí)別探索及其利弊
圖2說(shuō)明了優(yōu)化級(jí)別,并已經(jīng)報(bào)告了一些權(quán)衡的結(jié)果。隨著我們引入優(yōu)化,功率消耗的峰值往往會(huì)減少很多。這是一個(gè)主要目標(biāo),但它也帶來(lái)了一些重要的缺陷。
在每一個(gè)優(yōu)化步驟中,我們都觀(guān)察到CPU固件的靈活性和可移植性的損失。同樣,閑置空閑能力時(shí)。
為了進(jìn)行目標(biāo)測(cè)量,我們準(zhǔn)備了圖3所示的裝置。安裝的基礎(chǔ)是一個(gè)開(kāi)發(fā)板,包括一個(gè)用于承載芯片樣本的螺絲插座。這樣的板然后連接到幾個(gè)控制和測(cè)量工具。
圖3 實(shí)驗(yàn)裝置
一個(gè)硬件調(diào)試器被連接到電路板上,以便主機(jī)啟動(dòng)和控制CPU功能的執(zhí)行。 然后,電路板通過(guò)兩種類(lèi)型的探頭連接到示波器上。電流探頭用于測(cè)量測(cè)試執(zhí)行過(guò)程中的電流變化:這種探針 "窺探 "了沿測(cè)試執(zhí)行過(guò)程中給磁芯供電的電源線(xiàn)。此外,一個(gè)數(shù)字探針被用來(lái)捕捉數(shù)字引腳的值。這種操作對(duì)于確定正確的時(shí)間來(lái)觀(guān)察測(cè)試流程中的功耗變化非常重要。
在以下圖表中,我們報(bào)告了與FLASH存儲(chǔ)器兩個(gè)連續(xù)扇區(qū)的測(cè)試有關(guān)的測(cè)量。數(shù)字探頭用于識(shí)別輪詢(xún)間隔,用黃色報(bào)告,而用電流探頭測(cè)量的功耗趨勢(shì)用藍(lán)色報(bào)告。 圖4顯示了基線(xiàn)CPU固件的應(yīng)用。我們用百分比來(lái)做一個(gè)公平的比較,在這種情況下,功率峰值振幅和測(cè)試時(shí)間是100%。
圖4 CPU應(yīng)用程序的基線(xiàn)
圖5?減少輪詢(xún)活動(dòng)頻率
圖6 空閑模式激活
圖7 減少了上下文切換事件
總的來(lái)說(shuō),我們觀(guān)察到,有幾種方法可以用來(lái)減少功率峰值的振幅,這對(duì)于安全地規(guī)劃其他測(cè)試與FLASH內(nèi)存測(cè)試程序的并行化至關(guān)重要。以靈活性和可移植性為代價(jià),減少CPU的 "無(wú)用 "活動(dòng)(例如,通過(guò)減少代碼中對(duì)函數(shù)的嵌套調(diào)用數(shù)量來(lái)最小化上下文切換)看起來(lái)是最有效的方法,它對(duì)測(cè)試時(shí)間沒(méi)有影響。
另外,基于空轉(zhuǎn)的方法可以節(jié)省較少但顯著的電流輸入,并且對(duì)測(cè)試時(shí)間影響有限。
III.基于軟件的自測(cè)試開(kāi)發(fā)和AI芯片的分級(jí)
汽車(chē)的功能安全標(biāo)準(zhǔn),如ISO26262,要求使用硬件和軟件技術(shù)對(duì)潛在的故障進(jìn)行現(xiàn)場(chǎng)測(cè)試?;谲浖詸z(SBST)的軟件測(cè)試庫(kù)(STL)是一種靈活的潛伏故障測(cè)試解決方案,可替代基于可測(cè)試性設(shè)計(jì)(DfT)特征的硬件方法。STL可以被集成到任務(wù)操作系統(tǒng)中,并在空閑時(shí)間定期執(zhí)行。
然而,在為基于多核處理器的人工智能芯片開(kāi)發(fā)STL時(shí),徹底優(yōu)化故障分級(jí)過(guò)程和用適當(dāng)?shù)能浖K管理STL的執(zhí)行是至關(guān)重要的。 在下面的小節(jié)中,描述了經(jīng)典案例,STL的開(kāi)發(fā)策略,以及如何將它們集成到系統(tǒng)中。最后,展示了故障仿真結(jié)果。
A.經(jīng)典案例
該經(jīng)典案例是由Dolphin Design公司開(kāi)發(fā)的一個(gè)多核人工智能芯片,用于加速神經(jīng)網(wǎng)絡(luò)所需的操作(見(jiàn)圖1)。該模塊包括一個(gè)由16個(gè)PULP-NN RISC-V核(Core0 - Core15)組成的集群,有128kB的L1內(nèi)存。
指令是在一個(gè)與集群外的二級(jí)存儲(chǔ)器通信的指令緩存內(nèi)獲取的。外部總線(xiàn)提供了與內(nèi)部L1的通信,并可由核心0或通過(guò)DMA訪(fǎng)問(wèn)。內(nèi)部總線(xiàn)負(fù)責(zé)連接所有的內(nèi)部模塊,為并發(fā)的訪(fǎng)問(wèn)提供調(diào)解。事件單元提供硬件事件來(lái)協(xié)調(diào)集群內(nèi)部的操作。最后,一個(gè)共享浮點(diǎn)單元(FPU)包含8個(gè)計(jì)算核心,用于浮點(diǎn)之間的“經(jīng)典”操作,以及一個(gè)用于DIV和SQRT的計(jì)算核心。
圖8 多核AI設(shè)計(jì)框圖的案例研究
軟件開(kāi)發(fā)工具包(SDK)可用于配置和編程SoC。使用SDK,用戶(hù)可以決定如何安排測(cè)試和組織測(cè)試程序作為操作系統(tǒng)(OS)的任務(wù)。 B.STL 開(kāi)發(fā) 整體的STL開(kāi)發(fā)被分割成幾個(gè)測(cè)生成,使用較小的故障列表。一些模塊(如CPU核,或FPU共享子單元)被多次復(fù)制,可以通過(guò)專(zhuān)注于一個(gè)模塊,然后通過(guò)在其他模塊上做測(cè)試程序的移植來(lái)解決。
關(guān)注每個(gè)子模塊可以減少執(zhí)行故障模擬和評(píng)估目標(biāo)模塊測(cè)試程序質(zhì)量所需的時(shí)間。對(duì)于特定部件,為其他模塊開(kāi)發(fā)的測(cè)試產(chǎn)生的副作用是不可忽略的(例如,在互連的仲裁和多路復(fù)用邏輯上); 通過(guò)在目標(biāo)模塊上模擬這些測(cè)試程序,可以精簡(jiǎn)故障列表,減少生成時(shí)間。
測(cè)試策略包括在對(duì)RTL設(shè)計(jì)進(jìn)行仔細(xì)分析后,使用偽隨機(jī)和ATPG約束方法產(chǎn)生的模式。每個(gè)測(cè)試程序首先通過(guò)考慮所有子模塊的主要輸出(Pos)進(jìn)行故障模擬,并細(xì)化直至達(dá)到目標(biāo)故障覆蓋率;最后對(duì)程序進(jìn)行重新模擬,掩蓋數(shù)據(jù)結(jié)果傳播過(guò)程中所沒(méi)有的所有POs;測(cè)試程序?qū)y(cè)試結(jié)果壓縮為一種形式的簽名,保存在內(nèi)存位置,并在測(cè)試結(jié)束時(shí)與預(yù)期的結(jié)果進(jìn)行比較。
C.STL 集成 軟件測(cè)試庫(kù)的結(jié)構(gòu)分三個(gè)層次,如圖9所示: 1) 最底層包括用C語(yǔ)言和匯編開(kāi)發(fā)的測(cè)試程序,以更好地運(yùn)行內(nèi)部模塊。 2) 中間層直接與SDK進(jìn)行溝通,以協(xié)調(diào)和評(píng)估整個(gè)集群內(nèi)的測(cè)試操作。 3) 最高層與操作系統(tǒng)同時(shí)工作,在任務(wù)運(yùn)行期間安排測(cè)試階段。
圖9 STL架構(gòu)
為了保證穩(wěn)健性,軟件必須考慮到所有可能的故障,這些故障的存在會(huì)導(dǎo)致系統(tǒng)死鎖: ●? 當(dāng)測(cè)試操作啟動(dòng)時(shí),軟件會(huì)使用內(nèi)核軟件提供的適當(dāng)程序來(lái)處理上下文切換。 ● 由于在失敗的情況下會(huì)出現(xiàn)異常,所以必須修改相對(duì)處理程序,以便與影響測(cè)試結(jié)果的測(cè)試軟件溝通。 ●? 最后,在開(kāi)始測(cè)試階段之前,必須初始化一個(gè)看門(mén)狗定時(shí)器,以便在發(fā)生不可預(yù)見(jiàn)的事件時(shí)強(qiáng)制停止測(cè)試。 
測(cè)試程序的并行執(zhí)行是通過(guò)在L1內(nèi)存中保留一個(gè)專(zhuān)用空間來(lái)實(shí)現(xiàn)的,其中包含有關(guān)測(cè)試程序狀態(tài)的參數(shù)結(jié)構(gòu)。通過(guò)訪(fǎng)問(wèn)這些內(nèi)存區(qū)域,可以利用內(nèi)核功能在內(nèi)部集群核心和外部之間進(jìn)行同步操作。 D.故障模擬結(jié)果 實(shí)驗(yàn)是在Xeon Gold 6126工作站的4個(gè)核心上使用商用順序故障模擬器進(jìn)行的,該工作站配備128GB RAM。
在對(duì)每個(gè)集群的子模塊進(jìn)行故障仿真后,通過(guò)邏輯仿真驗(yàn)證了STL的功能;為了加快這一過(guò)程,使用RTL描述對(duì)外部芯片進(jìn)行仿真,同時(shí)為集群保留門(mén)級(jí)。 表一報(bào)告了16個(gè)CPU核、FPU和互連的故障模擬結(jié)果。對(duì)于每個(gè)模塊,我們報(bào)告了卡住故障的數(shù)量、故障覆蓋率和故障模擬時(shí)間。
該表顯示,所有內(nèi)核區(qū)域的故障覆蓋率都很好,共享FPU的故障覆蓋率為離散值。我們通過(guò)運(yùn)行為其他區(qū)塊編寫(xiě)的測(cè)試程序來(lái)計(jì)算互連上的FC。 表二中報(bào)告了一個(gè)CPU核心(Core 0)的子模塊的細(xì)節(jié)。其他CPU核顯示了類(lèi)似的結(jié)果,盡管故障列表有輕微的差異。
整個(gè)STL在16個(gè)CPU核心上同步運(yùn)行的測(cè)試應(yīng)用間在100MHz下約為8ms,大小約為20KB,這驗(yàn)證了在實(shí)時(shí)系統(tǒng)的現(xiàn)場(chǎng)測(cè)試中采用這種測(cè)試技術(shù)的可能性。
IV.用于汽車(chē)應(yīng)用可靠性評(píng)估的高級(jí)故障注入
在接下來(lái)的段落中,描述了一種基于高級(jí)軟件仿真和QEMU仿真引擎,快速評(píng)估復(fù)雜SoC上單次事件顛覆(SEU)影響的方法。這一策略被用來(lái)對(duì)運(yùn)行在Xilinx Ultrascale+ MPSoC上的幾個(gè)應(yīng)用進(jìn)行分級(jí)。SEU是由電離粒子擊中SoC中的敏感點(diǎn)(如CPU寄存器、外設(shè)寄存器或互連)而引起的位缺陷。根據(jù)執(zhí)行的程序和涉及的外圍模塊,這些位缺陷可能會(huì)對(duì)系統(tǒng)造成影響。
評(píng)估SEU對(duì)運(yùn)行在特定設(shè)備上的應(yīng)用的影響通常是一項(xiàng)非常困難的任務(wù)。輻照測(cè)試,即設(shè)備在離子流下運(yùn)行,是最精確的測(cè)量,但也非常昂貴。此外,在離子流下的實(shí)驗(yàn)失敗可能會(huì)導(dǎo)致沉重的額外費(fèi)用。無(wú)論如何,測(cè)試和可靠性工程師需要提前驗(yàn)證他們的實(shí)驗(yàn)流程,以證明準(zhǔn)備的設(shè)置是有效的,不會(huì)導(dǎo)致收集無(wú)用的數(shù)據(jù)。
在這方面,基于仿真的方法近年來(lái)被廣泛使用;在這種情況下,需要使用網(wǎng)格列表,而實(shí)驗(yàn)在CPU時(shí)間和內(nèi)存方面要求極高,往往導(dǎo)致不可行。因此,進(jìn)一步減輕這些初步評(píng)估成本正成為一個(gè)首要目標(biāo)。我們建議采用一種替代性的模擬方法,以軟件仿真為代表。軟件仿真器,如QEMU引擎,運(yùn)行的不是電路的一對(duì)一模型,而是程序員對(duì)設(shè)備的模型行為的精確模型,并非常迅速地再現(xiàn)系統(tǒng)的功能。
當(dāng)使用仿真器時(shí),程序員仍然可以看到用戶(hù)手冊(cè)中描述的所有寄存器,這些值與真實(shí)電路的行為是一致的。 這是提出的方法的出發(fā)點(diǎn)。我們對(duì)Xilinx Ultrascale+ MPSoC的QEMU版本進(jìn)行了檢測(cè),在CPU和外圍模塊的寄存器中注入SEU。
圖10 總體環(huán)境和工作原理
圖10說(shuō)明了該方法的總體情況。我們開(kāi)發(fā)了一個(gè)外部管理器,它連接到QEMU進(jìn)程,以啟動(dòng)應(yīng)用程序的并監(jiān)測(cè)其行為。外部管理器還負(fù)責(zé)處理SEU的注入,方法是暫停應(yīng)用程序,破壞其中一個(gè)可用的資源(通過(guò)作用于主機(jī)RAM內(nèi)存內(nèi)容),并恢復(fù)正在運(yùn)行的程序的執(zhí)行,以觀(guān)察故障效應(yīng)是否導(dǎo)致故障發(fā)生。 圖11進(jìn)一步說(shuō)明了注入流。?
外部管理器暫停TA的執(zhí)行并注入一個(gè)故障。然后,它恢復(fù)執(zhí)行并監(jiān)控結(jié)果。結(jié)果被分成三類(lèi):錯(cuò)誤的回答、沒(méi)有效果、和基于程序運(yùn)行結(jié)果的超時(shí)。
圖11 基于QEMU的注入方法的總體視圖
重要的是要注意,故障注入不僅是在CPU寄存器上進(jìn)行。我們的環(huán)境可以注入映射在設(shè)備內(nèi)存中的外圍寄存器。在下面的實(shí)驗(yàn)結(jié)果中,將看到一些破壞其中一個(gè)集成DMA的寄存器的例子。我們?cè)谝粋€(gè) Fast ?Fourier ?Transform (FFT)程序上實(shí)驗(yàn)了這個(gè)設(shè)置,該程序也與它的反FFT程序相連接。我們也用它來(lái)驗(yàn)證關(guān)于SoC外圍設(shè)備注入的環(huán)境。
圖12展示了應(yīng)用程序的流程。在一個(gè)循環(huán)中,執(zhí)行以下一組操作: 1) 所用的CPU對(duì)給定的一系列數(shù)值執(zhí)行FFT,產(chǎn)生結(jié)果值 2)? 觸發(fā)DMA傳輸,將FFT的結(jié)果移動(dòng)到內(nèi)存中的一個(gè)新位置 3)? 然后通過(guò)使用轉(zhuǎn)移的FFT結(jié)果執(zhí)行iFFT 4) 最后將iFFT結(jié)果與原始結(jié)果進(jìn)行對(duì)比測(cè)試。
如果這個(gè)最終的檢查結(jié)果顯示最終的數(shù)值與原來(lái)的不同,那么就有一個(gè)錯(cuò)誤的答案。如果程序進(jìn)入了循環(huán)或陷阱,那么就有一個(gè)超時(shí)。其他的所有情況下,歸結(jié)為無(wú)效果。表三 包括在隨機(jī)寄存器和隨機(jī)時(shí)間點(diǎn)中注入10000個(gè)SEU的結(jié)果,這些結(jié)果收集在一個(gè)故障列表中。在注入每個(gè)SEU后,觀(guān)察程序運(yùn)行的結(jié)果。然后重新啟動(dòng)系統(tǒng),繼續(xù)處理故障列表中的下一個(gè)SEU。
圖12 FFT+iFFT應(yīng)用
從表中可以看出,注入10,000個(gè)故障需要35分鐘左右,主要是因?yàn)槌瑫r(shí)的數(shù)量相對(duì)較多。此外,我們對(duì)一個(gè)神經(jīng)網(wǎng)絡(luò)應(yīng)用的軟件實(shí)施了注入故障,該軟件經(jīng)過(guò)訓(xùn)練,可以識(shí)別來(lái)自修改后的國(guó)家標(biāo)準(zhǔn)和技術(shù)研究所(MNIST)數(shù)據(jù)庫(kù)的手寫(xiě)數(shù)字。
與沒(méi)有錯(cuò)誤的黃金執(zhí)行相比,我們將每個(gè)做出不同猜測(cè)的執(zhí)行都標(biāo)記為錯(cuò)誤答案。從表III中可以看出,神經(jīng)網(wǎng)絡(luò)似乎對(duì)SEUs很有彈性,在10,000次隨機(jī)注入的CPU寄存器上,只有0.81%的錯(cuò)誤答案。注入的時(shí)間達(dá)到89分鐘。這是由于要執(zhí)行的程序的復(fù)雜性,以及發(fā)現(xiàn)的超時(shí)次數(shù)造成的。
作為最終數(shù)字的驗(yàn)證,并了解用QEMU模擬得到的結(jié)果是否能代表輻照測(cè)試結(jié)果,我們將其與[13]中的結(jié)果進(jìn)行了比較,并觀(guān)察到有很強(qiáng)的相關(guān)性。當(dāng)然,仿真不能取代輻照活動(dòng),但它可以用來(lái)描述即將被輻照的應(yīng)用的特征,或?qū)υS多應(yīng)用進(jìn)行比較,以預(yù)測(cè)哪一個(gè)是最敏感的。
綜上所述,該方法允許在輻照實(shí)驗(yàn)前快速運(yùn)行應(yīng)用程序評(píng)估,以預(yù)測(cè)應(yīng)用程序本身的敏感性或表征技術(shù),或在部署用戶(hù)應(yīng)用程序之前。
值得注意的是,這種方法不需要芯片的網(wǎng)表,因此既可以被芯片供應(yīng)商采用,以提前表述其設(shè)計(jì),也可以被終端用戶(hù)采用,后者可以快速運(yùn)行其應(yīng)用程序,并在輻照芯片之前獲得近似的結(jié)果進(jìn)行分析。
V.結(jié)論
本文描述了汽車(chē)領(lǐng)域的重要參與者所使用的一些方法和技術(shù),以達(dá)到不可缺少的可靠性水平要求的最新標(biāo)準(zhǔn)。圖示的典型案例與汽車(chē)芯片在其生命周期中所包含的幾個(gè)測(cè)試階段有關(guān),包括制造結(jié)構(gòu)和功能測(cè)試,以及確保在現(xiàn)場(chǎng)使用期間有可靠行為的方法。
作為一個(gè)經(jīng)驗(yàn)教訓(xùn),對(duì)最合適的測(cè)試程序進(jìn)行準(zhǔn)確的評(píng)估和規(guī)劃,可以使高質(zhì)量的汽車(chē)產(chǎn)品符合半導(dǎo)體生產(chǎn)商以及更高層次的期望。
審核編輯:劉清
電子發(fā)燒友App



















評(píng)論