汽車(chē)系統(tǒng)級(jí)芯片（SoC）的單一事件顛覆影響評(píng)估方法

確保將最高質(zhì)量的產(chǎn)品運(yùn)往市場(chǎng)，并保證它們?cè)谄渖芷趦?nèi)持續(xù)工作，是汽車(chē)芯片制造商的首要目標(biāo)。的確，我們需要大力改進(jìn)和加強(qiáng)制造測(cè)試程序，以使整個(gè)芯片種群中的潛在故障少之又少。然而，高質(zhì)量的生產(chǎn)必須遵循現(xiàn)場(chǎng)可靠性;制定戰(zhàn)略和活動(dòng)來(lái)面對(duì)前方生命周期的關(guān)鍵問(wèn)題也具有非常高的優(yōu)先地位。

本文的貢獻(xiàn)包括以下幾個(gè)方面的描述和結(jié)果:(1)一種非常精確的方法來(lái)評(píng)估FLASH制造測(cè)試的功耗；(2)一種有效的多核基于軟件的自檢生成策略，面向人工智能的計(jì)算機(jī)體系結(jié)構(gòu)；(3)一個(gè)高水平和非?？焖俚南到y(tǒng)級(jí)芯片的架構(gòu)仿真器，用于原型設(shè)計(jì)輻照實(shí)驗(yàn)和預(yù)測(cè)運(yùn)動(dòng)結(jié)果，對(duì)處理器和外圍核心的單一事件設(shè)置具有良好的準(zhǔn)確等級(jí)。

I.簡(jiǎn)介

詳細(xì)介紹了重新調(diào)整制造測(cè)試流程的最佳做法，通過(guò)考慮克服結(jié)構(gòu)測(cè)試在線(xiàn)限制的測(cè)試技術(shù)來(lái)達(dá)到標(biāo)準(zhǔn)預(yù)期，并節(jié)省時(shí)間和計(jì)算資源來(lái)評(píng)估利用所有系統(tǒng)級(jí)芯片（SoC）功能的汽車(chē)應(yīng)用的穩(wěn)健性，包括CPU和外圍核心。

第二節(jié)介紹了如何對(duì)嵌入式FLASH存儲(chǔ)器的制造測(cè)試進(jìn)行非常準(zhǔn)確的功率表征。正如后面所詳述的那樣，該技術(shù)的目標(biāo)是測(cè)量一個(gè)復(fù)合DfT模式的電流吸收，該模式可以通過(guò)調(diào)整固件來(lái)滿(mǎn)足不同的期望。為了在測(cè)試執(zhí)行過(guò)程中設(shè)置正確的測(cè)試電壓裕度，并允許詳細(xì)說(shuō)明與FLASH測(cè)試并行進(jìn)行的其他測(cè)試，澄清該評(píng)估是至關(guān)重要的。In?neon科技公司報(bào)告了有關(guān)嵌入式FLASH存儲(chǔ)器測(cè)試的數(shù)據(jù)，顯示了各種測(cè)試固件版本的功耗趨勢(shì)。

第三節(jié)說(shuō)明了如何為一個(gè)包括幾個(gè)計(jì)算核心的面向人工智能的設(shè)備創(chuàng)建一個(gè)基于軟件的自我測(cè)試套件。網(wǎng)表的大小和復(fù)雜性是這個(gè)方向的主要關(guān)注點(diǎn)；可能的自動(dòng)化和巧妙的分級(jí)程序是本節(jié)討論的關(guān)鍵點(diǎn)。Dolphin設(shè)計(jì)公司對(duì)其汽車(chē)AI芯片所報(bào)告的結(jié)果表明，基于軟件的自我測(cè)試策略是可擴(kuò)展的，并適用于大型多處理器設(shè)備的適當(dāng)在線(xiàn)測(cè)試策略。然而，產(chǎn)生的功能測(cè)試程序可用于補(bǔ)充制造測(cè)試期間的結(jié)構(gòu)方法，即查看系統(tǒng)級(jí)測(cè)試覆蓋率。

第四節(jié)完成了本文所描述的方法和策略的概述。在這一部分，重點(diǎn)是瞬態(tài)故障的影響，并提出了一種方法來(lái)估計(jì)可能影響整個(gè)系統(tǒng)級(jí)芯片（SoC）的單一事件顛覆的影響。所描述的解決方案是基于一個(gè)仿真引擎，能夠快速重現(xiàn)包括處理器和外設(shè)核心在內(nèi)的SoC的行為；在特殊情況下，Xilinx Zynq UltraScale+ MPSoC是通過(guò)使用QEMU平臺(tái)進(jìn)行仿真的，QEMU平臺(tái)是以這樣一種方式進(jìn)行檢測(cè)的，它可以在應(yīng)用程序的執(zhí)行過(guò)程中注入瞬時(shí)故障效應(yīng)。通過(guò)使用這樣的環(huán)境，有可能獲得快速、略微不準(zhǔn)確的關(guān)于瞬態(tài)故障對(duì)功能的影響的的估計(jì)。因此，這種方法可以對(duì)輻照實(shí)驗(yàn)中觀(guān)察到的故障水平進(jìn)行原始但非常便宜的預(yù)測(cè)。

第五節(jié)得出了一些結(jié)論，并強(qiáng)調(diào)了汽車(chē)主題的合理看法。

II.嵌入式FLASH的功率表征測(cè)試

每個(gè)內(nèi)存測(cè)試的特點(diǎn)是有一定的電流消耗水平。通常，這種水平在測(cè)試執(zhí)行過(guò)程中不是恒定的，而且在許多情況下，峰值可能會(huì)出現(xiàn)在平均水平上。了解產(chǎn)生這些峰值的原因是很重要的，即識(shí)別相關(guān)的IR-droop問(wèn)題可能會(huì)減少矯枉過(guò)正，并使更多的測(cè)試并行化，可能允許在同一時(shí)間測(cè)試不同的芯片部件，以減少測(cè)試時(shí)間。

在這些段落中，我們專(zhuān)注于FLASH存儲(chǔ)器測(cè)試，特別是尋找有關(guān)所謂的 "驗(yàn)證測(cè)試 "技術(shù)的功率信息，該技術(shù)旨在測(cè)試存儲(chǔ)在片上系統(tǒng)（SoC）中的FLASH存儲(chǔ)器陣列。對(duì)測(cè)試步驟中的功耗水平進(jìn)行認(rèn)真的調(diào)查，也可以對(duì)測(cè)試條件的余量達(dá)到更高的置信度，這也是達(dá)到大批量制造質(zhì)量的一個(gè)不可缺少的因素。隨著測(cè)試場(chǎng)景變得復(fù)雜，超出功率限制的風(fēng)險(xiǎn)也會(huì)相應(yīng)增加。

如今，集成在SoC中的嵌入式可測(cè)試性設(shè)計(jì)（DFT）功能可能是非常復(fù)合的，因此功率表征可能會(huì)被所有這些組件污染。為了更好地了解每個(gè)角色者在所考慮的測(cè)試場(chǎng)景中的貢獻(xiàn)，調(diào)試設(shè)置變得非常重要。在接下來(lái)的段落中，我們將描述如何收集英飛凌Aurix系統(tǒng)在多種條件下運(yùn)行時(shí)的重要功率測(cè)量數(shù)據(jù)。

圖1?總體環(huán)境和工作原則

如圖1所示，Aurix FLASH存儲(chǔ)器測(cè)試涉及許多電路。高速和背對(duì)背的訪(fǎng)問(wèn)是由一個(gè)可編程的內(nèi)置自檢（可編程BIST）授予的，它由一個(gè)Tricore處理器核心控制。PBIST功能允許在不同條件下進(jìn)行驗(yàn)證測(cè)試，如內(nèi)部電壓和頻率參數(shù)。在我們的工作中，主要調(diào)查了CPU組件行為的影響，因?yàn)樗诩働BIST功率特性方面引入了一個(gè)額外的電流消耗因素。

為了識(shí)別功率峰值并確定其最大振幅，我們?cè)u(píng)估了幾個(gè)CPU固件版本。圖2總結(jié)了一組測(cè)量的構(gòu)架： 1) 未經(jīng)優(yōu)化的CPU固件版本，該版本 a) 不斷地輪詢(xún)PBIST以獲取故障信息 b) 包括調(diào)試功能，如跟蹤特殊用途寄存器的讀寫(xiě)操作 c) 實(shí)施高水平的嵌套功能，以達(dá)到重復(fù)使用的目的。 2) 減少對(duì)PBIST的輪詢(xún)頻率 3) 利用在輪詢(xún)事件之間進(jìn)入的空閑模式 4) 通過(guò) "簡(jiǎn)化 "的代碼（但不太通用）最小化上下文切換事件。

圖2 固件級(jí)別探索及其利弊

圖2說(shuō)明了優(yōu)化級(jí)別，并已經(jīng)報(bào)告了一些權(quán)衡的結(jié)果。隨著我們引入優(yōu)化，功率消耗的峰值往往會(huì)減少很多。這是一個(gè)主要目標(biāo)，但它也帶來(lái)了一些重要的缺陷。

在每一個(gè)優(yōu)化步驟中，我們都觀(guān)察到CPU固件的靈活性和可移植性的損失。同樣，閑置空閑能力時(shí)。

為了進(jìn)行目標(biāo)測(cè)量，我們準(zhǔn)備了圖3所示的裝置。安裝的基礎(chǔ)是一個(gè)開(kāi)發(fā)板，包括一個(gè)用于承載芯片樣本的螺絲插座。這樣的板然后連接到幾個(gè)控制和測(cè)量工具。

圖3 實(shí)驗(yàn)裝置

一個(gè)硬件調(diào)試器被連接到電路板上，以便主機(jī)啟動(dòng)和控制CPU功能的執(zhí)行。然后，電路板通過(guò)兩種類(lèi)型的探頭連接到示波器上。電流探頭用于測(cè)量測(cè)試執(zhí)行過(guò)程中的電流變化：這種探針 "窺探 "了沿測(cè)試執(zhí)行過(guò)程中給磁芯供電的電源線(xiàn)。此外，一個(gè)數(shù)字探針被用來(lái)捕捉數(shù)字引腳的值。這種操作對(duì)于確定正確的時(shí)間來(lái)觀(guān)察測(cè)試流程中的功耗變化非常重要。

在以下圖表中，我們報(bào)告了與FLASH存儲(chǔ)器兩個(gè)連續(xù)扇區(qū)的測(cè)試有關(guān)的測(cè)量。數(shù)字探頭用于識(shí)別輪詢(xún)間隔，用黃色報(bào)告，而用電流探頭測(cè)量的功耗趨勢(shì)用藍(lán)色報(bào)告。圖4顯示了基線(xiàn)CPU固件的應(yīng)用。我們用百分比來(lái)做一個(gè)公平的比較，在這種情況下，功率峰值振幅和測(cè)試時(shí)間是100%。

圖4 CPU應(yīng)用程序的基線(xiàn)

圖5?減少輪詢(xún)活動(dòng)頻率

圖6 空閑模式激活

圖7 減少了上下文切換事件

總的來(lái)說(shuō)，我們觀(guān)察到，有幾種方法可以用來(lái)減少功率峰值的振幅，這對(duì)于安全地規(guī)劃其他測(cè)試與FLASH內(nèi)存測(cè)試程序的并行化至關(guān)重要。以靈活性和可移植性為代價(jià)，減少CPU的 "無(wú)用 "活動(dòng)（例如，通過(guò)減少代碼中對(duì)函數(shù)的嵌套調(diào)用數(shù)量來(lái)最小化上下文切換）看起來(lái)是最有效的方法，它對(duì)測(cè)試時(shí)間沒(méi)有影響。

另外，基于空轉(zhuǎn)的方法可以節(jié)省較少但顯著的電流輸入，并且對(duì)測(cè)試時(shí)間影響有限。

III.基于軟件的自測(cè)試開(kāi)發(fā)和AI芯片的分級(jí)

汽車(chē)的功能安全標(biāo)準(zhǔn)，如ISO26262，要求使用硬件和軟件技術(shù)對(duì)潛在的故障進(jìn)行現(xiàn)場(chǎng)測(cè)試?；谲浖詸z（SBST）的軟件測(cè)試庫(kù)（STL）是一種靈活的潛伏故障測(cè)試解決方案，可替代基于可測(cè)試性設(shè)計(jì)（DfT）特征的硬件方法。STL可以被集成到任務(wù)操作系統(tǒng)中，并在空閑時(shí)間定期執(zhí)行。

然而，在為基于多核處理器的人工智能芯片開(kāi)發(fā)STL時(shí)，徹底優(yōu)化故障分級(jí)過(guò)程和用適當(dāng)?shù)能浖K管理STL的執(zhí)行是至關(guān)重要的。在下面的小節(jié)中，描述了經(jīng)典案例，STL的開(kāi)發(fā)策略，以及如何將它們集成到系統(tǒng)中。最后，展示了故障仿真結(jié)果。

A.經(jīng)典案例

該經(jīng)典案例是由Dolphin Design公司開(kāi)發(fā)的一個(gè)多核人工智能芯片，用于加速神經(jīng)網(wǎng)絡(luò)所需的操作（見(jiàn)圖1）。該模塊包括一個(gè)由16個(gè)PULP-NN RISC-V核（Core0 - Core15）組成的集群，有128kB的L1內(nèi)存。

指令是在一個(gè)與集群外的二級(jí)存儲(chǔ)器通信的指令緩存內(nèi)獲取的。外部總線(xiàn)提供了與內(nèi)部L1的通信，并可由核心0或通過(guò)DMA訪(fǎng)問(wèn)。內(nèi)部總線(xiàn)負(fù)責(zé)連接所有的內(nèi)部模塊，為并發(fā)的訪(fǎng)問(wèn)提供調(diào)解。事件單元提供硬件事件來(lái)協(xié)調(diào)集群內(nèi)部的操作。最后，一個(gè)共享浮點(diǎn)單元(FPU)包含8個(gè)計(jì)算核心，用于浮點(diǎn)之間的“經(jīng)典”操作，以及一個(gè)用于DIV和SQRT的計(jì)算核心。

圖8 多核AI設(shè)計(jì)框圖的案例研究

軟件開(kāi)發(fā)工具包（SDK）可用于配置和編程SoC。使用SDK，用戶(hù)可以決定如何安排測(cè)試和組織測(cè)試程序作為操作系統(tǒng)（OS）的任務(wù)。 B.STL 開(kāi)發(fā) 整體的STL開(kāi)發(fā)被分割成幾個(gè)測(cè)生成，使用較小的故障列表。一些模塊（如CPU核，或FPU共享子單元）被多次復(fù)制，可以通過(guò)專(zhuān)注于一個(gè)模塊，然后通過(guò)在其他模塊上做測(cè)試程序的移植來(lái)解決。

關(guān)注每個(gè)子模塊可以減少執(zhí)行故障模擬和評(píng)估目標(biāo)模塊測(cè)試程序質(zhì)量所需的時(shí)間。對(duì)于特定部件，為其他模塊開(kāi)發(fā)的測(cè)試產(chǎn)生的副作用是不可忽略的(例如，在互連的仲裁和多路復(fù)用邏輯上); 通過(guò)在目標(biāo)模塊上模擬這些測(cè)試程序，可以精簡(jiǎn)故障列表，減少生成時(shí)間。

測(cè)試策略包括在對(duì)RTL設(shè)計(jì)進(jìn)行仔細(xì)分析后，使用偽隨機(jī)和ATPG約束方法產(chǎn)生的模式。每個(gè)測(cè)試程序首先通過(guò)考慮所有子模塊的主要輸出(Pos)進(jìn)行故障模擬，并細(xì)化直至達(dá)到目標(biāo)故障覆蓋率;最后對(duì)程序進(jìn)行重新模擬，掩蓋數(shù)據(jù)結(jié)果傳播過(guò)程中所沒(méi)有的所有POs;測(cè)試程序?qū)y(cè)試結(jié)果壓縮為一種形式的簽名，保存在內(nèi)存位置，并在測(cè)試結(jié)束時(shí)與預(yù)期的結(jié)果進(jìn)行比較。

C.STL 集成軟件測(cè)試庫(kù)的結(jié)構(gòu)分三個(gè)層次，如圖9所示： 1) 最底層包括用C語(yǔ)言和匯編開(kāi)發(fā)的測(cè)試程序，以更好地運(yùn)行內(nèi)部模塊。 2) 中間層直接與SDK進(jìn)行溝通，以協(xié)調(diào)和評(píng)估整個(gè)集群內(nèi)的測(cè)試操作。 3) 最高層與操作系統(tǒng)同時(shí)工作，在任務(wù)運(yùn)行期間安排測(cè)試階段。

圖9 STL架構(gòu)

為了保證穩(wěn)健性，軟件必須考慮到所有可能的故障，這些故障的存在會(huì)導(dǎo)致系統(tǒng)死鎖： ●? 當(dāng)測(cè)試操作啟動(dòng)時(shí)，軟件會(huì)使用內(nèi)核軟件提供的適當(dāng)程序來(lái)處理上下文切換。 ● 由于在失敗的情況下會(huì)出現(xiàn)異常，所以必須修改相對(duì)處理程序，以便與影響測(cè)試結(jié)果的測(cè)試軟件溝通。 ●? 最后，在開(kāi)始測(cè)試階段之前，必須初始化一個(gè)看門(mén)狗定時(shí)器，以便在發(fā)生不可預(yù)見(jiàn)的事件時(shí)強(qiáng)制停止測(cè)試。

測(cè)試程序的并行執(zhí)行是通過(guò)在L1內(nèi)存中保留一個(gè)專(zhuān)用空間來(lái)實(shí)現(xiàn)的，其中包含有關(guān)測(cè)試程序狀態(tài)的參數(shù)結(jié)構(gòu)。通過(guò)訪(fǎng)問(wèn)這些內(nèi)存區(qū)域，可以利用內(nèi)核功能在內(nèi)部集群核心和外部之間進(jìn)行同步操作。 D.故障模擬結(jié)果實(shí)驗(yàn)是在Xeon Gold 6126工作站的4個(gè)核心上使用商用順序故障模擬器進(jìn)行的，該工作站配備128GB RAM。

在對(duì)每個(gè)集群的子模塊進(jìn)行故障仿真后，通過(guò)邏輯仿真驗(yàn)證了STL的功能；為了加快這一過(guò)程，使用RTL描述對(duì)外部芯片進(jìn)行仿真，同時(shí)為集群保留門(mén)級(jí)。表一報(bào)告了16個(gè)CPU核、FPU和互連的故障模擬結(jié)果。對(duì)于每個(gè)模塊，我們報(bào)告了卡住故障的數(shù)量、故障覆蓋率和故障模擬時(shí)間。

該表顯示，所有內(nèi)核區(qū)域的故障覆蓋率都很好，共享FPU的故障覆蓋率為離散值。我們通過(guò)運(yùn)行為其他區(qū)塊編寫(xiě)的測(cè)試程序來(lái)計(jì)算互連上的FC。表二中報(bào)告了一個(gè)CPU核心（Core 0）的子模塊的細(xì)節(jié)。其他CPU核顯示了類(lèi)似的結(jié)果，盡管故障列表有輕微的差異。

整個(gè)STL在16個(gè)CPU核心上同步運(yùn)行的測(cè)試應(yīng)用間在100MHz下約為8ms，大小約為20KB，這驗(yàn)證了在實(shí)時(shí)系統(tǒng)的現(xiàn)場(chǎng)測(cè)試中采用這種測(cè)試技術(shù)的可能性。

IV.用于汽車(chē)應(yīng)用可靠性評(píng)估的高級(jí)故障注入

在接下來(lái)的段落中，描述了一種基于高級(jí)軟件仿真和QEMU仿真引擎，快速評(píng)估復(fù)雜SoC上單次事件顛覆（SEU）影響的方法。這一策略被用來(lái)對(duì)運(yùn)行在Xilinx Ultrascale+ MPSoC上的幾個(gè)應(yīng)用進(jìn)行分級(jí)。SEU是由電離粒子擊中SoC中的敏感點(diǎn)（如CPU寄存器、外設(shè)寄存器或互連）而引起的位缺陷。根據(jù)執(zhí)行的程序和涉及的外圍模塊，這些位缺陷可能會(huì)對(duì)系統(tǒng)造成影響。

評(píng)估SEU對(duì)運(yùn)行在特定設(shè)備上的應(yīng)用的影響通常是一項(xiàng)非常困難的任務(wù)。輻照測(cè)試，即設(shè)備在離子流下運(yùn)行，是最精確的測(cè)量，但也非常昂貴。此外，在離子流下的實(shí)驗(yàn)失敗可能會(huì)導(dǎo)致沉重的額外費(fèi)用。無(wú)論如何，測(cè)試和可靠性工程師需要提前驗(yàn)證他們的實(shí)驗(yàn)流程，以證明準(zhǔn)備的設(shè)置是有效的，不會(huì)導(dǎo)致收集無(wú)用的數(shù)據(jù)。

在這方面，基于仿真的方法近年來(lái)被廣泛使用；在這種情況下，需要使用網(wǎng)格列表，而實(shí)驗(yàn)在CPU時(shí)間和內(nèi)存方面要求極高，往往導(dǎo)致不可行。因此，進(jìn)一步減輕這些初步評(píng)估成本正成為一個(gè)首要目標(biāo)。我們建議采用一種替代性的模擬方法，以軟件仿真為代表。軟件仿真器，如QEMU引擎，運(yùn)行的不是電路的一對(duì)一模型，而是程序員對(duì)設(shè)備的模型行為的精確模型，并非常迅速地再現(xiàn)系統(tǒng)的功能。

當(dāng)使用仿真器時(shí)，程序員仍然可以看到用戶(hù)手冊(cè)中描述的所有寄存器，這些值與真實(shí)電路的行為是一致的。這是提出的方法的出發(fā)點(diǎn)。我們對(duì)Xilinx Ultrascale+ MPSoC的QEMU版本進(jìn)行了檢測(cè)，在CPU和外圍模塊的寄存器中注入SEU。

圖10 總體環(huán)境和工作原理

圖10說(shuō)明了該方法的總體情況。我們開(kāi)發(fā)了一個(gè)外部管理器，它連接到QEMU進(jìn)程，以啟動(dòng)應(yīng)用程序的并監(jiān)測(cè)其行為。外部管理器還負(fù)責(zé)處理SEU的注入，方法是暫停應(yīng)用程序，破壞其中一個(gè)可用的資源（通過(guò)作用于主機(jī)RAM內(nèi)存內(nèi)容），并恢復(fù)正在運(yùn)行的程序的執(zhí)行，以觀(guān)察故障效應(yīng)是否導(dǎo)致故障發(fā)生。圖11進(jìn)一步說(shuō)明了注入流。?

外部管理器暫停TA的執(zhí)行并注入一個(gè)故障。然后，它恢復(fù)執(zhí)行并監(jiān)控結(jié)果。結(jié)果被分成三類(lèi)：錯(cuò)誤的回答、沒(méi)有效果、和基于程序運(yùn)行結(jié)果的超時(shí)。

圖11 基于QEMU的注入方法的總體視圖

重要的是要注意，故障注入不僅是在CPU寄存器上進(jìn)行。我們的環(huán)境可以注入映射在設(shè)備內(nèi)存中的外圍寄存器。在下面的實(shí)驗(yàn)結(jié)果中，將看到一些破壞其中一個(gè)集成DMA的寄存器的例子。我們?cè)谝粋€(gè) Fast ?Fourier ?Transform （FFT）程序上實(shí)驗(yàn)了這個(gè)設(shè)置，該程序也與它的反FFT程序相連接。我們也用它來(lái)驗(yàn)證關(guān)于SoC外圍設(shè)備注入的環(huán)境。

圖12展示了應(yīng)用程序的流程。在一個(gè)循環(huán)中，執(zhí)行以下一組操作： 1) 所用的CPU對(duì)給定的一系列數(shù)值執(zhí)行FFT，產(chǎn)生結(jié)果值 2)? 觸發(fā)DMA傳輸，將FFT的結(jié)果移動(dòng)到內(nèi)存中的一個(gè)新位置 3)? 然后通過(guò)使用轉(zhuǎn)移的FFT結(jié)果執(zhí)行iFFT 4) 最后將iFFT結(jié)果與原始結(jié)果進(jìn)行對(duì)比測(cè)試。

如果這個(gè)最終的檢查結(jié)果顯示最終的數(shù)值與原來(lái)的不同，那么就有一個(gè)錯(cuò)誤的答案。如果程序進(jìn)入了循環(huán)或陷阱，那么就有一個(gè)超時(shí)。其他的所有情況下，歸結(jié)為無(wú)效果。表三包括在隨機(jī)寄存器和隨機(jī)時(shí)間點(diǎn)中注入10000個(gè)SEU的結(jié)果，這些結(jié)果收集在一個(gè)故障列表中。在注入每個(gè)SEU后，觀(guān)察程序運(yùn)行的結(jié)果。然后重新啟動(dòng)系統(tǒng)，繼續(xù)處理故障列表中的下一個(gè)SEU。

圖12 FFT+iFFT應(yīng)用

從表中可以看出，注入10,000個(gè)故障需要35分鐘左右，主要是因?yàn)槌瑫r(shí)的數(shù)量相對(duì)較多。此外，我們對(duì)一個(gè)神經(jīng)網(wǎng)絡(luò)應(yīng)用的軟件實(shí)施了注入故障，該軟件經(jīng)過(guò)訓(xùn)練，可以識(shí)別來(lái)自修改后的國(guó)家標(biāo)準(zhǔn)和技術(shù)研究所（MNIST）數(shù)據(jù)庫(kù)的手寫(xiě)數(shù)字。

與沒(méi)有錯(cuò)誤的黃金執(zhí)行相比，我們將每個(gè)做出不同猜測(cè)的執(zhí)行都標(biāo)記為錯(cuò)誤答案。從表III中可以看出，神經(jīng)網(wǎng)絡(luò)似乎對(duì)SEUs很有彈性，在10,000次隨機(jī)注入的CPU寄存器上，只有0.81%的錯(cuò)誤答案。注入的時(shí)間達(dá)到89分鐘。這是由于要執(zhí)行的程序的復(fù)雜性，以及發(fā)現(xiàn)的超時(shí)次數(shù)造成的。

作為最終數(shù)字的驗(yàn)證，并了解用QEMU模擬得到的結(jié)果是否能代表輻照測(cè)試結(jié)果，我們將其與[13]中的結(jié)果進(jìn)行了比較，并觀(guān)察到有很強(qiáng)的相關(guān)性。當(dāng)然，仿真不能取代輻照活動(dòng)，但它可以用來(lái)描述即將被輻照的應(yīng)用的特征，或?qū)υS多應(yīng)用進(jìn)行比較，以預(yù)測(cè)哪一個(gè)是最敏感的。

綜上所述，該方法允許在輻照實(shí)驗(yàn)前快速運(yùn)行應(yīng)用程序評(píng)估，以預(yù)測(cè)應(yīng)用程序本身的敏感性或表征技術(shù)，或在部署用戶(hù)應(yīng)用程序之前。

值得注意的是，這種方法不需要芯片的網(wǎng)表，因此既可以被芯片供應(yīng)商采用，以提前表述其設(shè)計(jì)，也可以被終端用戶(hù)采用，后者可以快速運(yùn)行其應(yīng)用程序，并在輻照芯片之前獲得近似的結(jié)果進(jìn)行分析。

V.結(jié)論

本文描述了汽車(chē)領(lǐng)域的重要參與者所使用的一些方法和技術(shù)，以達(dá)到不可缺少的可靠性水平要求的最新標(biāo)準(zhǔn)。圖示的典型案例與汽車(chē)芯片在其生命周期中所包含的幾個(gè)測(cè)試階段有關(guān)，包括制造結(jié)構(gòu)和功能測(cè)試，以及確保在現(xiàn)場(chǎng)使用期間有可靠行為的方法。

作為一個(gè)經(jīng)驗(yàn)教訓(xùn)，對(duì)最合適的測(cè)試程序進(jìn)行準(zhǔn)確的評(píng)估和規(guī)劃，可以使高質(zhì)量的汽車(chē)產(chǎn)品符合半導(dǎo)體生產(chǎn)商以及更高層次的期望。

審核編輯：劉清

閱讀全文