“功能安全常見(jiàn)疑難問(wèn)題解答”
在智能駕駛及新能源汽車(chē)的飛速發(fā)展之下,功能安全已成為繞不開(kāi)的關(guān)鍵領(lǐng)域。然而在實(shí)際應(yīng)用中,一直面臨著諸多問(wèn)題和挑戰(zhàn)。前不久,磐時(shí)舉辦了一場(chǎng)針對(duì)實(shí)操問(wèn)題的線上答疑活動(dòng),我們分類(lèi)整理了一些熱門(mén)問(wèn)題及解答,可作為大家日后實(shí)踐中的參考。
關(guān)于功能安全機(jī)制及其診斷覆蓋率問(wèn)題
Q
外狗從功能上來(lái)講是否可以完全覆蓋內(nèi)狗?什么情況下內(nèi)狗和外狗都需要使用?
A
外狗雖然可以對(duì)程序流進(jìn)行監(jiān)控和保護(hù),但無(wú)法完全替代內(nèi)狗。內(nèi)狗能夠直接嵌入程序中,關(guān)注程序非預(yù)期跳轉(zhuǎn)及執(zhí)行時(shí)間異常等,與應(yīng)用軟件結(jié)合更加緊密。而外狗作為獨(dú)立硬件,主要用于監(jiān)控內(nèi)狗本身,從而保證內(nèi)狗的獨(dú)立性。在某些極端情況下,可以?xún)H保留外狗而取消內(nèi)狗,但這種做法時(shí)延較長(zhǎng)且外狗需要較高智能,實(shí)際效率較低,不推薦采用。
同時(shí)由于內(nèi)狗與應(yīng)用軟件緊密相關(guān),在一些情況下,如芯片內(nèi)部振蕩器發(fā)生錯(cuò)誤時(shí),即使內(nèi)狗正常,診斷代碼和功能執(zhí)行代碼也可能失效,此時(shí)內(nèi)狗就無(wú)法提高檢測(cè)覆蓋率,因此外狗是必需的。
Q
什么樣的CRC滿(mǎn)足ASIL D?
A
對(duì)于通信協(xié)議,標(biāo)準(zhǔn)定義了幾種失效模式,例如數(shù)據(jù)損壞、報(bào)文重復(fù)、錯(cuò)序、丟失、超時(shí)、錯(cuò)誤尋址、偽裝等等,通常采用CRC16/32、滾動(dòng)計(jì)數(shù)器(RC值)、超時(shí)Timeout及幀ID等機(jī)制來(lái)覆蓋。在評(píng)估E2E保護(hù)機(jī)制的殘余風(fēng)險(xiǎn)時(shí),需要根據(jù)CRC多項(xiàng)式計(jì)算出漢明距離,結(jié)合報(bào)文長(zhǎng)度及每小時(shí)PDU發(fā)送量,推導(dǎo)出每小時(shí)的殘余差錯(cuò)率。通常通信總線上的殘余差錯(cuò)率定義為不超過(guò)item對(duì)應(yīng)ASIL等級(jí)的1%。
Q
除了流程上滿(mǎn)足,BSW怎么算滿(mǎn)足了ASIL,常用的安全機(jī)制有哪些?
A
除了滿(mǎn)足流程要求外,BSW滿(mǎn)足ASIL還需要:
1)覆蓋硬件未能診斷的隨機(jī)失效;
2)基于防御性編程思路開(kāi)發(fā),保證軟件確定性,采用標(biāo)準(zhǔn)推薦的方法。
Q
不同功能安全等級(jí)ABCD對(duì)安全機(jī)制的要求,有哪些區(qū)別?功能安全機(jī)制一般要包含哪些要素或注意的地方?
A
不同ASIL等級(jí)對(duì)安全機(jī)制的要求有所區(qū)別:
1)等級(jí)越高,可能需要更多組合的安全機(jī)制來(lái)覆蓋所有失效模式;
2)對(duì)于同一安全機(jī)制,等級(jí)越高其診斷間隔要求就越短,以滿(mǎn)足更短的FTTI周期要求。描述安全機(jī)制時(shí),不僅需要闡述診斷功能,還應(yīng)包括安全路徑即達(dá)到安全狀態(tài)的功能鏈路。
Q
關(guān)于安全機(jī)制的DC,是否存在兩個(gè)low疊加能得出medium這種邏輯?
A
通常情況下,兩個(gè)低DC的安全機(jī)制無(wú)法通過(guò)疊加得到更高的DC。原因是它們可能僅覆蓋了同一種失效模式,無(wú)法涵蓋所有失效模式。不同安全機(jī)制一般覆蓋不同失效模式,需要組合使用才能獲得高DC。
Q
在做程序流監(jiān)控時(shí),BSW或MCAL的周期任務(wù)是否也需要做監(jiān)控?
A
對(duì)于BSW或MCAL等周期任務(wù)的程序流監(jiān)控,需要通過(guò)外部獨(dú)立的硬件看門(mén)狗來(lái)實(shí)現(xiàn)。
關(guān)于功能安全等級(jí)ASIL問(wèn)題
Q
MPU的使用和ASIL等級(jí)是否相關(guān),是否使用MPU還需要考慮哪些因素?
A
MPU作為內(nèi)存分區(qū)的硬件機(jī)制,在操作系統(tǒng)等軟件無(wú)法實(shí)現(xiàn)時(shí)通常需要使用,與ASIL等級(jí)無(wú)直接關(guān)系。MPU的使用主要是通過(guò)限制對(duì)指定內(nèi)存區(qū)域的訪問(wèn)權(quán)限,從而提供通用的內(nèi)存保護(hù)機(jī)制。MPU的使用與否并不僅僅取決于ASIL等級(jí),還需要結(jié)合其他因素綜合考慮,比如不同功能或安全等級(jí)的內(nèi)存保護(hù)。
Q
功能安全對(duì)于D-FMEA是否有要求?以及對(duì)于這些特性后續(xù)在PFMEA或者control plan中是否有要求?
A
功能安全對(duì)D-FMEA是有一定要求的。對(duì)于影響安全的失效模式,嚴(yán)重程度通常需標(biāo)注為9或10級(jí);同時(shí)需標(biāo)注CC(關(guān)鍵特征)和SC(特殊特征),這些特性后續(xù)需要在P-FMEA和控制計(jì)劃中加以管控。
Q
TSR導(dǎo)出HSR和SSR時(shí),請(qǐng)問(wèn)FTTI如何分解?
A
在TSR分解為HSR和SSR時(shí):
1)FTTI已在定義safety goal時(shí)確定;
2)到系統(tǒng)層面時(shí),F(xiàn)TTI需進(jìn)一步分解為FDTI和FRTI;
3)硬件FDTI和FRTI一般在幾ms甚至us量級(jí);
4)軟件FDTI需考慮診斷間隔及誤報(bào)濾波預(yù)留;
5)軟件FRTI可根據(jù)相關(guān)診斷任務(wù)的執(zhí)行周期確定。
Q
ASIL A的功能安全要求有哪些?硬件沒(méi)看到有指標(biāo),軟件這塊需要做到什么程度,有沒(méi)有需要注意的地方?
A
ASIL A產(chǎn)品的功能安全要求包括:
1)極少單獨(dú)存在ASIL A功能,通常與更高等級(jí)需求合并;
2)滿(mǎn)足ISO 26262相關(guān)篇章中ASIL A的基本要求,比如產(chǎn)品的可靠性測(cè)試和功能測(cè)試;
3)主要體現(xiàn)在功能安全管理流程方面,對(duì)診斷機(jī)制要求不會(huì)過(guò)高。
Q
系統(tǒng)階段失效模式有什么參考的嗎,進(jìn)行系統(tǒng)架構(gòu)設(shè)計(jì)的層次顆粒度怎么把握,并介紹做系統(tǒng)DFA的思路。
A
系統(tǒng)階段FMEA/DFA分析的失效模式可以參考:
1)通?;诠δ軐用?,如信號(hào)傳輸、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)處理等進(jìn)行分析,不會(huì)細(xì)化到具體器件;
2)使用“與預(yù)期相反”、“非預(yù)期執(zhí)行”等引導(dǎo)詞指導(dǎo)功能層面分析;
3)顆粒度應(yīng)高于硬件或軟件層面分析。系統(tǒng)DFA的思路也是首先定義分析對(duì)象的DFI要素,DFI可以參考標(biāo)準(zhǔn)的推薦,結(jié)合DFI類(lèi)型進(jìn)行影響分析和分配相關(guān)的安全探測(cè)機(jī)制。
關(guān)于軟硬件架構(gòu)和需求分解問(wèn)題
Q
在軟件架構(gòu)設(shè)計(jì)階段,如何對(duì)軟件架構(gòu)進(jìn)行設(shè)計(jì)驗(yàn)證?比如,如何進(jìn)行數(shù)據(jù)流和控制流分析;如何進(jìn)行原型驗(yàn)證;如何進(jìn)行動(dòng)態(tài)行為仿真?
A
軟件架構(gòu)設(shè)計(jì)驗(yàn)證的常用方法包括:
1)設(shè)計(jì)評(píng)審;
2)原型驗(yàn)證;
3)繪制數(shù)據(jù)流圖和控制流圖,并進(jìn)行軟件FMEA分析;
4)動(dòng)態(tài)行為仿真等。
Q
系統(tǒng)安全需求TSR和系統(tǒng)需求(把系統(tǒng)作為黑盒)是一個(gè)層級(jí)的需求嗎?TSR是否得移植迭代直到一條TSR要不是給軟件實(shí)現(xiàn)要不就是給硬件實(shí)現(xiàn)?TSR是否屬于系統(tǒng)架構(gòu)級(jí)別的需求?(因?yàn)樗€需要allocate給你一個(gè)系統(tǒng)要素)?同理軟件安全需求和軟件需求的關(guān)系是不是也是這樣?
A
1)系統(tǒng)安全需求TSR與系統(tǒng)需求雖屬同一層級(jí),但TSR的顆粒度更細(xì),至少需將需求分配到具體的軟硬件組件;
2)在定義TSR時(shí),系統(tǒng)安全架構(gòu)應(yīng)已明確,TSR能夠分解至具體軟硬件實(shí)現(xiàn);
3)軟件安全需求SSR的描述原則與TSR相似,需分配到具體的軟件組件,并完整描述功能鏈路。
Q
TSR和系統(tǒng)需求(aspice語(yǔ)境下是描述系統(tǒng)的黑盒需求)不是一個(gè)層級(jí),TSR更適合放在系統(tǒng)架構(gòu)設(shè)計(jì)里?SSR也更適合放在軟件架構(gòu)設(shè)計(jì)里?
A
可以將TSR視為系統(tǒng)架構(gòu)級(jí)需求,SSR視為軟件架構(gòu)級(jí)需求。通過(guò)明確的TSR和SSR,可充分描述各功能安全鏈路,并組合形成系統(tǒng)和軟件的完整安全架構(gòu)設(shè)計(jì)。
Q
在實(shí)際開(kāi)發(fā)過(guò)程中,系統(tǒng)需求應(yīng)該去承接所有的客戶(hù)需求(包含F(xiàn)SR?),如果TSR認(rèn)為和系統(tǒng)架構(gòu)是一個(gè)層級(jí),那TSR和系統(tǒng)需求是什么關(guān)系呢?它向上追溯怎么做呢?
A
1)系統(tǒng)需求承接客戶(hù)所有需求(包括FSR);
2)TSR和系統(tǒng)需求同級(jí),前者描述所有系統(tǒng)需求(包括非功能安全、結(jié)構(gòu)要求、性能要求等),后者偏功能安全描述;
3)兩者共同構(gòu)成產(chǎn)品全部需求;
4)TSR上溯源自FSR,系統(tǒng)需求上溯源自客戶(hù)原始需求。
Q
怎么區(qū)分一個(gè)需求是FSR還是TSR,結(jié)合例子描述。
A
FSR和TSR的區(qū)分:
1)FSR更多從功能角度,側(cè)重整車(chē)item層面,如防止非預(yù)期加速;
2)TSR更關(guān)注具體的功能安全要求,如(為了防止非預(yù)期加速)對(duì)輸出加速信號(hào)進(jìn)行E2E校驗(yàn)和輸出合理性檢擦等,關(guān)注使用何種安全機(jī)制等;
3)FSR的描述層級(jí)更高,側(cè)重整車(chē)功能,TSR的顆粒度更細(xì),側(cè)重具體實(shí)現(xiàn)。
關(guān)于芯片/IC安全機(jī)制設(shè)計(jì)的相關(guān)問(wèn)題
Q
IC設(shè)計(jì)中哪些電源和時(shí)鐘是要監(jiān)控的,時(shí)鐘會(huì)有很多分頻或分支出來(lái),在使用前都要監(jiān)控嗎?
A
在IC設(shè)計(jì)中,需要監(jiān)控的電源包括:
1)通常采用帶ASIL等級(jí)的PMIC或SBC進(jìn)行電壓/電流監(jiān)測(cè);
2)傳統(tǒng)設(shè)計(jì)中可能使用DCDC+比較器監(jiān)測(cè)電壓,但無(wú)法監(jiān)測(cè)電流;
3)外部振蕩器可利用芯片內(nèi)置的安全機(jī)制進(jìn)行監(jiān)控;
4)芯片內(nèi)部時(shí)鐘樹(shù)分支后,各個(gè)域可能有專(zhuān)門(mén)的PLL監(jiān)測(cè)機(jī)制,具體取決于芯片安全機(jī)制。
同時(shí)對(duì)于IC內(nèi)部電源和時(shí)鐘監(jiān)控,設(shè)計(jì)時(shí)需要基于一些假設(shè)前提,如定義安全域。針對(duì)這些域使用的供電和時(shí)鐘,會(huì)有通用的域值檢測(cè)機(jī)制,包括輸入輸出檢測(cè)、配置檢測(cè)等。
Q
芯片內(nèi)部一些常用的Safety Mechanism的Diagnostic Coverage 通常該怎么定義?
A
芯片內(nèi)部安全機(jī)制的診斷覆蓋率DC無(wú)法直接采用ISO 26262中低/中/高的粗粒度定義方式,需要:
1)具體分析被分析對(duì)象的失效模式;
2)結(jié)合可靠性模型定義各失效模式的占比;
3)根據(jù)不同失效模式分配對(duì)應(yīng)的安全機(jī)制;
4)通過(guò)芯片層面的故障注入測(cè)試,驗(yàn)證所有失效模式均被覆蓋。
Q
芯片有300多個(gè)引腳,與該軟件功能相關(guān)只有40~50個(gè),那么其他引腳的失效需要考慮嗎?
A
在進(jìn)行芯片F(xiàn)MEDA計(jì)算時(shí),會(huì)對(duì)與分析對(duì)象無(wú)關(guān)的非安全功能模塊和管腳進(jìn)行裁剪,非安全的管腳不予考慮。
Q
FMEDA中關(guān)于芯片的瞬態(tài)失效一般應(yīng)該怎么處理?
A
針對(duì)芯片瞬態(tài)失效,常見(jiàn)的保護(hù)機(jī)制有:
1)內(nèi)存ECC;
2)鎖步等架構(gòu)設(shè)計(jì);
3)冗余RAM實(shí)時(shí)比對(duì)。
這些措施通常應(yīng)用于高ASIL等級(jí)且檢測(cè)間隔要求很短的場(chǎng)景。在產(chǎn)品級(jí)FMEDA中,個(gè)人建議應(yīng)當(dāng)考慮芯片瞬態(tài)失效的影響。雖然采用針對(duì)性保護(hù)機(jī)制能提供較高DC,但由于瞬態(tài)失效基數(shù)較高,殘余風(fēng)險(xiǎn)仍較可觀。不過(guò),業(yè)內(nèi)通常在采用一定保護(hù)措施后,不會(huì)過(guò)多關(guān)注瞬態(tài)失效問(wèn)題。
關(guān)于安全性分析問(wèn)題
Q
在做FMEDA時(shí),標(biāo)準(zhǔn)中對(duì)于一些影響EMC相關(guān)的失效定義比較模糊,什么時(shí)候需要定義為單點(diǎn),什么時(shí)候定義為潛伏或者安全故障?
A
通常EMC不會(huì)被視為需要在FMEDA中分析的隨機(jī)失效,而是作為系統(tǒng)性失效的一個(gè)要素,在可靠性設(shè)計(jì)時(shí)需要考慮。只有在特定條件下缺少EMC保護(hù)措施時(shí),EMC才可能被定義為單點(diǎn)失效進(jìn)行分析。
舉個(gè)例子,產(chǎn)品在正常的設(shè)計(jì)和使用狀態(tài)下,通常都會(huì)有外殼等保護(hù)措施,能夠防范EMC相關(guān)的靜電放電風(fēng)險(xiǎn)對(duì)敏感元器件造成損害。但是,如果在生產(chǎn)或運(yùn)行過(guò)程中,產(chǎn)品暴露于無(wú)外殼保護(hù)的特殊環(huán)境,那么人員操作或維修時(shí)可能會(huì)導(dǎo)致靜電釋放,對(duì)敏感元器件產(chǎn)生影響,此時(shí)就需要將這種EMC故障視為單點(diǎn)故障進(jìn)行分析。不過(guò),在產(chǎn)品設(shè)計(jì)階段,通常已經(jīng)充分考慮了這一風(fēng)險(xiǎn)。比如,通過(guò)EMC可靠性測(cè)試和系統(tǒng)測(cè)試,驗(yàn)證了產(chǎn)品在特殊環(huán)境下的穩(wěn)定性能;同時(shí),對(duì)于電氣敏感元件也采取了外殼、封裝等保護(hù)措施。因此,在正常的設(shè)計(jì)和使用條件下,EMC相關(guān)的故障極少被視為單點(diǎn)故障進(jìn)行分析。
Q
FMEDA分析的時(shí)候,會(huì)有DC的概念,ISO內(nèi)給了一部分的參考值。比如ECC,Parity。對(duì)于ISO沒(méi)給的特殊的SM,通常如何判斷其DC?比如,部分IP的故障模式可以被NOC的Timeout檢測(cè)到,這個(gè)SM的DC該如何定義?
A
對(duì)于標(biāo)準(zhǔn)中未給出參考值的特殊安全機(jī)制,判斷其DC的依據(jù)如下:
1)標(biāo)準(zhǔn)已涵蓋80%常見(jiàn)器件失效模式,對(duì)芯片等新型器件也有所補(bǔ)充;
2)可根據(jù)器件功能定義分析潛在失效模式,采用失效模式占比平均分配的方法初步評(píng)估DC;
3)對(duì)自定義的檢測(cè)方法,需從被檢測(cè)對(duì)象的失效模式出發(fā),分析所使用的安全機(jī)制能覆蓋哪些失效模式,可通過(guò)故障注入測(cè)試驗(yàn)證機(jī)制有效性;
4)對(duì)于難以合理分配的失效模式,需結(jié)合可靠性模型進(jìn)行定性定義,同時(shí)缺乏標(biāo)準(zhǔn)支持。
關(guān)于軟件失效分析問(wèn)題
Q
軟件分析中對(duì)于軟件的失效(不考慮硬件)是都可以通過(guò)流程措施來(lái)解決軟件失效,還是必須增加實(shí)時(shí)運(yùn)行的檢測(cè)機(jī)制來(lái)監(jiān)控軟件(如程序流監(jiān)控)?如果有的需要有的不需要,是什么依據(jù)來(lái)判斷的?
A
功能安全相關(guān)軟件的失效模式分為兩個(gè)方面:系統(tǒng)性失效和隨機(jī)失效。系統(tǒng)性失效如設(shè)計(jì)缺陷、編碼錯(cuò)誤等,可以通過(guò)改進(jìn)流程、規(guī)范編碼習(xí)慣等措施來(lái)解決。隨機(jī)失效如受EMI干擾、硬件故障影響等,則需要采取諸如程序優(yōu)先級(jí)分配、程序流監(jiān)控、數(shù)據(jù)端到端保護(hù)等技術(shù)手段。因此,針對(duì)不同的軟件失效模式,需要采取流程措施和技術(shù)手段相結(jié)合的方式。
Q
DFMEA和FMEA的區(qū)別
A
DFMEA考慮維度更廣,不僅包括安全相關(guān)器件的隨機(jī)故障,還包括非安全器件對(duì)性能的影響、制造過(guò)程問(wèn)題等。而FMEA則專(zhuān)注于安全相關(guān)器件的隨機(jī)故障模式分析,并提出相應(yīng)的安全機(jī)制和診斷覆蓋率,用于量化殘余風(fēng)險(xiǎn)。在功能安全項(xiàng)目中,系統(tǒng)階段需要同時(shí)開(kāi)展FMEA(分析隨機(jī)故障)、故障樹(shù)分析等,也需要DFMEA分析,兩者是互補(bǔ)而不沖突的。
其他問(wèn)題
Q
關(guān)于硬件要素評(píng)估,3類(lèi)要素除了做分析評(píng)估和測(cè)試以外,標(biāo)準(zhǔn)上還說(shuō)要有措施來(lái)證明系統(tǒng)性失效足夠低,現(xiàn)在主要有哪些比較認(rèn)可的措施?
A
對(duì)于三類(lèi)硬件元件(ASIL C等級(jí)),通常不會(huì)單獨(dú)分配安全機(jī)制,而是通過(guò)其他措施來(lái)證明其系統(tǒng)性失效足夠低。目前較為認(rèn)可的措施是“經(jīng)證實(shí)使用”(Proven in Use),即通過(guò)大量實(shí)踐使用和測(cè)試來(lái)證明元件的可靠性。但這種方式的置信度相對(duì)較低。硬件組件鑒定活動(dòng)通常采用“經(jīng)證實(shí)使用”方法,如果一個(gè)元件在多款A(yù)SIL B級(jí)產(chǎn)品中使用并證明了相關(guān)可靠性,則可被視為滿(mǎn)足ASIL B級(jí)使用要求,但不等于通過(guò)ASIL B級(jí)認(rèn)證。目前無(wú)統(tǒng)一量化標(biāo)準(zhǔn)規(guī)定“經(jīng)證實(shí)使用”的具體條件,大多數(shù)公司在這方面較為保守,認(rèn)為這種方式最多只能達(dá)到ASIL B級(jí),要更高級(jí)別還需要完整的分析評(píng)估過(guò)程。
-
新能源
+關(guān)注
關(guān)注
27文章
6755瀏覽量
114251 -
智能駕駛
+關(guān)注
關(guān)注
5文章
3007瀏覽量
51274 -
功能安全
+關(guān)注
關(guān)注
2文章
199瀏覽量
6184
發(fā)布評(píng)論請(qǐng)先 登錄
模擬電子疑難問(wèn)題解惑系列(二):模擬電路設(shè)計(jì)問(wèn)題須知
使用匯編知識(shí)排查疑難問(wèn)題的方法
TI資深工程師對(duì)無(wú)線連接技術(shù)經(jīng)驗(yàn)匯總、常見(jiàn)疑難問(wèn)題詳細(xì)解答
飛控疑難雜癥解決方法匯總
飛控中的疑難問(wèn)題分享
視頻會(huì)議系統(tǒng)中常見(jiàn)的疑難問(wèn)題解答
電腦入門(mén)與提高疑難排解大全
模擬電子疑難問(wèn)題解惑系列(三):成為熟練的電子工程師
模擬電子疑難問(wèn)題解惑系列(四):濾波器、振蕩器
關(guān)于高速AD/DAC測(cè)量及設(shè)計(jì)中82個(gè)疑難問(wèn)題的解答
干貨分享 | 功能安全常見(jiàn)疑難問(wèn)題匯總
評(píng)論