91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片的可靠性對終端應(yīng)用有何影響

lPCU_elecfans ? 來源:電子發(fā)燒友網(wǎng) ? 作者:電子發(fā)燒友網(wǎng) ? 2022-04-26 08:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))當(dāng)我們談及AI芯片,腦海中不免都會(huì)想起TOPS、L4/L5自動(dòng)駕駛、圖像識別和處理算法等詞。但在初創(chuàng)企業(yè)、芯片大廠紛紛追逐“AI熱“的情況下,芯片的可靠性成了一個(gè)大問題,甚至對終端應(yīng)用也有較大的影響。

自動(dòng)駕駛故障,不止OEM要擔(dān)責(zé)

經(jīng)常關(guān)注汽車新聞的讀者想必都很清楚,近年來因?yàn)樽詣?dòng)/輔助駕駛引發(fā)的事故越來越多,起因多種多樣,但很少會(huì)將其追溯到芯片上。有的車企為了追求快速上市,其AI芯片很可能只有AEC-Q100認(rèn)證,而沒有ISO 26262這樣的功能安全認(rèn)證,在他們看來這些標(biāo)準(zhǔn)太過“傳統(tǒng)”了,對于產(chǎn)品的創(chuàng)新流程來說有些多余了。

這在消費(fèi)者眼里也是如此,我們對功能的感知是最為直觀的,而對故障的感知只要在接受范圍來就好。這就使得此類車廠可以以一種“手機(jī)APP”開發(fā)式的模式運(yùn)作,實(shí)現(xiàn)快速迭代。然而,這并不代表功能安全可以被忽視,畢竟當(dāng)壞事落在自己頭上時(shí),總得要個(gè)說法吧。

在實(shí)現(xiàn)功能安全的過程中,從提出要求、架構(gòu)、設(shè)計(jì)、編程到測試階段,都有對應(yīng)的確認(rèn)與驗(yàn)證工作,然而通過驗(yàn)證是一回事,能否實(shí)現(xiàn)追溯就是另一回事了。比如設(shè)計(jì)上的改動(dòng)可能會(huì)違背芯片要求等等,最終導(dǎo)致實(shí)際性能不符等問題,所以在功能安全開發(fā)設(shè)計(jì)和認(rèn)證的過程中,必須要做到可追溯。

IP廠商Arteris提出了一個(gè)追溯方案名為Harmony Trace,幫助芯片廠商更好地實(shí)現(xiàn)功能安全。Harmony Trace在這些分散的流程系統(tǒng)之間創(chuàng)造了一層整合系統(tǒng),用于追蹤半導(dǎo)體產(chǎn)品壽命周期中的所有失誤。一旦違反芯片要求的錯(cuò)誤出現(xiàn),這套系統(tǒng)就會(huì)通知工程師這項(xiàng)改動(dòng)需要進(jìn)行檢查,從而自動(dòng)化車規(guī)認(rèn)證的審查流程。當(dāng)然了,芯片開發(fā)廠商所用的開發(fā)工具流都是不盡相同的,所以Harmony Trace也提供了對現(xiàn)有主流EDA工具、認(rèn)證流程的支持。

在自動(dòng)駕駛安全標(biāo)準(zhǔn)繼續(xù)演進(jìn),ISO 21448和UL4600等標(biāo)準(zhǔn)提出的額外要求下,在AI芯片設(shè)計(jì)中保證可追溯性或許是縮短產(chǎn)品開發(fā)認(rèn)證周期的一條捷徑。

可靠性第一

事實(shí)證明,不止自動(dòng)駕駛領(lǐng)域,云端同樣需要可靠的AI計(jì)算芯片。我們從現(xiàn)在的云端計(jì)算集群來看,多個(gè)節(jié)點(diǎn)為云服務(wù)提供了強(qiáng)大的計(jì)算能力,但正是因?yàn)檫@般復(fù)雜的架構(gòu),每一個(gè)節(jié)點(diǎn)都有可能成為整個(gè)系統(tǒng)的阿喀琉斯之踵。

這樣的案例我們也見多了,甚至開始影響到我們的生活,熱搜上時(shí)不時(shí)就會(huì)冒出“某某應(yīng)用崩了”的消息,互聯(lián)網(wǎng)公司經(jīng)受的服務(wù)器故障可謂數(shù)不勝數(shù),而且苦于定位故障來源,這其中,芯片也脫離不了干系。

造成這些后果的芯片可靠性問題主要有三種,早期失效(ELF)和正常設(shè)備運(yùn)行下的隨機(jī)失效,還有不可避免的設(shè)備老化。芯片都是有著工作壽命的,所以最后一項(xiàng)難以從設(shè)計(jì)上解決,最多盡可能延長其壽命,而前面兩者才是當(dāng)下云端需要提防的問題。

常見的早期失效有閘極氧化層失效、老化效果不好和軟擊穿等,隨機(jī)失效很多與運(yùn)行環(huán)境有關(guān),比如溫度過高、輻射過高等等。

為了進(jìn)一步讓AI芯片免受這些可靠性問題的影響,初創(chuàng)公司Ceremophic公布了自己研發(fā)的QS1芯片。這是一款基于5nm工藝的分層學(xué)習(xí)芯片,集成了2GHz自定義機(jī)器學(xué)習(xí)處理器、2GHz的自定義FPU處理機(jī)器學(xué)習(xí)計(jì)算,還有一個(gè)基于ThreadArch的RISC-V處理器和ARM Cortex-M55應(yīng)用處理器,Ceremophic稱后者主要用于元宇宙相關(guān)應(yīng)用的視頻處理。在接口方面,該芯片支持到x16 PCIe 6.0/CXL 3.0。

那么這款芯片在可靠性上的亮點(diǎn)又有哪些呢?Ceremophic稱對于早期失效而言,他們選用了高效的ASIC實(shí)現(xiàn)方式來使用抗ELF的邏輯庫,在正確的邏輯單元組合下以最小的設(shè)計(jì)開銷做到低ELF。

而在面對隨機(jī)失效上,Ceremophic用到了自己的多線程技術(shù),利用兩個(gè)多線程處理器運(yùn)行同一程序,一旦檢測到錯(cuò)誤,就會(huì)利用多個(gè)結(jié)果來做出表決,并進(jìn)行修正,接著程序執(zhí)行會(huì)直接從檢測到錯(cuò)誤發(fā)生的地方開始運(yùn)行,而不是一個(gè)未知的安全起始點(diǎn),消耗更多的功耗。

在傳統(tǒng)的高可靠性設(shè)計(jì)中,往往都得采用高成本的解決方案,比如冗余,就像是需要在兩個(gè)地方做同一件事,帶來計(jì)算資源和功耗的雙重增加。不僅如此,解決方式也需要消耗更多的運(yùn)行周期,這也是為何云端服務(wù)器出現(xiàn)故障后,不能快速恢復(fù)的原因。

原文標(biāo)題:AI芯片不只拼算力,還得看可不可靠

文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 可靠性
    +關(guān)注

    關(guān)注

    4

    文章

    281

    瀏覽量

    27611
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14897

    瀏覽量

    180167
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2133

    瀏覽量

    36804

原文標(biāo)題:AI芯片不只拼算力,還得看可不可靠

文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    什么是高可靠性?

    一、什么是可靠性可靠性指的是“可信賴的”、“可信任的”,是指產(chǎn)品在規(guī)定的條件下和規(guī)定的時(shí)間內(nèi),完成規(guī)定功能的能力。對于終端產(chǎn)品而言,可靠度越高,使用保障就越高。 PCB
    發(fā)表于 01-29 14:49

    芯片可靠性面臨哪些挑戰(zhàn)

    芯片可靠性是一門研究芯片如何在規(guī)定的時(shí)間和環(huán)境條件下保持正常功能的科學(xué)。它關(guān)注的核心不是芯片能否工作,而是能在高溫、高電壓、持續(xù)運(yùn)行等壓力下穩(wěn)定工作多久。隨著晶體管尺寸進(jìn)入納米級別,
    的頭像 發(fā)表于 01-20 15:32 ?337次閱讀
    <b class='flag-5'>芯片</b><b class='flag-5'>可靠性</b>面臨哪些挑戰(zhàn)

    芯片可靠性(RE)性能測試與失效機(jī)理分析

    2025年9月,國家市場監(jiān)督管理總局發(fā)布了六項(xiàng)半導(dǎo)體可靠性測試國家標(biāo)準(zhǔn),為中國芯片產(chǎn)業(yè)的質(zhì)量基石奠定了技術(shù)規(guī)范。在全球芯片競爭進(jìn)入白熱化的今天,可靠性已成為衡量半導(dǎo)體產(chǎn)品核心價(jià)值的關(guān)鍵
    的頭像 發(fā)表于 01-09 10:02 ?859次閱讀
    <b class='flag-5'>芯片</b><b class='flag-5'>可靠性</b>(RE)性能測試與失效機(jī)理分析

    如何測試單片機(jī)MCU系統(tǒng)的可靠性

    用什么方法來測試單片機(jī)系統(tǒng)的可靠性,當(dāng)一個(gè)單片機(jī)系統(tǒng)設(shè)計(jì)完成,對于不同的單片機(jī)系統(tǒng)產(chǎn)品會(huì)有不同的測試項(xiàng)目和方法,但是一些是必須測試的。 下面分享我的一些經(jīng)驗(yàn): 1、測試單片機(jī)軟件功能的完善
    發(fā)表于 01-08 07:50

    國產(chǎn)AI芯片沖至160億美元:狂歡下的“可靠性”大考

    國產(chǎn)AI芯片年銷售額達(dá)160億美元,標(biāo)志著設(shè)計(jì)環(huán)節(jié)實(shí)現(xiàn)突破,但商業(yè)落地的核心考驗(yàn)已轉(zhuǎn)向可靠性。AI芯片因高算力、高功耗特性,面臨電源與時(shí)鐘穩(wěn)
    的頭像 發(fā)表于 12-11 15:33 ?347次閱讀

    漢思新材料:芯片底部填充膠可靠性哪些檢測要求

    芯片底部填充膠可靠性哪些檢測要求?芯片底部填充膠(Underfill)在先進(jìn)封裝(如FlipChip、CSP、2.5D/3DIC等)中起著至關(guān)重要的作用,主要用于緩解焊點(diǎn)因熱膨脹系數(shù)
    的頭像 發(fā)表于 11-21 11:26 ?500次閱讀
    漢思新材料:<b class='flag-5'>芯片</b>底部填充膠<b class='flag-5'>可靠性</b><b class='flag-5'>有</b>哪些檢測要求

    車規(guī)級與消費(fèi)級芯片可靠性、安全與成本差異

    引言在汽車電子和消費(fèi)電子領(lǐng)域,"車規(guī)級"與"消費(fèi)級"芯片代表了兩種截然不同的設(shè)計(jì)理念和技術(shù)標(biāo)準(zhǔn)。車規(guī)級芯片專為汽車應(yīng)用設(shè)計(jì),強(qiáng)調(diào)在極端環(huán)境下的可靠性和安全
    的頭像 發(fā)表于 11-18 17:27 ?1308次閱讀
    車規(guī)級與消費(fèi)級<b class='flag-5'>芯片</b>的<b class='flag-5'>可靠性</b>、安全<b class='flag-5'>性</b>與成本差異

    材料選擇對PCB可靠性具體影響?

    材料選擇對PCB可靠性的具體影響主要體現(xiàn)在以下方面: 1. 基材性能匹配 FR-4基材的玻璃化轉(zhuǎn)變溫度(Tg)需≥130℃才能滿足汽車電子長期高溫需求,而高頻電路需選用介電常數(shù)(Dk) 2. 銅箔
    的頭像 發(fā)表于 10-27 14:07 ?359次閱讀

    可靠性設(shè)計(jì)的十個(gè)重點(diǎn)

    專注于光電半導(dǎo)體芯片與器件可靠性領(lǐng)域的科研檢測機(jī)構(gòu),能夠?qū)ED、激光器、功率器件等關(guān)鍵部件進(jìn)行嚴(yán)格的檢測,致力于為客戶提供高質(zhì)量的測試服務(wù),為光電產(chǎn)品在各種高可靠性場景中的穩(wěn)定應(yīng)用提供堅(jiān)實(shí)的質(zhì)量
    的頭像 發(fā)表于 08-01 22:55 ?1071次閱讀
    <b class='flag-5'>可靠性</b>設(shè)計(jì)的十個(gè)重點(diǎn)

    請問49通道的觸摸芯片CMS32F759/737可靠性怎么檢測的?

    請問49通道的觸摸芯片CMS32F759/737可靠性怎么檢測的?
    發(fā)表于 07-30 16:33

    電子元器件可靠性檢測項(xiàng)目哪些?

    在電子信息技術(shù)飛速發(fā)展的今天,從日常使用的智能終端到關(guān)乎國計(jì)民生的關(guān)鍵設(shè)備,電子元器件的可靠性直接決定著整個(gè)系統(tǒng)的穩(wěn)定性與安全。北京沃華慧通測控技術(shù)有限公司深耕電子測試測量領(lǐng)域多年,憑借深厚的技術(shù)
    的頭像 發(fā)表于 05-14 11:44 ?975次閱讀
    電子元器件<b class='flag-5'>可靠性</b>檢測項(xiàng)目<b class='flag-5'>有</b>哪些?

    提供半導(dǎo)體工藝可靠性測試-WLR晶圓可靠性測試

    隨著半導(dǎo)體工藝復(fù)雜度提升,可靠性要求與測試成本及時(shí)間之間的矛盾日益凸顯。晶圓級可靠性(Wafer Level Reliability, WLR)技術(shù)通過直接在未封裝晶圓上施加加速應(yīng)力,實(shí)現(xiàn)快速
    發(fā)表于 05-07 20:34

    電機(jī)微機(jī)控制系統(tǒng)可靠性分析

    可靠性是電機(jī)微機(jī)控制系統(tǒng)的重要指標(biāo),延長電機(jī)平均故障間隔時(shí)間(MTBF),縮短平均修復(fù)時(shí)間(MTTR)是可靠性研究的目標(biāo)。電機(jī)微機(jī)控制系統(tǒng)的故障分為硬件故障和軟件故障,分析故障的性質(zhì)和產(chǎn)生原因,
    發(fā)表于 04-29 16:14

    IGBT的應(yīng)用可靠性與失效分析

    包括器件固有可靠性和使用可靠性。固有可靠性問題包括安全工作區(qū)、閂鎖效應(yīng)、雪崩耐量、短路能力及功耗等,使用可靠性問題包括并聯(lián)均流、軟關(guān)斷、電磁干擾及散熱等。
    的頭像 發(fā)表于 04-25 09:38 ?3178次閱讀
    IGBT的應(yīng)用<b class='flag-5'>可靠性</b>與失效分析

    非易失性存儲(chǔ)器芯片可靠性測試要求

    非易失性存儲(chǔ)器(NVM)芯片廣泛應(yīng)用于各種設(shè)備中,從智能手機(jī)、個(gè)人電腦到服務(wù)器和工業(yè)控制系統(tǒng),都是不可或缺的關(guān)鍵組件,它們不僅提高了數(shù)據(jù)的安全可靠性,還極大地增強(qiáng)了系統(tǒng)的整體性能。此外,為了滿足
    的頭像 發(fā)表于 04-10 14:02 ?1739次閱讀