91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三種方法突破人工智能魯棒性極限

ml8z_IV_Technol ? 來源:YXQ ? 作者:電子發(fā)燒友 ? 2019-05-30 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,DeepMind在其博客中向我們描述了三種可以嚴格識別和消除學(xué)習(xí)預(yù)測模型中的錯誤的方法:對抗性測試,魯棒學(xué)習(xí)和形式驗證。

自計算機編程開始以來,Bug與軟件就齊頭并進。

隨著時間的推移,軟件開發(fā)人員在部署之前已經(jīng)建立了一套測試和調(diào)試的最佳實踐,但這些實踐并不適合現(xiàn)代深度學(xué)習(xí)系統(tǒng)。

今天,機器學(xué)習(xí)的主流實踐是在訓(xùn)練數(shù)據(jù)集上訓(xùn)練系統(tǒng),然后在另一組上進行測試。雖然這揭示了模型在一般情況下的平均性能,但即使在最壞的情況下,確保模型的穩(wěn)健性或可接受的高性能也是至關(guān)重要的。

近期,DeepMind在其博客中向我們描述了三種可以嚴格識別和消除學(xué)習(xí)預(yù)測模型中的錯誤的方法:對抗性測試,魯棒學(xué)習(xí)和形式驗證。

以下是博文內(nèi)容:

機器學(xué)習(xí)系統(tǒng)一般是不穩(wěn)健的。即使在特定領(lǐng)域中表現(xiàn)優(yōu)于人類的系統(tǒng),如果引入細微差異,也可能無法解決簡單問題。例如圖像擾動的問題:如果在輸入圖像中添加少量精心計算的噪聲,那么對圖像進行分類的神經(jīng)網(wǎng)絡(luò),就會容易將樹懶誤認為是賽車。

覆蓋在典型圖像上的對抗性輸入可能導(dǎo)致分類器將樹懶錯誤地分類為賽車。兩個圖像在每個像素中相差至多0.0078。第一種被歸類為三趾樹懶,置信度> 99%。第二個被歸類為賽車,概率> 99%。

這不是一個新問題。計算機程序總是有bug。幾十年來,軟件工程師開發(fā)了許多令人印象深刻的技術(shù)工具包,從單元測試到形式驗證。這些方法在傳統(tǒng)軟件上運行良好,但是由于這些模型的規(guī)模和缺乏結(jié)構(gòu)性(可能包含數(shù)億個參數(shù)),因此采用傳統(tǒng)方法來嚴格測試神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)模型非常困難。所以需要開發(fā)用于確保機器學(xué)習(xí)系統(tǒng)在部署時穩(wěn)健的新方法。

程序員的角度來看,Bug是指與系統(tǒng)規(guī)范(即預(yù)期功能)不一致的任何行為。DeepMInd對用于評估機器學(xué)習(xí)系統(tǒng)是否與訓(xùn)練集和測試集一致的技術(shù),以及描述系統(tǒng)的期望屬性的規(guī)范列表的技術(shù)進行了研究。這些屬性包括:對輸入中足夠小的擾動的魯棒性,避免災(zāi)難性故障的安全約束,或產(chǎn)生符合物理定律的預(yù)測能力等。

在本文中,我們將討論機器學(xué)習(xí)社區(qū)面臨的三個重要技術(shù)挑戰(zhàn),因為我們共同致力于嚴格開發(fā)和部署與所需規(guī)格可靠一致的機器學(xué)習(xí)系統(tǒng):

測試一致性與規(guī)范有效性。我們探索有效的方法來測試機器學(xué)習(xí)系統(tǒng)是否與設(shè)計者和系統(tǒng)用戶所期望的屬性(例如不變性或魯棒性)一致。揭示模型可能與期望行為不一致的情況的一種方法是在評估期間系統(tǒng)地搜索最壞情況的結(jié)果。

訓(xùn)練機器學(xué)習(xí)模型,使其產(chǎn)生規(guī)范一致的預(yù)測。即使有大量的訓(xùn)練數(shù)據(jù),標準的機器學(xué)習(xí)算法也可以產(chǎn)生與魯棒或公平等理想規(guī)范不一致的模型,這要求我們重新考慮訓(xùn)練算法,這些算法不僅要能夠很好地擬合訓(xùn)練數(shù)據(jù),而且能夠與規(guī)范清單保持一致。

正式證明機器學(xué)習(xí)模型是規(guī)范一致的。需要能夠驗證模型預(yù)測可證明與所有可能輸入的感興趣的規(guī)范一致的算法。雖然形式驗證領(lǐng)域幾十年來一直在研究這種算法,但這些方法雖然取得了令人矚目的進展,但卻不能輕易地擴展到現(xiàn)代深度學(xué)習(xí)系統(tǒng)。

測試與規(guī)范性一致性

對抗性實例的穩(wěn)健性是深度學(xué)習(xí)中相對研究充分的問題。這項工作的一個主要主題是評估強攻擊的重要性,以及設(shè)計可以有效分析的透明模型。與社區(qū)的其他研究人員一起,我們發(fā)現(xiàn)許多模型在與弱對手進行評估時看起來很穩(wěn)健。然而,當針對更強的對手進行評估時,精度幾乎為0。

雖然大多數(shù)工作都在監(jiān)督學(xué)習(xí)(主要是圖像分類)的情景下的很少失敗,但是需要將這些想法擴展到其他情景。

在最近關(guān)于發(fā)現(xiàn)災(zāi)難性故障的對抗方法的工作中,我們將這些想法應(yīng)用于測試旨在用于安全關(guān)鍵設(shè)置的強化學(xué)習(xí)agent。開發(fā)自治系統(tǒng)的一個挑戰(zhàn)是,由于單個錯誤可能會產(chǎn)生很大的后果,因此非常小的失敗概率都是不可接受的。

我們的目標是設(shè)計一個“對手”,以便我們提前檢測這些故障(例如,在受控環(huán)境中)。如果攻擊者可以有效地識別給定模型的最壞情況輸入,則允許我們在部署模型之前捕獲罕見的故障情況。與圖像分類器一樣,針對弱攻擊進行評估,很容易會在部署期間提供虛假的安全感。

我們?yōu)閺娀瘜W(xué)習(xí)agent的對抗性測試開發(fā)了兩種互補的方法。首先,使用無衍生優(yōu)化來直接最小化agent的預(yù)期回報。然后學(xué)習(xí)一種對抗價值函數(shù),該函數(shù)根據(jù)經(jīng)驗預(yù)測哪種情況最有可能導(dǎo)致agent失敗。再接著,使用此學(xué)習(xí)函數(shù)進行優(yōu)化,將評估重點放在最有問題的輸入上。這些方法構(gòu)成了豐富且不斷增長的潛在算法空間的一小部分,我們對嚴格評估代理的未來發(fā)展感到興奮。

這兩種方法相比隨機測試已經(jīng)有了很大改進。使用我們的方法,可以在幾分鐘內(nèi)檢測到需要花費數(shù)天才能發(fā)現(xiàn)甚至完全未被發(fā)現(xiàn)的故障。我們還發(fā)現(xiàn),對抗性測試可能會發(fā)現(xiàn)agent中與隨機測試集的評估結(jié)果不同的行為。

特別是,使用對抗性環(huán)境構(gòu)造,我們發(fā)現(xiàn)執(zhí)行3D導(dǎo)航任務(wù)的agent一般會與人類級別的性能相匹配,但仍然無法在令人驚訝的簡單迷宮上完全找到目標。我們的工作還強調(diào),我們需要設(shè)計能夠抵御自然故障的系統(tǒng),而不僅僅是針對對手。

使用隨機抽樣,我們幾乎從不觀察具有高失敗概率的地圖,但是對抗性測試表明這樣的地圖確實存在。即使在移除了許多wall之后,這些地圖仍然保留了高失敗概率,從而產(chǎn)生比原始地圖更簡單的地圖。

訓(xùn)練規(guī)范一致的模型

對抗性測試旨在找到違反規(guī)范的反例。因此,它往往會導(dǎo)致高估模型與這些規(guī)范的一致性。在數(shù)學(xué)上,規(guī)范是必須在神經(jīng)網(wǎng)絡(luò)的輸入和輸出之間保持的某種關(guān)系。這可以采用某些鍵輸入和輸出參數(shù)的上限和下限的形式體現(xiàn)。

受此觀察的啟發(fā),一些研究人員,包括我們在DeepMind的團隊,研究了與對抗性測試程序無關(guān)的算法(用于評估與規(guī)范的一致性)。這可以從幾何學(xué)上理解 - 我們可以約束在給定一組輸入的情況下,通過限制輸出空間來最嚴重地違反規(guī)范。如果此界限相對于網(wǎng)絡(luò)參數(shù)是可微分的并且可以快速計算,則可以在訓(xùn)練期間使用它。然后可以通過網(wǎng)絡(luò)的每個層傳播原始邊界框。

結(jié)果證明了區(qū)間界限傳播是快速、有效的,并且與先前的信念相反,可以獲得強有力的結(jié)果。特別是,我們證明它可以降低MNIST和CIFAR-10數(shù)據(jù)集上圖像分類中現(xiàn)有技術(shù)的錯誤率。

展望未來,下一個前沿將是學(xué)習(xí)正確的幾何抽象,以計算更嚴格的輸出空間過度近似值。我們還希望訓(xùn)練網(wǎng)絡(luò)與更復(fù)雜的規(guī)范一致,捕獲理想的行為,例如上面提到的不變性和與物理定律的一致性。

形式驗證

嚴格的測試和訓(xùn)練可以大大有助于構(gòu)建強大的機器學(xué)習(xí)系統(tǒng)。但是,沒有多少測試可以完全保證系統(tǒng)的行為符合我們的要求。在大規(guī)模模型中,由于輸入擾動的選擇特別多(天文數(shù)級別),因此列舉給定輸入集的所有可能輸出(例如,對圖像的無窮小擾動)根本難以處理。但是,與訓(xùn)練的情況一樣,我們可以通過在輸出集上設(shè)置幾何邊界來找到更有效的方法。形式驗證是DeepMind正在進行的研究的主題。

機器學(xué)習(xí)社區(qū)已經(jīng)開發(fā)了幾個關(guān)于如何計算網(wǎng)絡(luò)輸出空間上的精確幾何邊界的有趣想法。我們的方法基于優(yōu)化和二元性,包括將驗證問題轉(zhuǎn)化為優(yōu)化問題。通過在優(yōu)化中使用二元性的思想,該問題變得易于計算。這導(dǎo)致額外的約束,其使用所謂的切割平面來細化由間隔界限傳播計算的邊界框。這種方法雖然合理但不完整:可能存在感興趣的屬性為真的情況,但此算法計算的界限不足以證明該屬性。但是,一旦我們獲得了約束邊界,這將正式保證不會侵犯屬性。下圖以圖形方式說明了該方法。

這種方法使我們能夠?qū)Ⅱ炞C算法的適用性擴展到更一般的網(wǎng)絡(luò)(激活函數(shù),體系結(jié)構(gòu)),更一般性的規(guī)范和更復(fù)雜的深度學(xué)習(xí)模型(生成模型,神經(jīng)過程等)、超越對抗性魯棒性的規(guī)范 。

展望

在高風(fēng)險情況下部署機器學(xué)習(xí)帶來了獨特的挑戰(zhàn),需要做更多的工作來構(gòu)建自動化工具,以確保現(xiàn)實世界中的AI系統(tǒng)能夠做出“正確的事情”。特別是,我們對以下方向的進展感到興奮:

學(xué)習(xí)對抗性評估和驗證:隨著AI系統(tǒng)的擴展和復(fù)雜性提高,設(shè)計適合AI模型的對抗性評估和驗證算法將變得越來越困難。如果我們可以利用AI的強大功能來促進評估和驗證,那么這個過程將大大加快,可實現(xiàn)自拓展。

開發(fā)用于對抗性評估和驗證的公開工具:為AI工程師和從業(yè)者提供易于使用的工具非常重要,這些工具可以在AI系統(tǒng)導(dǎo)致廣泛的負面影響之前闡明其可能的故障模式。這需要一定程度的對抗性評估和驗證算法的標準化。

擴大對抗性示例的范圍:到目前為止,大多數(shù)關(guān)于對抗性示例的工作都集中在對小擾動(通常是圖像)的模型不變性上。這為開發(fā)對抗性評估,強大學(xué)習(xí)和驗證方法提供了極好的測試平臺。我們已經(jīng)開始探索與現(xiàn)實世界直接相關(guān)的屬性的替代規(guī)范,并對未來在這方面的研究感到興奮。

學(xué)習(xí)規(guī)范:在AI系統(tǒng)中捕獲“正確”行為的規(guī)范通常難以精確陳述。當我們構(gòu)建能夠展示復(fù)雜行為并在非結(jié)構(gòu)化環(huán)境中行動的越來越智能的agent時,將需要構(gòu)建可以使用部分人類規(guī)范并從評估反饋中學(xué)習(xí)進一步規(guī)范的系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編程
    +關(guān)注

    關(guān)注

    90

    文章

    3716

    瀏覽量

    97191
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265403

原文標題:DeepMind:三種方法突破AI魯棒性極限

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?123次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    瞻芯電子G2 650V SiC MOSFET的驗證試驗

    瞻芯電子(IVCT)基于經(jīng)典壽命模型,對大樣本量的第二代(G2)650V SiC MOSFET 進行了驗證試驗(Robustness-Validation)。該試驗嚴格遵循AEC-Q101
    的頭像 發(fā)表于 12-18 16:35 ?6519次閱讀
    瞻芯電子G2 650V SiC MOSFET的<b class='flag-5'>魯</b><b class='flag-5'>棒</b><b class='flag-5'>性</b>驗證試驗

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    我們所有的 SoC 都能用于邊緣人工智能。例子包括: 預(yù)測維護和樓宇自動化系統(tǒng) 在每個節(jié)點上進行本地數(shù)據(jù)分析的智能傳感器網(wǎng)絡(luò) 遙控器和可穿戴設(shè)備的動作和手勢識別 用于智能健康可穿戴設(shè)
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對“人工智能+”這個名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時代的第波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大
    的頭像 發(fā)表于 08-27 13:21 ?726次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    ,技術(shù)自主可控 在如今這個科技競爭激烈的時代,國產(chǎn)化硬件的重要不言而喻。比鄰星人工智能綜合實驗箱就做到了這一點,采用國產(chǎn)化硬件,積極推進全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國產(chǎn)化進程,把國產(chǎn)自主可控的軟硬件平臺
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    ,技術(shù)自主可控 在如今這個科技競爭激烈的時代,國產(chǎn)化硬件的重要不言而喻。比鄰星人工智能綜合實驗箱就做到了這一點,采用國產(chǎn)化硬件,積極推進全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國產(chǎn)化進程,把國產(chǎn)自主可控的軟硬件平臺
    發(fā)表于 08-07 14:23

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    墨芯人工智能入選中國戰(zhàn)略新興產(chǎn)業(yè)典型案例

    近日,墨芯人工智能科技(深圳)有限公司(以下簡稱"墨芯人工智能"或“墨芯”)入選國家發(fā)改委《中國戰(zhàn)略新興產(chǎn)業(yè)典型案例》,成為新一代人工智能領(lǐng)域具有代表
    的頭像 發(fā)表于 06-13 14:53 ?1960次閱讀

    如何構(gòu)建邊緣人工智能基礎(chǔ)設(shè)施

    隨著人工智能的不斷發(fā)展,其爭議也越來越大;而在企業(yè)和消費者的眼中,人工智能價值顯著。如同許多新興科技一樣,目前人工智能的應(yīng)用主要聚焦于大規(guī)模、基礎(chǔ)設(shè)施密集且高功耗的領(lǐng)域。然而,隨著
    的頭像 發(fā)表于 06-09 09:48 ?1072次閱讀

    合金在線直線度測量儀 告別繁瑣人工 擁抱智能監(jiān)測!

    適用于任何材質(zhì)。 傳統(tǒng)直線度監(jiān)測的痛點,您是否深有體會? 在傳統(tǒng)的合金管材的生產(chǎn)中,直線度品質(zhì)的監(jiān)測,依賴人工取樣、直尺重力等方法,不僅耗時費力,且難以實現(xiàn)全程精準控制: ? 取樣頻率低,無法實時掌握
    發(fā)表于 06-03 15:56

    邊緣計算如何顛覆人工智能變革

    2025年以來,DeepSeek發(fā)布的大模型熱度居高不下,再次點燃了全球?qū)?b class='flag-5'>人工智能的無限熱情。深度學(xué)習(xí)模型以指數(shù)級速度膨脹,性能不斷突破極限,成本效益也在向著更低的趨勢發(fā)展,這為各行各業(yè)帶來了顛覆
    的頭像 發(fā)表于 05-30 09:29 ?1036次閱讀

    精選好文!噪聲系數(shù)測量的三種方法

    器件噪聲系數(shù)的三種方法。每種方法都有其優(yōu)缺點,適用于特定的應(yīng)用。下表是三種方法優(yōu)缺點的總結(jié)。理論上,同一個射頻器件的測量結(jié)果應(yīng)該一樣,但是由于射頻設(shè)備的限制(可用、精度、頻率范圍、噪
    發(fā)表于 05-07 10:18

    教育部增設(shè)29本科新專業(yè) 本科增設(shè)人工智能教育專業(yè)

    人工智能產(chǎn)業(yè)人才從哪里來?高校培養(yǎng)怎么更進一步?我們看見教育部增設(shè)29本科新專業(yè);人工智能教育專業(yè)在列。 教育部增設(shè)29本科新專業(yè)? ? ?本科增設(shè)
    的頭像 發(fā)表于 04-23 17:00 ?924次閱讀

    Ampere如何引領(lǐng)并塑造下一代人工智能計算系統(tǒng)

    現(xiàn)代人工智能計算工作負載給傳統(tǒng)處理器架構(gòu)帶來了前所未有的挑戰(zhàn),已將其推向了極限
    的頭像 發(fā)表于 04-07 10:15 ?1096次閱讀