黄色三级视频网站在线观看,欧美成人A片丁香五月天,av色区一起AV操操网

傳統(tǒng)的軟件測試和debug方法很難適用于現(xiàn)代的機器學(xué)習(xí)系統(tǒng)，DeepMind希望解決這一問題，開發(fā)面向預(yù)測模型的可靠驗證工具。這篇博客描述了能嚴格識別并排除學(xué)習(xí)預(yù)測模型中的錯誤的三種方法：對抗性測試，穩(wěn)健性學(xué)習(xí)和形式驗證。

自計算機編程誕生以來，軟件開發(fā)中就一直沒有離開過bug。隨著時間的推移，軟件開發(fā)人員已經(jīng)建立了一套在軟件實際發(fā)布前進行測試和debug的最佳方式，但這些方式并不適合現(xiàn)代的深度學(xué)習(xí)系統(tǒng)。

今天，機器學(xué)習(xí)的主流方法是在訓(xùn)練數(shù)據(jù)集上訓(xùn)練系統(tǒng)，然后在另一組數(shù)據(jù)集上進行測試。即使在最壞的情況下，確保系統(tǒng)穩(wěn)健性或高性能也是至關(guān)重要的。本文描述了能夠嚴格識別并排除學(xué)習(xí)預(yù)測模型中的錯誤的三種方法：對抗性測試，穩(wěn)健性學(xué)習(xí)和形式驗證。

機器學(xué)習(xí)系統(tǒng)一般是不穩(wěn)健的。即使在特定領(lǐng)域中表現(xiàn)優(yōu)于人類的系統(tǒng)，具體情況稍微改變，往往就可能導(dǎo)致無法解決簡單問題。比如圖像擾動的問題：如果在輸入圖像中添加少量精心計算的噪聲，那么本來在圖像分類任務(wù)中表現(xiàn)超過人類的的神經(jīng)網(wǎng)絡(luò)，很容易將一只樹獺錯認成一輛跑車。

在圖片上加上一個對抗性輸入，可能導(dǎo)致分類器將一只樹懶錯誤識別為一輛跑車。兩個圖像在每個像素上的差異最多只有0.0078。結(jié)果第一張被歸類為三趾樹懶，置信度> 99％。第二個被歸類為一輛跑車，概率> 99％。

其實這不是什么新問題。計算機程序總是有bug。幾十年來，軟件工程師開發(fā)了種類繁多的技術(shù)工具包，從單元測試到形式驗證。這些方法在傳統(tǒng)軟件上運行良好，但是由于這些模型的規(guī)模和缺乏結(jié)構(gòu)性（可能包含數(shù)億個參數(shù)），想用這些方法來嚴格測試神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)模型是非常困難的。開發(fā)能夠確保機器學(xué)習(xí)系統(tǒng)在部署時穩(wěn)健性的新方法勢在必行。

從程序員的角度來看，與系統(tǒng)的規(guī)范（即預(yù)期功能）不一致的任何行為都屬于bug。DeepMind不僅評估了機器學(xué)習(xí)系統(tǒng)的技術(shù)是否與訓(xùn)練集和測試集一致，還評估了這些技術(shù)的作用與系統(tǒng)的期望屬性的規(guī)范描述中是否一致。這些屬性可能包括對輸入中足夠小的擾動的穩(wěn)健性，避免災(zāi)難性故障的安全約束，或產(chǎn)生符合物理定律的預(yù)測能力等。

本文討論機器學(xué)習(xí)社區(qū)面臨的三個重要技術(shù)挑戰(zhàn)，因為我們共同致力于嚴格開發(fā)和部署與所需規(guī)格可靠一致的機器學(xué)習(xí)系統(tǒng)：

高效測試實際功能與屬性規(guī)范的一致性。我們探索有效的方法，來測試機器學(xué)習(xí)系統(tǒng)是否與設(shè)計者和系統(tǒng)用戶所期望的屬性相一致。揭示二者差異的一種方法是在評估期間系統(tǒng)地搜索最壞情況下的結(jié)果。

訓(xùn)練機器學(xué)習(xí)模型，使其產(chǎn)生屬性一致的預(yù)測。即使有了大量的訓(xùn)練數(shù)據(jù)，標準的機器學(xué)習(xí)算法也可以產(chǎn)生與理想屬性不一致的預(yù)測模型。這要求我們重新考慮訓(xùn)練算法，這些算法不僅能夠很好地擬合訓(xùn)練數(shù)據(jù)，而且要與屬性列表上的要求保持一致。

正式證明機器學(xué)習(xí)模型是規(guī)范性一致的。雖然形式驗證領(lǐng)域幾十年來一直在研究這種算法，也取得了令人矚目的進展，但很難輕易擴展到現(xiàn)代深度學(xué)習(xí)領(lǐng)域。

測試規(guī)范一致性

面對對抗性實例下的穩(wěn)健性問題，是深度學(xué)習(xí)中研究相對充分的問題。這項工作的一個主要主題是評估模型在強對抗性攻擊下的穩(wěn)健性，以及設(shè)計可有效分析的透明模型。我們發(fā)現(xiàn)許多模型在弱對抗下進行評估時看上去很穩(wěn)健。但遇見針對更強的對抗時，精度幾乎下降為零。

目前大多數(shù)研究都集中在監(jiān)督學(xué)習(xí)（主要是圖像分類）的背景下，但是需要將這些想法擴展到其他條件。在最近關(guān)于對抗災(zāi)難性故障方法的研究中，我們將這些想法用于測試確保關(guān)鍵設(shè)置的強化學(xué)習(xí)智能體上。開發(fā)這類自主系統(tǒng)的挑戰(zhàn)之一是，由于一個錯誤就可能產(chǎn)生嚴重后果，因此即使非常小的失敗概率也是不可接受的。

我們的目標是設(shè)計一個“對手”，能讓我們提前檢測這些故障。與圖像分類器一樣，針對弱攻擊進行評估，很容易產(chǎn)生錯誤的安全感。我們?yōu)閺娀瘜W(xué)習(xí)對抗性測試開發(fā)了兩種互補的方法。首先，使用無衍生優(yōu)化來對智能體的預(yù)期回報進行最小化。接著，學(xué)習(xí)一種對抗值函數(shù)，該函數(shù)根據(jù)經(jīng)驗預(yù)測哪種情況最有可能導(dǎo)致智能體的失敗。然后使用此學(xué)習(xí)函數(shù)進行優(yōu)化，將評估重點放在最有問題的輸入上。這些方法只構(gòu)成了豐富且不斷增長的潛在算法空間的一小部分，我們對能夠?qū)χ悄荏w的未來發(fā)展進行嚴格評估感到興奮。

這兩種方法已經(jīng)比隨機測試產(chǎn)生了很大的改進，可以在幾分鐘內(nèi)檢測到過去需要花費數(shù)天才能發(fā)現(xiàn)（甚至完全無法發(fā)現(xiàn)）的問題。我們還發(fā)現(xiàn)，對抗性測試可能會發(fā)現(xiàn)我們的智能體出現(xiàn)了與隨機測試集的評估結(jié)果性質(zhì)不同的行為。

在對抗性環(huán)境下，我們發(fā)現(xiàn)執(zhí)行3D導(dǎo)航任務(wù)的智能體仍然無法在十分簡單的迷宮中完全找到目標，即使它們在非對抗性環(huán)境下的平均表現(xiàn)已經(jīng)和人類相當。此外，我們需要設(shè)計能夠抵御自然故障的系統(tǒng)。

在隨機抽樣中，我們幾乎從來沒觀察到具有高失敗概率的地圖，但是在對抗性測試下，這樣的地圖確實存在。即使在去掉了許多墻壁之后，智能體在這些地圖下的失敗概率仍然很高。

訓(xùn)練規(guī)范一致性的模型

對抗性測試是為了找到違背規(guī)范的反例。因此往往會高估模型與這些規(guī)范的一致性。在數(shù)學(xué)上，規(guī)范是必須在神經(jīng)網(wǎng)絡(luò)的輸入和輸出之間保持的某種關(guān)系。這種關(guān)系可以通過某些關(guān)鍵輸入和輸出參數(shù)的上限和下限的形式來體現(xiàn)。

受此啟發(fā)，DeepMind的團隊和其他團隊研究了與對抗性測試程序無關(guān)的算法（用于評估規(guī)范一致性。這可以從幾何學(xué)上理解 - 我們可以約束給定的一組輸入的情況下，限制輸出空間來最嚴重地違反規(guī)范。如果此界限范圍相對于網(wǎng)絡(luò)參數(shù)是可微分的并且可以快速計算，則可以在訓(xùn)練期間使用，通過網(wǎng)絡(luò)的每個層傳播原始邊界框。

結(jié)果表明，區(qū)間界限傳播是快速有效的，并且可以獲得強有力的結(jié)果。尤其是能夠降低MNIST和CIFAR-10數(shù)據(jù)集上的圖像分類中的現(xiàn)有技術(shù)的錯誤率。

未來的下一個前沿領(lǐng)域?qū)⑹菍W(xué)習(xí)正確的幾何抽象，計算更嚴格的輸出空間過度概率。我們還希望訓(xùn)練網(wǎng)絡(luò)與更復(fù)雜的規(guī)范一致，捕獲理想的行為，比如上文提到的不變性和與物理定律的一致性。

形式驗證

嚴格的測試和訓(xùn)練有助于構(gòu)建強大的機器學(xué)習(xí)系統(tǒng)。但是，沒有多少測試可以完全保證系統(tǒng)的行為符合我們的要求。在大模型中，由于輸入擾動的選擇極為龐大，因此列舉給定輸入集的所有可能輸出（例如對圖像的無窮小的擾動）是難以處理。但是，與訓(xùn)練一樣，我們可以通過在輸出集上設(shè)置幾何邊界來找到更有效的方法。正式驗證是DeepMind正在進行的研究的主題。

機器學(xué)習(xí)社區(qū)已經(jīng)有了幾個關(guān)于如何計算網(wǎng)絡(luò)輸出空間上的精確幾何邊界的有趣思路。我們的方法基于優(yōu)化和二元性，將驗證問題轉(zhuǎn)化為優(yōu)化問題。。下圖以圖形方式說明了該方法。

這種方法使我們能夠?qū)Ⅱ炞C算法的適用性擴展到更一般的網(wǎng)絡(luò)（激活函數(shù)，體系結(jié)構(gòu)），更一般性的規(guī)范和更復(fù)雜的深度學(xué)習(xí)模型（生成模型，神經(jīng)過程等）

未來方向

我們需要做更多的工作來構(gòu)建自動化工具，以確保現(xiàn)實世界中的AI系統(tǒng)做出“正確的事情”，為實現(xiàn)這個目標，未來需要在這些方向上發(fā)力：

學(xué)習(xí)對抗性評估和驗證：隨著AI系統(tǒng)的擴展和復(fù)雜度的提升，設(shè)計適合AI模型的對抗性評估和驗證算法將變得越來越困難。如果我們可以利用AI的強大功能來推進評估和驗證，那么這個過程可以大大加快，并實現(xiàn)擴展。

開發(fā)用于對抗性評估和驗證的公開工具：為AI工程師和從業(yè)者提供易于使用的工具是非常重要的，可以在AI系統(tǒng)造成廣泛的負面影響之前闡明其可能的故障模式。這需要一定程度的對抗性評估和驗證算法的標準化。

擴大對抗性實例的應(yīng)用范圍：到目前為止，大多數(shù)關(guān)于對抗性實例的研究都集中在對小擾動（通常是圖像）的模型不變性上。這為開發(fā)對抗性評估，穩(wěn)健性學(xué)習(xí)和驗證方法提供了極好的測試平臺。我們已經(jīng)開始探索與現(xiàn)實世界直接相關(guān)的屬性的替代規(guī)范，并對未來在這方面的研究感到興奮。

學(xué)習(xí)規(guī)范：在AI系統(tǒng)中獲得“正確”行為的規(guī)范通常難以精確表述。當我們構(gòu)建能夠展示復(fù)雜行為并在非結(jié)構(gòu)化環(huán)境中行動的越來越智能的代理時，將需要構(gòu)建可以使用部分人類規(guī)范并從評估反饋中學(xué)習(xí)進一步規(guī)范的系統(tǒng)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴