91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

C29F_xilinx_inc ? 來源:賽靈思 ? 作者:賽靈思 ? 2022-02-26 17:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文介紹目前常見的幾種可以提高機器學(xué)習(xí)模型的可解釋性的技術(shù)。

模型可解釋性匯總

簡介

目前很多機器學(xué)習(xí)模型可以做出非常好的預(yù)測,但是它們并不能很好地解釋他們是如何進行預(yù)測的,很多數(shù)據(jù)科學(xué)家都很難知曉為什么該算法會得到這樣的預(yù)測結(jié)果。這是非常致命的,因為如果我們無法知道某個算法是如何進行預(yù)測,那么我們將很難將其遷移到其它的問題中,很難進行算法的debug。

本文介紹目前常見的幾種可以提高機器學(xué)習(xí)模型的可解釋性的技術(shù),包括它們的相對優(yōu)點和缺點。我們將其分為下面幾種:

1. Partial Dependence Plot (PDP);

2. Individual Conditional Expectation (ICE)

3. Permuted Feature Importance

4. Global Surrogate

5. Local Surrogate (LIME)

6. Shapley Value (SHAP)

六大可解釋性技術(shù)

01、Partial Dependence Plot (PDP)

PDP是十幾年之前發(fā)明的,它可以顯示一個或兩個特征對機器學(xué)習(xí)模型的預(yù)測結(jié)果的邊際效應(yīng)。它可以幫助研究人員確定當(dāng)大量特征調(diào)整時,模型預(yù)測會發(fā)生什么樣的變化。

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

上面圖中X軸表示特圖片的值y軸表示預(yù)測值。陰影區(qū)域中的實線顯示了平均預(yù)測如何隨圖片值的變化而變化。PDP能很直觀地顯示平均邊際效應(yīng),因此可能會隱藏異質(zhì)效應(yīng)。

例如,一個特征可能與一半數(shù)據(jù)的預(yù)測正相關(guān),與另一半數(shù)據(jù)負相關(guān)。那么PDP圖將只是一條水平線。

02、Individual Conditional Expectation (ICE)

ICE和PDP非常相似,但和PDP不同之處在于,PDP繪制的是平均情況,但是ICE會顯示每個實例的情況。ICE可以幫助我們解釋一個特定的特征改變時,模型的預(yù)測會怎么變化。

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

如上圖所示,與PDP不同,ICE曲線可以揭示異質(zhì)關(guān)系。但其最大的問題在于:它不能像PDP那樣容易看到平均效果,所以可以考慮將二者結(jié)合起來一起使用。

03、Permuted Feature Importance

Permuted Feature Importance的特征重要性是通過特征值打亂后模型預(yù)測誤差的變化得到的。換句話說,Permuted Feature Importance有助于定義模型中的特征對最終預(yù)測做出貢獻的大小。

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

如上圖所示,特征f2在特征的最上面,對模型的誤差影響是最大的,f1在shuffle之后對模型卻幾乎沒什么影響,生息的特征則對于模型是負面的貢獻。

04、Global Surrogate

Global Surrogate方法采用不同的方法。它通過訓(xùn)練一個可解釋的模型來近似黑盒模型的預(yù)測。

首先,我們使用經(jīng)過訓(xùn)練的黑盒模型對數(shù)據(jù)集進行預(yù)測;

然后我們在該數(shù)據(jù)集和預(yù)測上訓(xùn)練可解釋的模型。

訓(xùn)練好的可解釋模型可以近似原始模型,我們需要做的就是解釋該模型。

注:代理模型可以是任何可解釋的模型:線性模型、決策樹、人類定義的規(guī)則等。

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

使用可解釋的模型來近似黑盒模型會引入額外的誤差,但額外的誤差可以通過R平方來衡量。

由于代理模型僅根據(jù)黑盒模型的預(yù)測而不是真實結(jié)果進行訓(xùn)練,因此全局代理模型只能解釋黑盒模型,而不能解釋數(shù)據(jù)。

05、Local Surrogate (LIME)

LIME(Local Interpretable Model-agnostic Explanations)和global surrogate是不同的,因為它不嘗試解釋整個模型。相反,它訓(xùn)練可解釋的模型來近似單個預(yù)測。LIME試圖了解當(dāng)我們擾亂數(shù)據(jù)樣本時預(yù)測是如何變化的。

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

上面左邊的圖像被分成可解釋的部分。然后,LIME 通過“關(guān)閉”一些可解釋的組件(在這種情況下,使它們變灰)來生成擾動實例的數(shù)據(jù)集。對于每個擾動實例,可以使用經(jīng)過訓(xùn)練的模型來獲取圖像中存在樹蛙的概率,然后在該數(shù)據(jù)集上學(xué)習(xí)局部加權(quán)線性模型。最后,使用具有最高正向權(quán)重的成分來作為解釋。

06、Shapley Value (SHAP)

Shapley Value的概念來自博弈論。我們可以通過假設(shè)實例的每個特征值是游戲中的“玩家”來解釋預(yù)測。每個玩家的貢獻是通過在其余玩家的所有子集中添加和刪除玩家來衡量的。一名球員的Shapley Value是其所有貢獻的加權(quán)總和。Shapley 值是可加的,局部準確的。如果將所有特征的Shapley值加起來,再加上基值,即預(yù)測平均值,您將得到準確的預(yù)測值。這是許多其他方法所沒有的功能。

關(guān)于機器學(xué)習(xí)模型的六大可解釋性技術(shù)

該圖顯示了每個特征的Shapley值,表示將模型結(jié)果從基礎(chǔ)值推到最終預(yù)測的貢獻。紅色表示正面貢獻,藍色表示負面貢獻。

小結(jié)

機器學(xué)習(xí)模型的可解釋性是機器學(xué)習(xí)中一個非?;钴S而且重要的研究領(lǐng)域。本文中我們介紹了6種常用的用于理解機器學(xué)習(xí)模型的算法。大家可以依據(jù)自己的實踐場景進行使用。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98076
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52113
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136962
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    強化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛大模型訓(xùn)練時,有的技術(shù)方案會采用模仿學(xué)習(xí),而有些會采用強化學(xué)習(xí)。同樣作為大模型的訓(xùn)練方式,強化
    的頭像 發(fā)表于 01-31 09:34 ?646次閱讀
    強化<b class='flag-5'>學(xué)習(xí)</b>會讓自動駕駛<b class='flag-5'>模型</b><b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    谷歌正式發(fā)布Gemma Scope 2模型

    Scope 工具包推動了可解釋性科學(xué)的發(fā)展,該工具旨在幫助研究人員理解我們輕量級開放模型系列 Gemma 2 的內(nèi)部運作機制。
    的頭像 發(fā)表于 01-24 14:01 ?530次閱讀

    步進伺服電機的六大問題處理技巧

    步進伺服電機作為工業(yè)自動化領(lǐng)域的關(guān)鍵部件,其穩(wěn)定性和精度直接影響設(shè)備性能。然而在實際應(yīng)用中,電機可能因參數(shù)配置、機械負載或環(huán)境因素出現(xiàn)異常。本文將針對六大典型問題提供系統(tǒng)解決方案,結(jié)合工程實踐
    的頭像 發(fā)表于 10-30 07:41 ?777次閱讀

    脈沖神經(jīng)元模型的硬件實現(xiàn)

    息電位 vrest。 LIF神經(jīng)元模型在生物可解釋性上低于其他模型,只體現(xiàn)了神經(jīng)元計算的關(guān)鍵特性,并不能夠解釋真實神經(jīng)元的脈沖是如何生成,也不包括豐富的神經(jīng)元行為特性。但由于其簡單的操
    發(fā)表于 10-24 08:27

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    配備科學(xué)發(fā)現(xiàn)仍需人類的直覺和靈感 ④正價可解釋性和透明 ⑤解決倫理和道德問題、AI芯片用于“AI科學(xué)家”系統(tǒng) AI芯片的作用:七、用量子啟發(fā)AI技術(shù)發(fā)現(xiàn)新型超材料的案例 超材料特點
    發(fā)表于 09-17 11:45

    超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設(shè)備上進行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    模型在半導(dǎo)體行業(yè)的應(yīng)用可行分析

    的應(yīng)用,比如使用機器學(xué)習(xí)分析數(shù)據(jù),提升良率。 這一些大模型是否真的有幫助 能夠在解決工程師的知識斷層問題 本人純小白,不知道如何涉足這方面 應(yīng)該問什么大模型比較好,或者是看什么視頻能夠
    發(fā)表于 06-24 15:10

    中國科學(xué)院西安光機所在計算成像可解釋性深度學(xué)習(xí)重建方法取得進展

    圖1 MDFP-Net網(wǎng)絡(luò)結(jié)構(gòu) 近日,中國科學(xué)院西安光機所空間光學(xué)技術(shù)研究室在計算成像可解釋性深度學(xué)習(xí)重建方法研究取得創(chuàng)新進展。相關(guān)研究成果發(fā)表于計算機視覺與圖形學(xué)領(lǐng)域國際著名期刊
    的頭像 發(fā)表于 06-09 09:27 ?679次閱讀
    中國科學(xué)院西安光機所在計算成像<b class='flag-5'>可解釋性</b>深度<b class='flag-5'>學(xué)習(xí)</b>重建方法取得進展

    云知聲四篇論文入選自然語言處理頂會ACL 2025

    結(jié)果正式公布。云知聲在此次國際學(xué)術(shù)盛會中表現(xiàn)卓越,共有4篇論文被接收,其中包括2篇主會論文(Main Paper)和2篇Findings。入選的4篇論文聚焦大語言模型知識溯源、圖文音多模態(tài)大模型、大語言模型
    的頭像 發(fā)表于 05-26 14:15 ?1319次閱讀
    云知聲四篇論文入選自然語言處理頂會ACL 2025

    Gartner發(fā)布云技術(shù)發(fā)展的六大趨勢

    Gartner發(fā)布未來四年云技術(shù)發(fā)展的六大趨勢,包括對云技術(shù)不滿、人工智能/機器學(xué)習(xí)(AI/ML)、多云和跨云、可持續(xù)
    的頭像 發(fā)表于 05-19 11:40 ?1017次閱讀
    Gartner發(fā)布云<b class='flag-5'>技術(shù)</b>發(fā)展的<b class='flag-5'>六大</b>趨勢

    大象機器人攜手進迭時空推出 RISC-V 全棧開源軸機械臂產(chǎn)品

    大象機器人成立于2016年,專注協(xié)作機器人研發(fā)與應(yīng)用,產(chǎn)品線涵蓋輕量級協(xié)作機器人、人形機器人、仿生機器人等多種形態(tài)。拳頭產(chǎn)品myCobot系
    發(fā)表于 04-25 17:59

    一種實時多線程VSLAM框架vS-Graphs介紹

    針對現(xiàn)有VSLAM系統(tǒng)語義表達不足、地圖可解釋性差的問題,本文提出vS-Graphs,一種實時多線程VSLAM框架。該方案顯著提升了重建地圖的語義豐富度、可解釋性及定位精度。實驗表明
    的頭像 發(fā)表于 04-19 14:07 ?1009次閱讀
    一種實時多線程VSLAM框架vS-Graphs介紹

    算法進化論:從參數(shù)剪枝到意識解碼的 AI 革命

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)在人工智能領(lǐng)域,算法創(chuàng)新無疑是推動技術(shù)持續(xù)前行的核心動力源泉。近些年來,隨著深度學(xué)習(xí)、強化學(xué)習(xí)等前沿技術(shù)相繼取得重大突破,AI 算法在效率提升、
    的頭像 發(fā)表于 04-19 00:38 ?2474次閱讀

    國產(chǎn)地物光譜儀在“高光譜-機器學(xué)習(xí)模型構(gòu)建中的表現(xiàn)

    在遙感應(yīng)用和環(huán)境監(jiān)測日益精細化的今天,“高光譜 + 機器學(xué)習(xí)”的組合已成為地物識別、礦產(chǎn)探測、農(nóng)業(yè)監(jiān)測等領(lǐng)域的重要技術(shù)手段。而作為獲取高光譜數(shù)據(jù)的前端工具,地物光譜儀的性能直接影響到后續(xù)模型
    的頭像 發(fā)表于 04-18 16:15 ?745次閱讀
    國產(chǎn)地物光譜儀在“高光譜-<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>”<b class='flag-5'>模型</b>構(gòu)建中的表現(xiàn)

    軟通動力攜手伙伴發(fā)布六大聯(lián)合解決方案

    ToB云運營解決方案”、 “天慧智園解決方案”六大聯(lián)合解決方案,其中多個方案深度融入AI能力,旨在為高校、園區(qū)、運營商、醫(yī)療等關(guān)鍵行業(yè)領(lǐng)域的數(shù)智化轉(zhuǎn)型注入強勁動力。 1 昇騰DeepSeek專業(yè)服務(wù)解決方案 軟通動力×華為 面對大模型軟件各層緊耦合、
    的頭像 發(fā)表于 03-22 10:30 ?1946次閱讀
    軟通動力攜手伙伴發(fā)布<b class='flag-5'>六大</b>聯(lián)合解決方案