91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

詳談機器學(xué)習(xí)的決策樹模型

如意 ? 來源:逍遙埠 ? 作者:逍遙埠 ? 2020-07-06 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

決策樹模型是白盒模型的一種,其預(yù)測結(jié)果可以由人來解釋。我們把機器學(xué)習(xí)模型的這一特性稱為可解釋性,但并不是所有的機器學(xué)習(xí)模型都具有可解釋性。

作為可解釋性屬性的一部分,特征重要性是一個衡量每個輸入特征對模型預(yù)測結(jié)果貢獻(xiàn)的指標(biāo),即某個特征上的微小變化如何改變預(yù)測結(jié)果。

直覺

不同于基尼不純度或熵,沒有一個通用的數(shù)學(xué)公式來定義特征的重要性,而特征的重要性在不同的模型中是不同的。

例如,對于線性回歸模型,假設(shè)所有輸入特征具有相同的尺度(如[0,1],那么每個特征的特征重要性就是與該特征相關(guān)的權(quán)值的絕對值。從這個公式可以看出線性回歸模型的f (X) =∑i = 1 n (wixi),模型的結(jié)果是線性正比于每個組件(wixi)這是由重量決定的(wi)的組件。

對于決策樹,為了度量特征的重要性,我們需要研究模型,看看每個特征是如何在模型的最終“決策”中發(fā)揮作用的。從前面的文章中我們了解到,在決策樹模型中,在每個決策節(jié)點上,我們選擇最佳的特征進(jìn)行分割,以便進(jìn)一步區(qū)分到達(dá)該決策節(jié)點的樣本。在每一次分割中,我們都更接近最終的決定(即葉節(jié)點)。因此,我們可以說,在每個決策節(jié)點上,所選擇的分割特征決定了最終的預(yù)測結(jié)果。直觀地說,我們也可以說,那些被選擇的特征比那些實際上在決策過程中沒有作用的非被選擇的特征更重要?,F(xiàn)在,剩下的問題是我們?nèi)绾瘟炕睾饬窟@種重要性。

有人可能還記得,我們使用信息增益或基尼系數(shù)來衡量分割的質(zhì)量。當(dāng)然,還可以將增益與所選擇的特性關(guān)聯(lián)起來,并使用增益來量化該特性在這個特定的分裂發(fā)生時的貢獻(xiàn)。此外,我們可以累積決策樹中出現(xiàn)的每個特征的增益。

最后,每個特征的累積增益可以作為決策樹模型的特征重要性。

另一方面,作為一個可能會注意到,這一決定節(jié)點不是同樣重要的是,自從決定節(jié)點樹的根可以幫助過濾所有的輸入樣本,而決定節(jié)點樹的底部有助于區(qū)分總樣本的只有少數(shù)。因此,一個特征在每個決策節(jié)點獲得的增益的權(quán)重并不相同,即一個特征在一個決策節(jié)點獲得的增益應(yīng)按該決策節(jié)點幫助區(qū)分的樣本比例進(jìn)行加權(quán)。

基于上述直覺,我們可以推導(dǎo)出以下公式來計算決策樹中每個特征的重要性I:

詳談機器學(xué)習(xí)的決策樹模型

注:我們可以用上述公式中的信息增益來代替基尼系數(shù)增益度量,只要我們對所有特征都使用相同的度量。

通過上面的公式,我們可以得到一個值來衡量決策樹中每個特征的重要性。有時,可能需要對值進(jìn)行規(guī)范化,以便更直觀地比較這些值,即將所有值縮放到(0,1)的范圍內(nèi)。例如,如果有兩個特征經(jīng)過歸一化后得分相同(即0.5),我們可以說它們在決策樹中同等重要。

舉個例子

讓我們看一個具體的例子,看看我們?nèi)绾螒?yīng)用上面的公式來計算決策樹中的特征重要性。首先,我們在下圖中展示了一個實例決策樹。

詳談機器學(xué)習(xí)的決策樹模型

從圖中可以看出,該樹中共有3個決策節(jié)點。在每個決策節(jié)點中,我們指出了三條信息:

1、選擇要分割的特性。

2、特征獲得的基尼系數(shù)

3、分別分配給左子節(jié)點和右子節(jié)點的樣本數(shù)量。

此外,我們可以看出決策樹總共訓(xùn)練了100個樣本。

因此,我們可以計算出樹中涉及的兩個特征的特征重要性如下:

詳談機器學(xué)習(xí)的決策樹模型

進(jìn)一步,我們可以得到歸一化特征重要性如下:

詳談機器學(xué)習(xí)的決策樹模型

后記:路漫漫其修遠(yuǎn)兮,吾將上下而求索!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136938
  • 決策樹
    +關(guān)注

    關(guān)注

    3

    文章

    96

    瀏覽量

    14083
  • 白盒測試
    +關(guān)注

    關(guān)注

    1

    文章

    15

    瀏覽量

    10867
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    :自動化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團隊協(xié)作開發(fā)(如分支管理、代碼合并)。 機器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決策樹
    發(fā)表于 02-27 10:53

    強化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強化
    的頭像 發(fā)表于 01-31 09:34 ?641次閱讀
    強化<b class='flag-5'>學(xué)習(xí)</b>會讓自動駕駛<b class='flag-5'>模型</b><b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    NVIDIA Cosmos世界基礎(chǔ)模型如何塑造機器人未來

    在這一演進(jìn)過程中,世界模型逐漸成為連接高層智能與底層執(zhí)行的關(guān)鍵基礎(chǔ)設(shè)施。通過對環(huán)境狀態(tài)及其時間演化進(jìn)行建模,世界模型使機器人系統(tǒng)能夠在受控環(huán)境中進(jìn)行仿真、訓(xùn)練與決策推演,從而為
    的頭像 發(fā)表于 01-22 16:38 ?516次閱讀
    NVIDIA Cosmos世界基礎(chǔ)<b class='flag-5'>模型</b>如何塑造<b class='flag-5'>機器</b>人未來

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?190次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    基于ETAS嵌入式AI工具鏈將機器學(xué)習(xí)模型部署到量產(chǎn)ECU

    AI在汽車行業(yè)的應(yīng)用日益深化,如何將機器學(xué)習(xí)領(lǐng)域的先進(jìn)模型(如虛擬傳感器)集成到ECU軟件中,已成為業(yè)界面臨的核心挑戰(zhàn)。
    的頭像 發(fā)表于 12-24 10:55 ?6104次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>部署到量產(chǎn)ECU

    五大衛(wèi)星運管中心大模型智能決策分系統(tǒng)軟件的應(yīng)用與未來發(fā)展

    ? ? 五大機構(gòu)/企業(yè)衛(wèi)星運管中心大模型智能決策分系統(tǒng)實踐綜述 ? ?當(dāng)前,隨著大規(guī)模星座部署與智能化作戰(zhàn)需求激增,以大模型驅(qū)動的衛(wèi)星智能決策系統(tǒng)成為全球航天強國和頭部企業(yè)的戰(zhàn)略焦點。
    的頭像 發(fā)表于 12-18 14:58 ?345次閱讀

    基于級聯(lián)分類器的人臉檢測基本原理

    ,然后把滑動窗口中的像素灰度值和級聯(lián)分類器里預(yù)先訓(xùn)練好的468棵決策樹中的節(jié)點進(jìn)行比較,得到該窗口檢測結(jié)果為人臉的置信度。如果置信度大于一定的閾值,那么我們認(rèn)為人臉被檢測到了,反之則為未檢測到人臉
    發(fā)表于 10-30 06:14

    科技發(fā)布H2仿生人形機器

    就在10月20日會跳舞的機器人來了,宇科技正式發(fā)布H2仿生人形機器人,高180cm,重70kg,配以31個關(guān)節(jié)。在宇科技展示的視頻中,H2仿生人形
    的頭像 發(fā)表于 10-20 17:52 ?1877次閱讀

    科技預(yù)告新款人形機器人:有31個關(guān)節(jié)

    機器人似乎要搞大事了,宇科技發(fā)布了新款人形機器人的海報,雖然配文只有“敬請期待”幾個字,但是根據(jù)海報信息顯示新款機器人配備有31個關(guān)節(jié)
    的頭像 發(fā)表于 08-19 23:10 ?2020次閱讀

    宜科MVT閥島在宇科技人形機器人中的應(yīng)用

    在科技飛速發(fā)展的當(dāng)下,機器人行業(yè)正以前所未有的速度蓬勃興起。其中,宇科技作為行業(yè)內(nèi)的佼佼者,憑借其創(chuàng)新的產(chǎn)品和領(lǐng)先的技術(shù),在全球機器人市場中占據(jù)了重要地位。從四足機器人到人形
    的頭像 發(fā)表于 08-16 17:31 ?1488次閱讀

    自動駕駛中Transformer大模型會取代深度學(xué)習(xí)嗎?

    持續(xù)討論。特別是在自動駕駛領(lǐng)域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學(xué)習(xí)是否已過時”的激烈爭論。然而,從技術(shù)原理、算力成本、安全需求與實際落地路徑等維度來看,Transforme
    的頭像 發(fā)表于 08-13 09:15 ?4184次閱讀
    自動駕駛中Transformer大<b class='flag-5'>模型</b>會取代深度<b class='flag-5'>學(xué)習(xí)</b>嗎?

    超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    光伏電站智能分析決策的系統(tǒng)化應(yīng)用工具

    數(shù)據(jù)采集傳輸;然后經(jīng)過一定的處理技術(shù),對數(shù)據(jù)進(jìn)行清洗與存儲、提取復(fù)合特征,并基于機器學(xué)習(xí)以及深度學(xué)習(xí)算法,進(jìn)行模型建設(shè)協(xié)同分析,從而實現(xiàn)趨勢預(yù)測。 最重要的內(nèi)容體現(xiàn)是在于智能
    的頭像 發(fā)表于 07-03 14:56 ?793次閱讀
    光伏電站智能分析<b class='flag-5'>決策</b>的系統(tǒng)化應(yīng)用工具

    邊緣計算中的機器學(xué)習(xí):基于 Linux 系統(tǒng)的實時推理模型部署與工業(yè)集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學(xué)習(xí)模型(神經(jīng)網(wǎng)絡(luò))部署到邊緣設(shè)備上,利用從ModbusTCP寄存器獲取的實時數(shù)據(jù)來預(yù)測一臺復(fù)古音頻放大器的當(dāng)前健康狀況。你將
    的頭像 發(fā)表于 06-11 17:22 ?995次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>:基于 Linux 系統(tǒng)的實時推理<b class='flag-5'>模型</b>部署與工業(yè)集成!

    十大鮮為人知卻功能強大的機器學(xué)習(xí)模型

    本文轉(zhuǎn)自:QuantML當(dāng)我們談?wù)?b class='flag-5'>機器學(xué)習(xí)時,線性回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這些常見的算法往往占據(jù)了主導(dǎo)地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強大的算法,它們能夠
    的頭像 發(fā)表于 04-02 14:10 ?1094次閱讀
    十大鮮為人知卻功能強大的<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>