日本在线无毒不卡黄色免费网站,亚洲伊人网狠狠干,激情99在线日韩中出

決策樹模型是白盒模型的一種，其預(yù)測結(jié)果可以由人來解釋。我們把機器學(xué)習(xí)模型的這一特性稱為可解釋性，但并不是所有的機器學(xué)習(xí)模型都具有可解釋性。

作為可解釋性屬性的一部分，特征重要性是一個衡量每個輸入特征對模型預(yù)測結(jié)果貢獻(xiàn)的指標(biāo)，即某個特征上的微小變化如何改變預(yù)測結(jié)果。

直覺

不同于基尼不純度或熵，沒有一個通用的數(shù)學(xué)公式來定義特征的重要性，而特征的重要性在不同的模型中是不同的。

例如，對于線性回歸模型，假設(shè)所有輸入特征具有相同的尺度（如［0，1］，那么每個特征的特征重要性就是與該特征相關(guān)的權(quán)值的絕對值。從這個公式可以看出線性回歸模型的f （X） =∑i = 1 n （wixi），模型的結(jié)果是線性正比于每個組件（wixi）這是由重量決定的（wi）的組件。

對于決策樹，為了度量特征的重要性，我們需要研究模型，看看每個特征是如何在模型的最終“決策”中發(fā)揮作用的。從前面的文章中我們了解到，在決策樹模型中，在每個決策節(jié)點上，我們選擇最佳的特征進(jìn)行分割，以便進(jìn)一步區(qū)分到達(dá)該決策節(jié)點的樣本。在每一次分割中，我們都更接近最終的決定（即葉節(jié)點）。因此，我們可以說，在每個決策節(jié)點上，所選擇的分割特征決定了最終的預(yù)測結(jié)果。直觀地說，我們也可以說，那些被選擇的特征比那些實際上在決策過程中沒有作用的非被選擇的特征更重要?，F(xiàn)在，剩下的問題是我們?nèi)绾瘟炕睾饬窟@種重要性。

有人可能還記得，我們使用信息增益或基尼系數(shù)來衡量分割的質(zhì)量。當(dāng)然，還可以將增益與所選擇的特性關(guān)聯(lián)起來，并使用增益來量化該特性在這個特定的分裂發(fā)生時的貢獻(xiàn)。此外，我們可以累積決策樹中出現(xiàn)的每個特征的增益。

最后，每個特征的累積增益可以作為決策樹模型的特征重要性。

另一方面，作為一個可能會注意到，這一決定節(jié)點不是同樣重要的是，自從決定節(jié)點樹的根可以幫助過濾所有的輸入樣本，而決定節(jié)點樹的底部有助于區(qū)分總樣本的只有少數(shù)。因此，一個特征在每個決策節(jié)點獲得的增益的權(quán)重并不相同，即一個特征在一個決策節(jié)點獲得的增益應(yīng)按該決策節(jié)點幫助區(qū)分的樣本比例進(jìn)行加權(quán)。

基于上述直覺，我們可以推導(dǎo)出以下公式來計算決策樹中每個特征的重要性I：

詳談機器學(xué)習(xí)的決策樹模型

注：我們可以用上述公式中的信息增益來代替基尼系數(shù)增益度量，只要我們對所有特征都使用相同的度量。

通過上面的公式，我們可以得到一個值來衡量決策樹中每個特征的重要性。有時，可能需要對值進(jìn)行規(guī)范化，以便更直觀地比較這些值，即將所有值縮放到（0，1）的范圍內(nèi)。例如，如果有兩個特征經(jīng)過歸一化后得分相同（即0.5），我們可以說它們在決策樹中同等重要。

舉個例子

讓我們看一個具體的例子，看看我們?nèi)绾螒?yīng)用上面的公式來計算決策樹中的特征重要性。首先，我們在下圖中展示了一個實例決策樹。

詳談機器學(xué)習(xí)的決策樹模型

從圖中可以看出，該樹中共有3個決策節(jié)點。在每個決策節(jié)點中，我們指出了三條信息：

1、選擇要分割的特性。

2、特征獲得的基尼系數(shù)

3、分別分配給左子節(jié)點和右子節(jié)點的樣本數(shù)量。

此外，我們可以看出決策樹總共訓(xùn)練了100個樣本。

因此，我們可以計算出樹中涉及的兩個特征的特征重要性如下：

詳談機器學(xué)習(xí)的決策樹模型

進(jìn)一步，我們可以得到歸一化特征重要性如下：

詳談機器學(xué)習(xí)的決策樹模型

后記：路漫漫其修遠(yuǎn)兮，吾將上下而求索！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器學(xué)習(xí)

機器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8553

瀏覽量
136938
決策樹

決策樹

+關(guān)注

關(guān)注
3

文章
96

瀏覽量
14083
白盒測試

白盒測試

+關(guān)注

關(guān)注
1

文章
15

瀏覽量
10867

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

詳談機器學(xué)習(xí)的決策樹模型

評論