作者:Valentina Alto
編譯:ronghuaiyang
導(dǎo)讀
使用Keras實現(xiàn)圖像分類中的激活熱圖的可視化,幫助更有針對性的改進(jìn)模型。
類別激活圖(CAM)是一種用于計算機視覺分類任務(wù)的強大技術(shù)。它允許研究人員檢查被分類的圖像,并了解圖像的哪些部分/像素對模型的最終輸出有更大的貢獻(xiàn)。
基本上,假設(shè)我們構(gòu)建一個CNN,目標(biāo)是將人的照片分類為“男人”和“女人”,然后我們給它提供一個新照片,它返回標(biāo)簽“男人”。有了CAM工具,我們就能看到圖片的哪一部分最能激活“Man”類。如果我們想提高模型的準(zhǔn)確性,必須了解需要修改哪些層,或者我們是否想用不同的方式預(yù)處理訓(xùn)練集圖像,這將非常有用。
在本文中,我將向你展示這個過程背后的思想。為了達(dá)到這個目的,我會使用一個在ImageNet上預(yù)訓(xùn)練好的CNN, Resnet50。
我在這個實驗中要用到的圖像是,這只金毛獵犬:
首先,讓我們在這張圖上嘗試一下我們預(yù)訓(xùn)練模型,讓它返回三個最有可能的類別:
from keras.applications.resnet50 import ResNet50 from keras.preprocessing import image from keras.applications.resnet50 import preprocess_input, decode_predictions import numpy as npmodel = ResNet50(weights='imagenet')img_path = 'golden.jpg' img = image.load_img(img_path, target_size=(224, 224)) x = image.img_to_array(img) x = np.expand_dims(x, axis=0) x = preprocess_input(x)preds = model.predict(x) # decode the results into a list of tuples (class, description, probability) print('Predicted:', decode_predictions(preds, top=3)[0])

如你所見,第一個結(jié)果恰好返回了我們正在尋找的類別:Golden retriver。
現(xiàn)在我們的目標(biāo)是識別出我們的照片中最能激活黃金標(biāo)簽的部分。為此,我們將使用一種稱為“梯度加權(quán)類別激活映射(Grad-CAM)”的技術(shù)(官方論文:https://arxiv.org/abs/1610.02391)。
這個想法是這樣的:想象我們有一個訓(xùn)練好的CNN,我們給它提供一個新的圖像。它將為該圖像返回一個類。然后,如果我們?nèi)∽詈笠粋€卷積層的輸出特征圖,并根據(jù)輸出類別對每個通道的梯度對每個通道加權(quán),我們就得到了一個熱圖,它表明了輸入圖像中哪些部分對該類別激活程度最大。
讓我們看看使用Keras的實現(xiàn)。首先,讓我們檢查一下我們預(yù)先訓(xùn)練過的ResNet50的結(jié)構(gòu),以確定我們想要檢查哪個層。由于網(wǎng)絡(luò)結(jié)構(gòu)很長,我將在這里只顯示最后的block:
from keras.utils import plot_model plot_model(model)

讓我們使用最后一個激活層activation_49來提取我們的feature map。
golden = model.output[:, np.argmax(preds[0])] last_conv_layer = model.get_layer('activation_49') from keras import backend as K grads = K.gradients(golden, last_conv_layer.output)[0] pooled_grads = K.mean(grads, axis=(0, 1, 2)) iterate = K.function([model.input], [pooled_grads, last_conv_layer.output[0]]) pooled_grads_value, conv_layer_output_value = iterate([x]) for i in range(pooled_grads.shape[0]): conv_layer_output_value[:, :, i] *= pooled_grads_value[i] heatmap = np.mean(conv_layer_output_value, axis=-1) import matplotlib.pyplot as plt heatmap = np.maximum(heatmap, 0) heatmap /= np.max(heatmap) plt.matshow(heatmap)
這個熱圖上看不出什么東西出來。因此,我們將該熱圖與輸入圖像合并如下:
import cv2 img = cv2.imread(img_path) heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0])) heatmap = np.uint8(255 * heatmap) heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET) merged= heatmap * 0.4 + imgplt.imshow(merged)
如你所見,圖像的某些部分(如鼻子部分)特別的指示出了輸入圖像的類別。
英文原文:https://valentinaalto.medium.com/class-activation-maps-in-deep-learning-14101e2ec7e1
本文轉(zhuǎn)自:AI公園,作者:Valentina Alto,編譯:ronghuaiyang,
轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。
審核編輯:何安
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5602瀏覽量
124569
發(fā)布評論請先 登錄
3D系統(tǒng)可視化
森林消防智慧預(yù)警技術(shù)實現(xiàn):火災(zāi)監(jiān)測 Web GIS 可視化平臺搭建
KubePi:開源Kubernetes可視化管理面板,讓集群管理如此簡單
基于圖撲 HT 數(shù)字孿生 3D 風(fēng)電場可視化系統(tǒng)實現(xiàn)解析
工業(yè)數(shù)字孿生:圖撲可視化技術(shù)架構(gòu)與行業(yè)應(yīng)用解析
圖撲 HT 驅(qū)動智慧社區(qū)數(shù)字化轉(zhuǎn)型:多維可視化與系統(tǒng)集成實踐
工業(yè)可視化平臺是什么
光伏電站可視化的實現(xiàn)
一文讀懂 | 晶圓圖Wafer Maps:半導(dǎo)體數(shù)據(jù)可視化的核心工具
如何使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化
工業(yè)設(shè)備可視化管理系統(tǒng)是什么
深度學(xué)習(xí)中類別激活熱圖可視化背后的思想
評論