色婷婷区二区三区之e大道,日韩特级片视频爱五月网,着免费高清黄色片

垃圾分類作為資源回收利用的重要環(huán)節(jié)之一，可以有效地提高資源回收利用效率，進一步減輕環(huán)境污染帶來的危害。隨著現(xiàn)代工業(yè)逐步智能化，傳統(tǒng)的圖像分類算法已經(jīng)不能滿足垃圾分揀設備的要求。本文提出一種基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類模型（Garbage Classification Network， GCNet）。通過構建注意力機制，模型完成局部和全局的特征提取，能夠獲取到更加完善、有效的特征信息; 同時，通過特征融合機制，將不同層級、尺寸的特征進行融合，更加有效地利用特征，避免梯度消失現(xiàn)象。實驗結果證明， GCNet 在相關垃圾分類數(shù)據(jù)集上取得了優(yōu)異的結果，能夠有效地提高垃圾識別精度。

1 引言

垃圾回收利用作為發(fā)展循環(huán)經(jīng)濟的必經(jīng)之路，是根治污染、提高環(huán)境治理效果的關鍵所在。隨著我國生產(chǎn)力水平的發(fā)展，生活垃圾、工業(yè)垃圾數(shù)量不斷增加，困擾著很多城市。據(jù)統(tǒng)計，僅 2018 年，中國垃圾的清運量已經(jīng)達到了 2.28 億噸［1］。在人們將垃圾投放進垃圾箱之后，垃圾被運送到垃圾處理廠統(tǒng)一處理。當前國內的垃圾處理廠，更多依靠人工在流水線上作業(yè)去分揀垃圾，對作業(yè)者健康不利且分揀效率較低，已不能滿足大量垃圾處理需求。此外，人工分揀的垃圾種類極為有限，大部分垃圾無法重新回收利用，造成很大浪費。隨著深度學習技術的發(fā)展，卷積神經(jīng)網(wǎng)絡使圖像分類算法在精度和速度上得到了巨大的提升，讓我們看到了借助視覺技術自動分揀垃圾的可能性。通過攝像頭拍攝垃圾圖片，利用卷積神經(jīng)網(wǎng)絡檢測出垃圾的類別，之后就可以借助機械手或推板自動完成分揀任務，可以降低人工成本，提高分揀效率。因此，開展垃圾圖像分類算法的研究，具有重要的應用價值。

2 相關工作

早期，學者們只能借助經(jīng)典的圖像分類算法［2–5］完成垃圾圖像分類任務，這要通過手動提取的圖像特征并結合相應的分類器完成。吳健等［6］利用顏色和紋理特征，初步完成了廢物垃圾識別。由于不同數(shù)據(jù)集的圖像背景、尺寸、質量不盡相同，傳統(tǒng)算法需要根據(jù)相應數(shù)據(jù)人工提取不同的特征，算法的魯棒性較差，并且處理方式復雜，所需時間較長，無法達到實時的效果。隨著卷積神經(jīng)網(wǎng)絡（Convolution Neural Network， CNN）的飛速發(fā)展，深度學習廣泛應用于圖像識別領域。

作為數(shù)據(jù)驅動的算法， CNN 具有強大的特征擬合能力，可以有效、自動地提取圖像特征，并具有較快的運行速度。 2012 年， AlexNet［7］取得了 ImageNet 圖像分類競賽的冠軍，標志著深度學習的崛起。隨后幾年， GoogleNet［8］、VGGNet［9］、ResNet［10］等算法提升了圖像分類的精度，并成功應用于人臉識別、車輛檢測等多個領域。垃圾圖像分類，在深度學習算法的幫助下同樣取得了較大的突破。

斯坦福大學的 Yang 等建立了 TrashNet Dataset 公開數(shù)據(jù)集，包含 6 個類別，共計 2527 張圖片。 Ozkaya 等［11］通過對比不同 CNN 網(wǎng)絡的分類能力，搭建神經(jīng)網(wǎng)絡（本文稱之為 TrashNet）并進行參數(shù)微調，在數(shù)據(jù)集 TrashNet Dataset 上取得了 97.86% 的準確率，是目前這一數(shù)據(jù)集上最佳分類網(wǎng)絡。在非公開數(shù)據(jù)集方面， Mittal 等［12］自制了 2561 張的垃圾圖片數(shù)據(jù)集 GINI，使用 GarbNet 模型，得到了 87.69% 的準確率。國內方面，鄭海龍等［13］用 SVM 方法進行了建筑垃圾分類方面的研究。向偉等［14］使用分類網(wǎng)絡 CaffeNet，調整卷積核尺寸和網(wǎng)絡深度，使其適用于水面垃圾分類，在其自制的 1500 張圖片數(shù)據(jù)集上取得了 95.75% 的識別率。 2019 年，華為舉辦垃圾圖像分類競賽，構建了樣本容量為一萬余張的數(shù)據(jù)集，進一步促進了該領域的發(fā)展。

我國各地區(qū)生活垃圾分類標準有所不同，大致可分為可回收垃圾、有害垃圾、廚余垃圾和其他垃圾這 4 大類，且每個類別下又包含若干子類別，種類繁多且十分復雜。按照這樣的分類標準做的垃圾圖像識別研究，國內目前還處于起步階段。現(xiàn)有的圖形分類算法在垃圾處理領域的應用較少，且存在準確率不足、泛化性能差、處理效率低的缺點。針對現(xiàn)有方法的不足，本文提出一種基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類算法（Garbage Classification Net， GCNet），在網(wǎng)絡結構中融合了注意力機制模塊與特征融合模塊，提高了模型在垃圾分類任務上的準確性與魯棒性。

3 算法設計

3.1 模型結構

本文構建的 GCNet 模型包括特征提取器、分類器兩部分，整體結構如圖 1 所示。圖中特征提取器由 Resnet101 作為主干部分，共包括 5 個 bottleneck，并在不同的 bottleneck 后加入注意力機制模塊，同時對不同模塊提取到的特征進行特征融合（如圖 1 中虛線所示）以從輸入中提取圖像的特征信息：

其中， Me表示特征提取器。 F1 yi 分類器由兩層全連接層和一個 Softmax 分類器組成，對提取到的特征信息進行分類，以得到圖像在每個類別下的最終得分：

其中， Mc表示分類器。

3.2 注意力機制

注意力機制源于對人類視覺的研究，人類會根據(jù) 實際需要選擇視網(wǎng)膜內特定區(qū)域進行集中關注，可以將有限的處理資源分配至重要的部分。由于相同類別垃圾的特征表征差異性可能較大，不利于圖片的正確分類，這就要求準確地關注圖像中的顯著區(qū)域。受這一思想的啟發(fā)，通過構建注意力機制模塊，使網(wǎng)絡模型重點關注有利于分類的特征區(qū)域，以實現(xiàn)更好的特征提取功能，其具體結構如圖 2 所示。

5 結論

本文針對垃圾圖像分類問題，構建了一種基于卷積神經(jīng)網(wǎng)絡的算法 GCNet，該網(wǎng)絡通過構建注意力機制和特征融合機制，能夠有效地提取圖像特征、降低類別差異性帶來的影響，并在相關數(shù)據(jù)集上取得了 96.73% 的平均準確率，相較于現(xiàn)有的分類算法提升了約 4% 的準確率，滿足了實際的應用需求，具有良好的應用前景。

原文標題：基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類算法

文章出處：【微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴