91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類模型

新機器視覺 ? 來源:計算機系統(tǒng)應用 ? 作者:計算機系統(tǒng)應用 ? 2020-12-31 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

垃圾分類作為資源回收利用的重要環(huán)節(jié)之一, 可以有效地提高資源回收利用效率, 進一步減輕環(huán)境污染帶 來的危害。 隨著現(xiàn)代工業(yè)逐步智能化, 傳統(tǒng)的圖像分類算法已經(jīng)不能滿足垃圾分揀設備的要求。 本文提出一種基于 卷積神經(jīng)網(wǎng)絡的垃圾圖像分類模型 (Garbage Classification Network, GCNet)。 通過構建注意力機制, 模型完成局部 和全局的特征提取, 能夠獲取到更加完善、有效的特征信息; 同時, 通過特征融合機制, 將不同層級、尺寸的特征進 行融合, 更加有效地利用特征, 避免梯度消失現(xiàn)象。 實驗結果證明, GCNet 在相關垃圾分類數(shù)據(jù)集上取得了優(yōu)異的 結果, 能夠有效地提高垃圾識別精度。

1 引言

垃圾回收利用作為發(fā)展循環(huán)經(jīng)濟的必經(jīng)之路, 是 根治污染、提高環(huán)境治理效果的關鍵所在。 隨著我國 生產(chǎn)力水平的發(fā)展, 生活垃圾、工業(yè)垃圾數(shù)量不斷增 加, 困擾著很多城市。 據(jù)統(tǒng)計, 僅 2018 年, 中國垃圾的 清運量已經(jīng)達到了 2.28 億噸[1] 。 在人們將垃圾投放進垃圾箱之后, 垃圾被運送到垃圾處理廠統(tǒng)一處理。 當前 國內的垃圾處理廠, 更多依靠人工在流水線上作業(yè)去 分揀垃圾, 對作業(yè)者健康不利且分揀效率較低, 已不能 滿足大量垃圾處理需求。 此外, 人工分揀的垃圾種類極 為有限, 大部分垃圾無法重新回收利用, 造成很大浪費。 隨著深度學習技術的發(fā)展, 卷積神經(jīng)網(wǎng)絡使圖像分類 算法在精度和速度上得到了巨大的提升, 讓我們看到 了借助視覺技術自動分揀垃圾的可能性。 通過攝像頭 拍攝垃圾圖片, 利用卷積神經(jīng)網(wǎng)絡檢測出垃圾的類別, 之后就可以借助機械手或推板自動完成分揀任務, 可 以降低人工成本, 提高分揀效率。 因此, 開展垃圾圖像 分類算法的研究, 具有重要的應用價值。

2 相關工作

早期, 學者們只能借助經(jīng)典的圖像分類算法[2–5] 完 成垃圾圖像分類任務, 這要通過手動提取的圖像特征 并結合相應的分類器完成。 吳健等[6] 利用顏色和紋理 特征, 初步完成了廢物垃圾識別。 由于不同數(shù)據(jù)集的圖 像背景、尺寸、質量不盡相同, 傳統(tǒng)算法需要根據(jù)相應數(shù)據(jù)人工提取不同的特征, 算法的魯棒性較差, 并且 處理方式復雜, 所需時間較長, 無法達到實時的效果。 隨著卷積神經(jīng)網(wǎng)絡 (Convolution Neural Network, CNN) 的飛速發(fā)展, 深度學習廣泛應用于圖像識別領 域。

作為數(shù)據(jù)驅動的算法, CNN 具有強大的特征擬合 能力, 可以有效、自動地提取圖像特征, 并具有較快的 運行速度。 2012 年, AlexNet[7] 取得了 ImageNet 圖像分 類競賽的冠軍, 標志著深度學習的崛起。 隨后幾年, GoogleNet[8]、VGGNet[9]、ResNet[10] 等算法提升了圖像分類的精度, 并成功應用于人臉識別、車輛檢測等 多個領域。 垃圾圖像分類, 在深度學習算法的幫助下同 樣取得了較大的突破。

斯坦福大學的 Yang 等建立了 TrashNet Dataset 公開數(shù)據(jù)集, 包含 6 個類別, 共計 2527 張圖片。 Ozkaya 等[11] 通過對比不同 CNN 網(wǎng)絡的 分類能力, 搭建神經(jīng)網(wǎng)絡 (本文稱之為 TrashNet) 并進 行參數(shù)微調, 在數(shù)據(jù)集 TrashNet Dataset 上取得了 97.86% 的準確率, 是目前這一數(shù)據(jù)集上最佳分類網(wǎng)絡。 在非公開數(shù)據(jù)集方面, Mittal 等[12] 自制了 2561 張的垃圾圖片 數(shù)據(jù)集 GINI, 使用 GarbNet 模型, 得到了 87.69% 的準 確率。 國內方面, 鄭海龍等[13] 用 SVM 方法進行了建筑 垃圾分類方面的研究。 向偉等[14] 使用分類網(wǎng)絡 CaffeNet, 調整卷積核尺寸和網(wǎng)絡深度, 使其適用于水面垃圾分 類, 在其自制的 1500 張圖片數(shù)據(jù)集上取得了 95.75% 的識別率。 2019 年, 華為舉辦垃圾圖像分類競賽, 構建 了樣本容量為一萬余張的數(shù)據(jù)集, 進一步促進了該領 域的發(fā)展。

我國各地區(qū)生活垃圾分類標準有所不同, 大致可 分為可回收垃圾、有害垃圾、廚余垃圾和其他垃圾這 4 大類, 且每個類別下又包含若干子類別, 種類繁多且 十分復雜。 按照這樣的分類標準做的垃圾圖像識別研 究, 國內目前還處于起步階段。 現(xiàn)有的圖形分類算法在 垃圾處理領域的應用較少, 且存在準確率不足、泛化 性能差、處理效率低的缺點。 針對現(xiàn)有方法的不足, 本 文提出一種基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類算法 (Garbage Classification Net, GCNet), 在網(wǎng)絡結構中融合 了注意力機制模塊與特征融合模塊, 提高了模型在垃 圾分類任務上的準確性與魯棒性。

3 算法設計

3.1 模型結構

本文構建的 GCNet 模型包括特征提取器、分類 器兩部分, 整體結構如圖 1 所示。 圖中特征提取器由 Resnet101 作為主干部分, 共包括 5 個 bottleneck, 并在 不同的 bottleneck 后加入注意力機制模塊, 同時對不同 模塊提取到的特征進行特征融合 (如圖 1 中虛線所示) 以從輸入 中提取圖像的特征信息 :

其中, Me表示特征提取器。 F1 yi 分類器由兩層全連接層和一個 Softmax 分類器組 成, 對提取到的特征信息 進行分類, 以得到圖像在每 個類別下的最終得分 :

其中, Mc表示分類器。

3.2 注意力機制

注意力機制源于對人類視覺的研究, 人類會根據(jù) 實際需要選擇視網(wǎng)膜內特定區(qū)域進行集中關注, 可以 將有限的處理資源分配至重要的部分。 由于相同類別 垃圾的特征表征差異性可能較大, 不利于圖片的正確 分類, 這就要求準確地關注圖像中的顯著區(qū)域。 受這一 思想的啟發(fā), 通過構建注意力機制模塊, 使網(wǎng)絡模型重 點關注有利于分類的特征區(qū)域, 以實現(xiàn)更好的特征提 取功能, 其具體結構如圖 2 所示。

5 結論

本文針對垃圾圖像分類問題, 構建了一種基于卷 積神經(jīng)網(wǎng)絡的算法 GCNet, 該網(wǎng)絡通過構建注意力機 制和特征融合機制, 能夠有效地提取圖像特征、降低 類別差異性帶來的影響, 并在相關數(shù)據(jù)集上取得了 96.73% 的平均準確率, 相較于現(xiàn)有的分類算法提升了 約 4% 的準確率, 滿足了實際的應用需求, 具有良好的 應用前景。

原文標題:基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類算法

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:基于卷積神經(jīng)網(wǎng)絡的垃圾圖像分類算法

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經(jīng)網(wǎng)絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經(jīng)網(wǎng)絡的實現(xiàn)。什么是神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡的核心思想是模仿生物神經(jīng)系統(tǒng)的結構,特別是大腦中神經(jīng)
    的頭像 發(fā)表于 12-17 15:05 ?333次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的初步認識

    自動駕駛中常提的卷積神經(jīng)網(wǎng)絡是個啥?

    在自動駕駛領域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡技術。卷積神經(jīng)網(wǎng)絡,簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學習
    的頭像 發(fā)表于 11-19 18:15 ?2078次閱讀
    自動駕駛中常提的<b class='flag-5'>卷積</b><b class='flag-5'>神經(jīng)網(wǎng)絡</b>是個啥?

    CNN卷積神經(jīng)網(wǎng)絡設計原理及在MCU200T上仿真測試

    CNN算法簡介 我們硬件加速器的模型為Lenet-5的變型,網(wǎng)絡粗略分共有7層,細分共有13層。包括卷積,最大池化層,激活層,扁平層,全連接層。下面是各層作用介紹: 卷積層:提取
    發(fā)表于 10-29 07:49

    NMSISI庫的使用

    :   神經(jīng)網(wǎng)絡卷積函數(shù)   神經(jīng)網(wǎng)絡激活函數(shù)   全連接層函數(shù)   神經(jīng)網(wǎng)絡池化函數(shù)   Softmax 函數(shù)   神經(jīng)網(wǎng)絡支持功能
    發(fā)表于 10-29 07:07

    NMSIS神經(jīng)網(wǎng)絡庫使用介紹

    :   神經(jīng)網(wǎng)絡卷積函數(shù)   神經(jīng)網(wǎng)絡激活函數(shù)   全連接層函數(shù)   神經(jīng)網(wǎng)絡池化函數(shù)   Softmax 函數(shù)   神經(jīng)網(wǎng)絡支持功能
    發(fā)表于 10-29 06:08

    構建CNN網(wǎng)絡模型并優(yōu)化的一般化建議

    整個模型非常巨大。所以要想實現(xiàn)輕量級的CNN神經(jīng)網(wǎng)絡模型,首先應該避免嘗試單層神經(jīng)網(wǎng)絡。 2)減少卷積核的大?。篊NN
    發(fā)表于 10-28 08:02

    卷積運算分析

    的數(shù)據(jù),故設計了ConvUnit模塊實現(xiàn)單個感受域規(guī)模的卷積運算. 卷積運算:不同于數(shù)學當中提及到的卷積概念,CNN神經(jīng)網(wǎng)絡中的卷積嚴格意義
    發(fā)表于 10-28 07:31

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    , batch_size=512, epochs=20)總結 這個核心算法中的卷積神經(jīng)網(wǎng)絡結構和訓練過程,是用來對MNIST手寫數(shù)字圖像進行分類的。
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡部署相關操作

    讀取。接下來需要使用擴展指令,完成神經(jīng)網(wǎng)絡的部署,此處僅對第一層卷積+池化的部署進行說明,其余層與之類似。 1.使用 Custom_Dtrans 指令,將權重數(shù)據(jù)、輸入數(shù)據(jù)導入硬件加速器內。對于權重
    發(fā)表于 10-20 08:00

    基于神經(jīng)網(wǎng)絡的數(shù)字預失真模型解決方案

    在基于神經(jīng)網(wǎng)絡的數(shù)字預失真(DPD)模型中,使用不同的激活函數(shù)對整個系統(tǒng)性能和能效有何影響?
    的頭像 發(fā)表于 08-29 14:01 ?3472次閱讀

    卷積神經(jīng)網(wǎng)絡如何監(jiān)測皮帶堵料情況 #人工智能

    卷積神經(jīng)網(wǎng)絡
    jf_60804796
    發(fā)布于 :2025年07月01日 17:08:42

    無刷電機小波神經(jīng)網(wǎng)絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了一個以三相相電壓為輸人,轉角為輸出的小波神經(jīng)網(wǎng)絡來實現(xiàn)轉角預測,并采用改進遺傳算法來訓練網(wǎng)絡結構與參數(shù),借助
    發(fā)表于 06-25 13:06

    基于FPGA搭建神經(jīng)網(wǎng)絡的步驟解析

    本文的目的是在一個神經(jīng)網(wǎng)絡已經(jīng)通過python或者MATLAB訓練好的神經(jīng)網(wǎng)絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe
    的頭像 發(fā)表于 06-03 15:51 ?1217次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的步驟解析

    在友晶LabCloud平臺上使用PipeCNN實現(xiàn)ImageNet圖像分類

    利用深度卷積神經(jīng)網(wǎng)絡(CNN)進行圖像分類是通過使用多個卷積層來從輸入數(shù)據(jù)中提取特征,最后通過分類
    的頭像 發(fā)表于 04-23 09:42 ?1083次閱讀
    在友晶LabCloud平臺上使用PipeCNN實現(xiàn)ImageNet<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>

    自動駕駛感知系統(tǒng)中卷積神經(jīng)網(wǎng)絡原理的疑點分析

    背景 卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks, CNN)的核心技術主要包括以下幾個方面:局部連接、權值共享、多卷積核以及池化。這些技術共同作用,使得CNN在
    的頭像 發(fā)表于 04-07 09:15 ?850次閱讀
    自動駕駛感知系統(tǒng)中<b class='flag-5'>卷積</b><b class='flag-5'>神經(jīng)網(wǎng)絡</b>原理的疑點分析