91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

CNN結構基本情況

新機器視覺 ? 來源:人工智能感知信息處理算 ? 作者:人工智能感知信息 ? 2022-07-05 11:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學習機器學習算法研究中新開辟的研究方向,在圖像領域的應用是最開始的嘗試。近年以來,計算機視覺領域和 CNN 網(wǎng)絡結構的不斷更新發(fā)展,出現(xiàn)了一批代表性的深度卷積神經(jīng)網(wǎng)絡。本章節(jié)主要介紹目標檢測算法 YOLO 系列借鑒了設計思想的這些框架,分別是:Le Net、Alex Net、VGG、Goog Le Net和 Res Net。表 1 所示,介紹了代表性的 CNN 結構基本情況。

a240625c-fc14-11ec-ba43-dac502259ad0.png

1 LeNet

LeNet 卷積神經(jīng)網(wǎng)絡是由深度學習三巨頭之一的 Yan Le Cun于 1994 年提出來的。其對構建的 MNIST手寫字符數(shù)據(jù)集進行分類。LeNet 的提出確立了 CNN 的基本網(wǎng)絡架構。如下圖所示,Le Net 通過輸入32 ×32 字符矩陣經(jīng)過卷積層、下采樣層、全連接層進行圖像的分類識別。但因為當時硬件技術的局限性和訓練數(shù)據(jù)的不豐富性,Le Net 模型的運算效果并不是特別突出,但此特征網(wǎng)絡的提出,為后續(xù) Alex Net 的出現(xiàn)提供了重要的參考。

a2548bce-fc14-11ec-ba43-dac502259ad0.png

2 Alex Net

Alex Net的出現(xiàn),標志著深度卷積神經(jīng)網(wǎng)絡開啟了創(chuàng)新的新時代。之前由于硬件技術的局限性,CNN的學習能力、圖像分類能力有限,而在 2012 年提出的卷積神經(jīng)網(wǎng)絡 Alex Net 采用了兩個 GPU(NVIDIA GTX 580)來訓練模型,然后將兩個 GPU 上的特征圖進行合并,采用的數(shù)據(jù)集是 Image Net(1500 多萬個標記的圖像,2.2萬個類別),并在2012 ILSVRC大賽以優(yōu)異的性能在計算機視覺領域展現(xiàn)了自己的實力。如圖下圖所示,Alex Net 的網(wǎng)絡結構包括 5 層卷積、3 層池化和 3 層全連接,特征提取能力得到了提高,對大規(guī)模的數(shù)據(jù)集有更好的擬合能力。并且,在訓練階段,通過在模型隨機的添加幾個轉換單元來確保網(wǎng)絡具有較好的魯棒性。其結構創(chuàng)新的要點為:

(1)使用 Re LU 作為非線性激活函數(shù),減少梯度消失現(xiàn)象,提高收斂率,減少訓練時間。

(2)使用大尺寸卷積核(5×5和11×11),提高網(wǎng)絡感受野。 (3)加入 Drop Out 層抑制過擬合。 (4)使用數(shù)據(jù)增強技術,對圖像進行訓練時,隨機的添加平移縮放、裁剪旋轉、翻轉或增減亮度等操作,產(chǎn)生一系列和輸入圖像相似但又不相同的數(shù)據(jù),從而擴充了訓練的數(shù)據(jù)集。

a29573b4-fc14-11ec-ba43-dac502259ad0.png

3 VGG

VGG(Visual Geometry Group)多層網(wǎng)絡模型,比 Alex Net 和 Zef Net 的深度多了 19 層,驗證了在網(wǎng)絡結構上增加深度可以直接影響模型性能。VGG 有兩種結構,分為 VGG16 和 VGG19,這二者的區(qū)別只在于網(wǎng)路深度不同。VGG 的設計思想是增加網(wǎng)絡深度,改用小尺寸的卷積核。如下圖所示,具體操作為:采用 3 個3×3 卷積核來替換 Alex Net 中的 7×7 卷積核,采用 2 個3×3 卷積核替換5×5卷積核,這樣的設計可以在保證具有相同感受野的前提下,增加網(wǎng)絡深度,提升模型效果,且改用小的3×3 Filters 可減少模型參數(shù)量和運算量,可以更好地保留圖像特征信息。具體的改進優(yōu)點總結為以下幾點:

(1)采用3×3 小濾波器替換大尺寸卷積核

(2)替換卷積核后,卷積層的感受野相同

(3)每層卷積操作后通過 Re LU 激活函數(shù)和批處理梯度下降訓練

(4)驗證了增加網(wǎng)絡深度,可以提升模型性能 雖然,VGG 在 2014 年因其更深的網(wǎng)絡結構和計算低復雜度的優(yōu)勢,使其在圖像分類和定位問題上取得了很好地成績,但它使用了 1.4 億個參數(shù),計算量很大,這是它的不足之處。

a2b9b706-fc14-11ec-ba43-dac502259ad0.png

4 Goog Le Net

Goog Le Net是由 Google 提出的,獲得了 Image Net 大賽冠軍。其架構設計的核心是在保證高水準的精確性 Inception 的目標前提下,降低模型的計算成本。與 VGG 相比,Goog Le Net 是一個網(wǎng)絡深度為 22 層的卷積神經(jīng)網(wǎng)絡,它不以傳統(tǒng) CNN 卷積層的串聯(lián)堆疊為架構基礎,而是創(chuàng)新的提出了 Inception 結構,用NIN(Networkin-Network)替換普通卷積層。如下圖所示,該結構包含了 5×5 、 3×3 、1×1 濾波器,以便于在不同空間分辨率范圍內(nèi)捕捉通道信息和空間特征,添加一個1×1濾波器,作為 Bottle Neck ,來提高網(wǎng)絡的效率,提升模型學習特征的能力。使用平均池化層代替全連接層,將 7×7×1024 的體積降到了 1×1×1024 ,減少了大量的參數(shù)。此外,Goog Le Net 還提出了輔助分類器 Soft Max,以加快收斂速度。但 Goog Le Net 也有短板,其表征堵塞會減少下一層的特征空間,反過來又可能會丟失有用的特征。

a2e83680-fc14-11ec-ba43-dac502259ad0.png

5 Res Net

Res Net(Residual Network)殘差網(wǎng)絡是 Kaiming He提出來的,并在 2015 ILSVRC 大賽以 3.57%的錯誤率獲得了冠軍。在之前的網(wǎng)絡中,當模型深度不夠,其網(wǎng)絡識別能力不強,但當網(wǎng)絡堆疊(Plain Network)很深的時候,網(wǎng)絡梯度消失和梯度彌散現(xiàn)象明顯,導致模型的運算效果卻不升反降。因此,鑒于此深層網(wǎng)絡的退化問題,Res Net 設計了一個不存在梯度消失問題的超深度網(wǎng)絡。Res Net 根據(jù)層數(shù)的不同,從 18 層到 1202 層,有多種類型。以 Res Net50 為例,它由 49 個卷積層和 1 個全連接層組成,如下圖所示。這種簡單的加法并不會給網(wǎng)絡增加額外的參數(shù)和計算量,同時卻可以大大增加模型的訓練速度、提高訓練效果,并且當模型的層數(shù)加深時,這個簡單的結構能夠很好的解決退化問題。Res Net 提出了短徑連接,當網(wǎng)絡性能已達到最優(yōu),繼續(xù)加深網(wǎng)絡,殘差映射將被設置為 0,只剩下恒等映射,加速網(wǎng)絡收斂,這樣就可以使得網(wǎng)絡一直處于最優(yōu)狀態(tài)了,網(wǎng)絡的性能也就不會隨著深度增加而降低了。

a319b21e-fc14-11ec-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:圖像分類模型的發(fā)展

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    知識分享:產(chǎn)品的結構構架與EMC

    知識分享:產(chǎn)品的結構構架與EMC結構是產(chǎn)品的重要組成部分,結構不能單獨成為EMC問題的來源,但卻是解決EMC問題的重要途徑。電磁場屏蔽、良好的接地系統(tǒng)以及耦合的避免都要借助于良好的結構
    的頭像 發(fā)表于 01-19 17:07 ?1373次閱讀
    知識分享:產(chǎn)品的<b class='flag-5'>結構</b>構架與EMC

    結構體聲明與定義

    1、聲明 結構體的聲明使用struct關鍵字,如果我們想要把我們的學籍信息組織一下的話,可以這樣表示: struct Info { unsigned long identifier;//學號
    發(fā)表于 12-11 07:52

    typedef結構體使用

    雖然結構體的出現(xiàn)能夠讓我們有一個更科學的數(shù)據(jù)結構來管理數(shù)據(jù),但是每次使用結構體都需要struct...,未免顯得有些冗長和麻煩。有了typedef的助攻,我們就可以很輕松地給結構體類型
    發(fā)表于 12-08 07:04

    控制結構介紹

    1. 順序結構:按照代碼的書寫順序,逐行執(zhí)行程序。這是最基本的程序結構。 2. 選擇結構:根據(jù)條件判斷的結果,選擇執(zhí)行不同的代碼塊。常見的選擇結構有if語句和switch語句。 3
    發(fā)表于 11-24 06:43

    C語言結構體使用

    有時候需要將不同類型的數(shù)據(jù)組合為一個整體,以便于引用。例如,一名學生有學號、姓名、性別、年齡等屬性,如果針對每個屬性都單獨定義一個變量,那么當有多名學生時變量就難以分清。結構體就是用來管理不同類
    發(fā)表于 11-12 08:30

    CNN卷積神經(jīng)網(wǎng)絡設計原理及在MCU200T上仿真測試

    CNN算法簡介 我們硬件加速器的模型為Lenet-5的變型,網(wǎng)絡粗略分共有7層,細分共有13層。包括卷積,最大池化層,激活層,扁平層,全連接層。下面是各層作用介紹: 卷積層:提取特征。“不全
    發(fā)表于 10-29 07:49

    構建CNN網(wǎng)絡模型并優(yōu)化的一般化建議

    通過實踐,本文總結了構建CNN網(wǎng)絡模型并優(yōu)化的一般化建議,這些建議將會在構建高準確率輕量級CNN神經(jīng)網(wǎng)絡模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡:我們清楚神經(jīng)網(wǎng)絡本身是需要不斷抽象出更高級別的紋理
    發(fā)表于 10-28 08:02

    淘寶圖片搜索接口開發(fā)實戰(zhàn):從 CNN 特征提取到商品匹配(附避坑手冊 + 可復用代碼)

    本文詳解淘寶圖片搜索接口開發(fā)全流程,涵蓋CNN特征提取、商品匹配、參數(shù)配置及400/429等高頻報錯解決方案,附合規(guī)避坑指南與可復用代碼,助你高效實現(xiàn)圖像搜商品功能。
    的頭像 發(fā)表于 10-21 10:03 ?543次閱讀

    定義IO初始化結構

    由上述IOPORT相關功能的枚舉類型我們可以知道,在對IOPORT模塊進行初始化時需要根據(jù)情況配置它們。因此我們定義一個IOPORT初始化的結構體類型IOPORT_Init_t,它的成員包括了由上述所有枚舉類型所聲明的變量,因此該結構
    的頭像 發(fā)表于 07-16 16:26 ?1413次閱讀

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第四階段

    接第三階段,上次說道要將cnn這個模塊接入到高云自帶的視頻實例里面,于是就開始學習和了解這個實例里面的每個模塊的功能,后來發(fā)現(xiàn),除了要看一下高云自己的ip文檔外,還要看很多視頻處理相關的協(xié)議文檔
    發(fā)表于 07-12 07:58

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第三階段

    接上回,這次說一說第三階段的進展,一直在想如何將cnn融合進高云以后的視頻案例里面,比如:下圖 上面圖中文件之間的關系應該是這樣的: 一、 完整的視頻數(shù)據(jù)處理流程 根據(jù)這些文件名,我們可以清晰地勾勒
    發(fā)表于 07-06 15:18

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第二階段

    接上次的想法,糾結在繼續(xù)用CNN還是yolo的時候,隨著對這方面資料的不斷了解,發(fā)現(xiàn)還是CNN這個結構比較基礎,yolo要做的工作非常多,而且要求比較高,時間會比較長。 于是我就借助B站平臺,跟著子
    發(fā)表于 06-23 18:37

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別

    。 `clahe.py 但是上面的代碼和相關的邏輯暫時就停在這里了。 后來又過了幾天,嘗試一些有關cnn的實現(xiàn)。 記得在綜合的時候要將這個文件里面的模塊名替換一下: 上面雖然綜合通過,但是還有一些警告。后面有時間的話
    發(fā)表于 06-11 22:35

    OCAD應用:單透鏡與雙膠合透鏡結構組合設計

    n之間的對應關系。 有些系統(tǒng)因外形尺寸或像差分配要求的原因,一個單獨的單透鏡或雙膠合透鏡無法滿足要求,必須進一步對結構要做復雜化處理,必須使用多透鏡組合。在這種情況下由一個單透鏡和一個雙膠合透鏡的組合
    發(fā)表于 06-06 08:55

    開關電源拓撲結構介紹

    PUSH-PULL 推挽電路HALF BRIDGE 半橋電路FULL BRIDGE 全橋電路SEPIC 電路 二、拓撲結構介紹(一)BUCK 降壓電路 在不考慮帶有寄生參數(shù)的RLGC模型的情況下,一般我們的計算步驟
    發(fā)表于 05-12 16:04