91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工神經(jīng)網(wǎng)絡(luò)中語(yǔ)音分析與圖像識(shí)別的研究

0BFC_eet_china ? 來(lái)源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-09-27 14:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是人工神經(jīng)網(wǎng)絡(luò)的一種,是當(dāng)下語(yǔ)音分析和圖像識(shí)別領(lǐng)域的研究熱點(diǎn)。

這篇文章用最簡(jiǎn)明的語(yǔ)言和最直觀的圖像,帶你入門(mén)CNN。準(zhǔn)備好了嗎?Let’s go——

我們先從最基礎(chǔ)的內(nèi)容說(shuō)起。

對(duì)二維數(shù)字信號(hào)(圖像)的操作,可以寫(xiě)成矩陣形式。

比如對(duì)圖像做平滑,一個(gè)典型的8領(lǐng)域平滑,其結(jié)果中的每個(gè)值都來(lái)源于原對(duì)應(yīng)位置和其周邊8個(gè)元素與一個(gè)3X3矩陣的乘積:

也就相當(dāng)于對(duì)原矩陣,按照順序?qū)⒏鲄^(qū)域元素與W矩陣相乘,W 矩陣為:

這也被稱作核(Kernel, 3X3)

其處理效果如下:

也就是,這個(gè)核對(duì)圖像進(jìn)行操作,相當(dāng)于對(duì)圖像進(jìn)行了低通濾波。因此這個(gè)核也被稱為濾波器,整個(gè)操作過(guò)程按照概念稱為卷積。

擴(kuò)展來(lái)講,對(duì)二維圖像的濾波操作可以寫(xiě)成卷積,比如常見(jiàn)的高斯濾波、拉普拉斯濾波(算子)等。

濾波器跟卷積神經(jīng)網(wǎng)絡(luò)有什么關(guān)系呢。不如我們預(yù)想一個(gè)識(shí)別問(wèn)題:我們要識(shí)別圖像中的某種特定曲線,也就是說(shuō),這個(gè)濾波器要對(duì)這種曲線有很高的輸出,對(duì)其他形狀則輸出很低,這也就像是神經(jīng)元的激活

我們?cè)O(shè)計(jì)的濾波器和想要識(shí)別的曲線如下:

假設(shè)上面的核(濾波器)按照卷積順序沿著下圖移動(dòng):

那么當(dāng)它移動(dòng)到上面的位置時(shí),按照矩陣操作,將這個(gè)區(qū)域的圖像像素值與濾波器相乘,我們得到一個(gè)很大的值(6600):

而當(dāng)這個(gè)濾波器移動(dòng)到其他區(qū)域時(shí),我們得到一個(gè)相對(duì)很小的值:

如此,我們對(duì)整個(gè)原圖進(jìn)行一次卷積,得到的結(jié)果中,在那個(gè)特定曲線和周邊區(qū)域,值就很高,在其他區(qū)域,值相對(duì)低。這就是一張激活圖。對(duì)應(yīng)的高值區(qū)域就是我們所要檢測(cè)曲線的位置。

在訓(xùn)練卷積審計(jì)網(wǎng)絡(luò)(CNN)的某一個(gè)卷積層時(shí),我們實(shí)際上是在訓(xùn)練一系列的濾波器(filter)。比如,對(duì)于一個(gè)32x32x3(寬32像素x高32像素xRGB三通道)的圖像,如果我們?cè)贑NN的第一個(gè)卷積層定義訓(xùn)練12個(gè)濾波器,那就這一層的輸出便是32X32X12.按照不同的任務(wù),我們可以對(duì)這個(gè)輸出做進(jìn)一步的處理,這包括激活函數(shù),池化,全連接等。

簡(jiǎn)單來(lái)說(shuō),訓(xùn)練CNN在相當(dāng)意義上是在訓(xùn)練每一個(gè)卷積層的濾波器。讓這些濾波器組對(duì)特定的模式有高的激活,以達(dá)到CNN網(wǎng)絡(luò)的分類/檢測(cè)等目的。

一個(gè)實(shí)際CNN(AlexNet)第一個(gè)卷積層的濾波器>

卷積神經(jīng)網(wǎng)絡(luò)的第一個(gè)卷積層的濾波器用來(lái)檢測(cè)低階特征,比如邊、角、曲線等。隨著卷積層的增加,對(duì)應(yīng)濾波器檢測(cè)的特征就更加復(fù)雜(理性情況下,也是我們想要的情況)。

比如第二個(gè)卷積層的輸入實(shí)際上是第一層的輸出(濾波器激活圖),這一層的濾波器便是用來(lái)檢測(cè)低價(jià)特征的組合等情況(半圓、四邊形等),如此累積,以檢測(cè)越來(lái)越復(fù)雜的特征。實(shí)際上,我們的人類大腦的視覺(jué)信息處理也遵循這樣的低階特征到高階特征的模式。

可參考之前文章《為什么無(wú)彩色系(黑白灰色)在色彩搭配中可以和諧地與任何彩色搭配?》:https://www.zhihu.com/question/27380522/answer/36794240

最后一層的濾波器按照訓(xùn)練CNN目的的不同,可能是在檢測(cè)到人臉、手寫(xiě)字體等時(shí)候激活[1]。

所以,在相當(dāng)程度上,構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)的任務(wù)就在于構(gòu)建這些濾波器。也就是,將這些濾波器變成這樣(改變?yōu)V波器矩陣的值,也就是Weight)的——能識(shí)別特定的特征。這個(gè)過(guò)程叫做訓(xùn)練。

在訓(xùn)練開(kāi)始之時(shí),卷積層的濾波器是完全隨機(jī)的,它們不會(huì)對(duì)任何特征激活(不能檢測(cè)任何特征)。這就像剛出生的孩子,TA不知道什么是人臉、什么是狗,什么是上下左右。

TA需要學(xué)習(xí)才知道這些概念,也就是通過(guò)接觸人臉、狗、上下左右,并被告知這些東西分別是人臉、狗、上下左右。然后TA才能在頭腦中記住這些概念,并在之后的某一次見(jiàn)到之后能準(zhǔn)確的給出結(jié)果。

把一個(gè)空白的濾波其,修改其權(quán)重(weights)以使它能檢測(cè)特定的模式,整個(gè)過(guò)程就如工程里面的反饋。

想想一下,如果有一只無(wú)意識(shí)的猴子,完全隨機(jī)的修改一個(gè)5X5濾波器矩陣的25個(gè)值,那完全可能經(jīng)過(guò)一定的輪次之后,這個(gè)濾波器能夠檢測(cè)棱角等特征。這是一種無(wú)反饋的訓(xùn)練情況。對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練當(dāng)然不能如此,我們不可能靠運(yùn)氣去做這件事情。

舉個(gè)例子,我們要訓(xùn)練一個(gè)用于分類的神經(jīng)網(wǎng)絡(luò),讓它能判定輸入圖像中的物體最可能是十個(gè)類別的哪一類。那么,訓(xùn)練過(guò)程就是這樣的:

第一次訓(xùn)練,輸入一張圖像,這個(gè)圖像通過(guò)各層卷積處理輸出量一組向量[1,1,1,1,1,1,1,1,1,1], 也就是,對(duì)于完全由隨機(jī)濾波器構(gòu)建的網(wǎng)絡(luò),其輸出認(rèn)為這張圖等概率的是十個(gè)類別中的某一種。

但是對(duì)于訓(xùn)練,我們有一個(gè)Gound Thuth, 也就是這張圖中物體所屬的類別:[0,0,1,0,0,0,0,0,0,0],也就是屬于第三類。這時(shí)候我們可以定義一個(gè)損失函數(shù),比如常見(jiàn)的MSE(mean squared error)。

我們假定L是這個(gè)損失函數(shù)的輸出。這時(shí)候我們的目的就是,讓L的值反饋(這種神經(jīng)網(wǎng)絡(luò)概念下稱為 back propagation, 反向傳輸)給整個(gè)卷積神經(jīng)網(wǎng)絡(luò),以修改各個(gè)濾波器的權(quán)重,使得損失值L最小。

這是一個(gè)典型的最優(yōu)化問(wèn)題。當(dāng)然地,在工程上我們幾乎不可能一次就把濾波器的權(quán)重W修改到使L最小的情況,而是需要多次訓(xùn)練和多次修改。

如果情況理想的話,權(quán)重修改的方向是使得L的變化收斂的。這也就是說(shuō)很可能達(dá)到了我們訓(xùn)練這個(gè)神經(jīng)網(wǎng)絡(luò)的目的——讓各個(gè)卷積層的濾波器能夠組合起來(lái)最優(yōu)化的檢測(cè)特定的模式。

參考文獻(xiàn)

[1] Zeiler, M. D., & Fergus, R. (2014, September). Visualizing and understanding convolutional networks. In European conference on computer vision (pp. 818-833). Springer, Cham.

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107915
  • 圖像識(shí)別
    +關(guān)注

    關(guān)注

    9

    文章

    534

    瀏覽量

    40091
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50134

    瀏覽量

    265747

原文標(biāo)題:給你一個(gè)卷積神經(jīng)網(wǎng)絡(luò)工作原理最直觀的解釋

文章出處:【微信號(hào):eet-china,微信公眾號(hào):電子工程專輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)

    日常生活的智能應(yīng)用都離不開(kāi)深度學(xué)習(xí),而深度學(xué)習(xí)則依賴于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大
    的頭像 發(fā)表于 12-17 15:05 ?350次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識(shí)

    自動(dòng)駕駛中常提的卷積神經(jīng)網(wǎng)絡(luò)是個(gè)啥?

    在自動(dòng)駕駛領(lǐng)域,經(jīng)常會(huì)聽(tīng)到卷積神經(jīng)網(wǎng)絡(luò)技術(shù)。卷積神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱為CNN,是一種專門(mén)用來(lái)處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學(xué)習(xí)模型。CNN在圖像處理
    的頭像 發(fā)表于 11-19 18:15 ?2104次閱讀
    自動(dòng)駕駛中常提的卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>是個(gè)啥?

    NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹

    NMSIS NN 軟件庫(kù)是一組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)的性能并最??大限度地減少其內(nèi)存占用。 該庫(kù)分為多個(gè)功能,每個(gè)功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    整個(gè)模型非常巨大。所以要想實(shí)現(xiàn)輕量級(jí)的CNN神經(jīng)網(wǎng)絡(luò)模型,首先應(yīng)該避免嘗試單層神經(jīng)網(wǎng)絡(luò)。 2)減少卷積核的大小:CNN神經(jīng)網(wǎng)絡(luò)是通過(guò)權(quán)值共享的方式,利用卷積運(yùn)算從圖像中提取線性紋理。
    發(fā)表于 10-28 08:02

    在Ubuntu20.04系統(tǒng)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    本帖欲分享在Ubuntu20.04系統(tǒng)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)。我們采用jupyter notebook作為開(kāi)發(fā)IDE,以TensorFlow2為訓(xùn)練框架,目標(biāo)是訓(xùn)練一個(gè)手寫(xiě)數(shù)字識(shí)別的神經(jīng)
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡(luò)部署相關(guān)操作

    在完成神經(jīng)網(wǎng)絡(luò)量化后,需要將神經(jīng)網(wǎng)絡(luò)部署到硬件加速器上。首先需要將所有權(quán)重?cái)?shù)據(jù)以及輸入數(shù)據(jù)導(dǎo)入到存儲(chǔ)器內(nèi)。 在仿真環(huán)境下,可將其存于一個(gè)文件,并在 Verilog 代碼通過(guò) readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(luò)(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的神經(jīng)網(wǎng)絡(luò)

    1.算法簡(jiǎn)介液態(tài)神經(jīng)網(wǎng)絡(luò)(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡(luò)架構(gòu),其設(shè)計(jì)理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲(chóng)的神經(jīng)結(jié)構(gòu),盡管這種微生物的
    的頭像 發(fā)表于 09-28 10:03 ?1300次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>(LNN):時(shí)間連續(xù)性與動(dòng)態(tài)適應(yīng)性的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    神經(jīng)網(wǎng)絡(luò)的并行計(jì)算與加速技術(shù)

    問(wèn)題。因此,并行計(jì)算與加速技術(shù)在神經(jīng)網(wǎng)絡(luò)研究和應(yīng)用變得至關(guān)重要,它們能夠顯著提升神經(jīng)網(wǎng)絡(luò)的性能和效率,滿足實(shí)際應(yīng)用對(duì)快速響應(yīng)和大規(guī)模數(shù)據(jù)
    的頭像 發(fā)表于 09-17 13:31 ?1171次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的并行計(jì)算與加速技術(shù)

    【嘉楠堪智K230開(kāi)發(fā)板試用體驗(yàn)】01 Studio K230開(kāi)發(fā)板Test2——手掌,手勢(shì)檢測(cè),字符檢測(cè)

    這篇發(fā)完就繼續(xù)去整比賽了,后續(xù)看電賽上k230的發(fā)揮吧 之前的顏色識(shí)別和二維碼識(shí)別功能,類似于使用基礎(chǔ)工具進(jìn)行圖像分析,適用于簡(jiǎn)單任務(wù),但在復(fù)雜場(chǎng)景下能力有限。 KPU(
    發(fā)表于 07-10 09:45

    無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究

    MATLAB/SIMULINK工具對(duì)該方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該方法在全程速度下效果良好。 純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究.pdf
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機(jī)故障診斷的應(yīng)用

    的診斷誤差。仿真結(jié)果驗(yàn)證了該算法的有效性。 純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)在電機(jī)故障診斷的應(yīng)用.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)的仿真研究

    ,在一定程度上擴(kuò)展了轉(zhuǎn)速估計(jì)范圍。 純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:神經(jīng)網(wǎng)絡(luò)RAS在異步電機(jī)轉(zhuǎn)速估計(jì)的仿真研究.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者
    發(fā)表于 06-16 21:54

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    。 開(kāi)發(fā)板支持浮點(diǎn)運(yùn)算,這對(duì)于語(yǔ)音信號(hào)處理的精確計(jì)算至關(guān)重要。在語(yǔ)音識(shí)別過(guò)程中,需要對(duì)語(yǔ)音信號(hào)的頻率、幅度等參數(shù)進(jìn)行精確計(jì)算和
    發(fā)表于 05-28 11:36

    AI神經(jīng)網(wǎng)絡(luò)降噪算法在語(yǔ)音通話產(chǎn)品的應(yīng)用優(yōu)勢(shì)與前景分析

    隨著人工智能技術(shù)的快速發(fā)展,AI神經(jīng)網(wǎng)絡(luò)降噪算法在語(yǔ)音通話產(chǎn)品的應(yīng)用正逐步取代傳統(tǒng)降噪技術(shù),成為提升語(yǔ)音質(zhì)量的關(guān)鍵解決方案。相比傳統(tǒng)DSP
    的頭像 發(fā)表于 05-16 17:07 ?1562次閱讀
    AI<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>降噪算法在<b class='flag-5'>語(yǔ)音</b>通話產(chǎn)品<b class='flag-5'>中</b>的應(yīng)用優(yōu)勢(shì)與前景<b class='flag-5'>分析</b>

    自動(dòng)駕駛感知系統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)原理的疑點(diǎn)分析

    語(yǔ)音識(shí)別等領(lǐng)域取得了顯著成就,并廣泛用于車(chē)輛自動(dòng)駕駛的圖像目標(biāo)識(shí)別。 1.局部連接:CNN通過(guò)局部連接的方式減少了
    的頭像 發(fā)表于 04-07 09:15 ?870次閱讀
    自動(dòng)駕駛感知系統(tǒng)<b class='flag-5'>中</b>卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>原理的疑點(diǎn)<b class='flag-5'>分析</b>