91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在神經(jīng)網(wǎng)絡中表示部分-整體層次結(jié)構(gòu)

深度學習自然語言處理 ? 來源:AI科技評論 ? 作者:AI科技評論 ? 2021-03-05 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Twitter 上發(fā)現(xiàn)了一篇Hinton的新論文,作者只有Hinton本人,這篇論文沒有介紹具體的算法,而是描繪了一個關(guān)于表示的宏觀構(gòu)想:如何在神經(jīng)網(wǎng)絡中表示部分-整體層次結(jié)構(gòu)。

AI科技評論在Twitter 上發(fā)現(xiàn)了一篇Hinton的新論文,作者只有Hinton本人,這篇論文沒有介紹具體的算法,而是描繪了一個關(guān)于表示的宏觀構(gòu)想:如何在神經(jīng)網(wǎng)絡中表示部分-整體層次結(jié)構(gòu)。

值得一提的是,分享論文的Kosta Derpanis也在推特里介紹了Hinton的第一篇論文:“Using Relaxation To Find A Puppy”。Kosta Derpanis在論文里標記了一句話:“局部的模糊性必須必須通過尋找最佳的全局解釋來解決?!辈⒈硎?,Hinton現(xiàn)在又回到了最初的起點。

Hinton第一篇論文:https://www.cs.toronto.edu/~hinton/absps/puppet.pdf

局部和整體的一致性表示似乎一直是Hinton的研究重點。比如,膠囊網(wǎng)絡通過局部到整體的動態(tài)路徑選擇一致性來學習識別,近期Hinton還將其擴展到了無監(jiān)督學習,并應用了Transformer架構(gòu);對比學習則學習一種表示,使得同一幅圖像的的各個局部具有相似的表示;認知神經(jīng)科學出身的Hinton還一直堅持探索著大腦的學習機制,比如back relaxation試圖在自頂向下表示和自底向上表示之間產(chǎn)生一致性,而這又和對比學習有聯(lián)系。

在這篇新論文中,Hinton又將為我們描繪出怎樣一幅圖景呢?

論文鏈接:https://arxiv.org/pdf/2102.12627.pdf

這篇論文沒有描述工作系統(tǒng),而是單單提出了一個關(guān)于表示的想法。這個想法能夠把Transformer、神經(jīng)場(neural fields)、對比表示學習、蒸餾和膠囊等先進觀點整合到一個名為“GLOM 1”的設想系統(tǒng)中。

一個具有固定架構(gòu)的神經(jīng)網(wǎng)絡如何將一張圖像解析成一個整體的分級體系(其中,每張圖像都有不同的結(jié)構(gòu))?針對這個問題,GLOM 給出了一個簡單的答案,即使用相同向量的孤島來表示解析樹中的節(jié)點。如果 GLOM 真的能夠正常運轉(zhuǎn),那么,當它在視覺或語言上應用時,它能夠極大地提高類似Transformer的系統(tǒng)所生成的表示的可解釋性。

“GLOM”一詞源自一句俗語“ glom together”(“抓”到一起),可能是來源于“凝聚”(agglomerate)一詞。

1

觀點總覽

心理學提供了一個有力證據(jù),表明:人們會將視覺場景解析為整個分層體系,并將部分與整體之間視角不變的空間關(guān)系,建模為他們分配給該部分和整體的內(nèi)在坐標系之間的坐標轉(zhuǎn)換。

如果我們想要建立像人類一樣理解圖像的神經(jīng)網(wǎng)絡,那么我們需要想明白:神經(jīng)網(wǎng)絡是如何表示部分-整體的分層體系?這很困難,因為一個真實的神經(jīng)網(wǎng)絡無法將一組神經(jīng)元進行動態(tài)分配,以表示解析樹中的一個節(jié)點。

神經(jīng)網(wǎng)絡無法動態(tài)分配神經(jīng)元,也是一系列用到“膠囊”觀點的模型所出現(xiàn)的原因。這些模型會作出如下假設:被稱為“膠囊”的一組神經(jīng)元會永遠成為圖像特定區(qū)域中的某一特定類型的一部分。通過激活這些預先存在的、類型特定的膠囊子集,以及膠囊之間的適合連接,可以構(gòu)建一個解析樹。

這篇論文介紹了一種非常不同的方式,可以使用膠囊來表示神經(jīng)網(wǎng)絡中的部分-整體分層體系。

雖然這篇論文主要討論了單個靜態(tài)圖像的感知,但我們可以簡單地將 GLOM 理解為用于處理一系列幀的管道,因此靜態(tài)圖像可以被視為一系列相同的幀。

GLOM 架構(gòu)由許多列(column)組成,所有列均使用完全相同的權(quán)重。每一列都是一堆空間局部自動編碼器,這些編碼器會學習小圖像塊(image patch)中的多個不同級別的表示。每個自動編碼器都會使用多層自下而上的編碼器和多層自上而下的解碼器,將同一個級別的嵌入轉(zhuǎn)換為相鄰級別的嵌入。這些級別與部分-整體分層體系中的級別一一對應。比如,顯示一張人臉圖像時,一個單列可能會收斂到表示一個鼻孔、一個鼻子、一張臉和一個人的嵌入向量上。圖 1 顯示了不同級別的嵌入如何在單列中進行交互。

71b90fda-7c22-11eb-8b86-12bb97331649.png

圖1:單列中,GLOM架構(gòu)的三個相鄰級別的自下而上、自上而下、同列的交互。

代表自下而上和自上而下交互的藍色和紅色箭頭是由兩個具有多個隱藏層的不同神經(jīng)網(wǎng)絡來實現(xiàn)。這些網(wǎng)絡在成對的級別中有所差異,但它們可以跨列、跨時間步分享。自上而下的網(wǎng)絡也許應該使用正弦單位。對于靜態(tài)圖,綠色箭頭可以簡單看作按比例縮放的殘差連接,以實現(xiàn)每個級別的嵌入的時間平滑。對于視頻,綠色連接可以是基于多個先前狀態(tài)的膠囊來學習時間動態(tài)的神經(jīng)網(wǎng)絡。不同列中,相同級別的的嵌入向量之間的交互可以通過非自適應的、注意力加權(quán)的局部平滑器(圖中沒有顯示)來實現(xiàn)。

圖 1 沒有顯示不同列中同一級別的嵌入之間的交互。這比同一列內(nèi)的交互要簡單得多,因為它們不需要執(zhí)行部分-整體坐標轉(zhuǎn)換。它們就像代表一個多頭 transformer 中不同單詞片段的列之間的注意力加權(quán)交互,但更簡單,因為查詢、鍵和值向量都與嵌入向量相同。列與列之間的交互作用是,通過使一個級別的每個嵌入向量向附近位置的其他類似向量回歸,從而在該級別上產(chǎn)生具有相同嵌入的島。這將創(chuàng)建多個局部“回音室”,其中一個級別的嵌入主要聽從其他想法相似的嵌入。

在每一段離散時間和每一列中,一個級別的嵌入將被更新為擁有四個貢獻(如下)的加權(quán)平均值:

自下而上的神經(jīng)網(wǎng)絡在前一個時間作用于下層級別的嵌入而產(chǎn)生的預測;

自上而下的神經(jīng)網(wǎng)絡在前一個時間作用于上層級別的嵌入而產(chǎn)生的預測;

上一個時間步的嵌入向量;

前一個時間在附近列相同級別的嵌入的注意力加權(quán)平均值。

對于靜態(tài)圖,一個級別的嵌入應隨著時間的流逝而沉淀,以生成擁有幾乎相同向量的不同島。如圖 2 所示, 這些島在更高的級別上應該更大。使用相似的島來表示圖像的解析,避免了需要分配神經(jīng)元組來動態(tài)表示正在運行的解析樹的節(jié)點,或預先為所有可能的節(jié)點設置神經(jīng)元的情況。GLOM 系統(tǒng)不是分配神經(jīng)硬件來表示解析樹中的節(jié)點,或為節(jié)點提供指向其祖先和后代的指針,而是分配了一個合適的活動向量來表示該節(jié)點,并在屬于該節(jié)點的所有位置上使用了相同的活動向量。訪問節(jié)點的祖先和后代的能力是通過自下而上和自上而下的神經(jīng)網(wǎng)絡實現(xiàn)的,而不是通過使用 RAM 檢查表格來實現(xiàn)的。

71fcc09a-7c22-11eb-8b86-12bb97331649.png

圖 2:在特定時間里,6 個相鄰列的嵌入。

圖 2 所顯示的所有位置都屬于同一對象,且場景級別尚未在共享矢量上定居。通過將向量劃分為部分-整體分層體系中每個級別的單獨部分,然后將一個級別的的高維嵌入向量顯示為二維向量,那么每個位置的完整嵌入向量就可以顯示出來。這可以很好地解釋不同位置的嵌入向量的對齊。圖 2 所示的不同級別上向量相同的島,實則表示一棵解析樹。但是,相同的島比短語結(jié)構(gòu)語法要強大得多。比如,在“這是否會減慢短語結(jié)構(gòu)語法的速度”的問題上,它們可以毫不費力地表示斷開連接的對象。

就像BERT一樣,整個 GLOM 系統(tǒng)可以進行端到端的訓練,以在最后的時間步從缺少某一區(qū)域的輸入圖像中重建圖像。但是,目標函數(shù)還包含兩個倡導在每個級別上向量幾乎相同的島的正則化器(regularizer)。正則化器只是一個級別的新嵌入與自下而上、自上而下的預測之間的一致性。提高這個一致性能夠促進局部島的形成。

722ee048-7c22-11eb-8b86-12bb97331649.png

圖 4:這是將圖 1 所示架構(gòu)進行可視化的另一種方式,可以使該架構(gòu)與 transformer 之間的關(guān)系更加明顯。圖 1 中表示時間的水平尺寸變成了圖 4 中表示層的垂直尺寸。此時,在每一個位置,每一層都有部分-整體分層體系中所有級別的嵌入。這與垂直壓縮圖 1 中單個時間片內(nèi)的級別描述一致。

靜態(tài)圖的解釋僅需要使用該架構(gòu)進行一次前向傳遞。這里將所有級別特定的自下而上和自上而下的神經(jīng)網(wǎng)絡都顯示為單個神經(jīng)網(wǎng)絡。圖 5 顯示了另一種查看 GLOM 架構(gòu)的自下而上和自上而下的神經(jīng)網(wǎng)絡。

7273be70-7c22-11eb-8b86-12bb97331649.png

圖 5:GLOM 在同一個位置(即單列的一部分)的兩個相鄰層。在前向傳遞的過程中,L 級的嵌入向量通過多層自下而上的神經(jīng)網(wǎng)絡從上一層 L-1 級的嵌入向量中接收輸入。L 級還通過多層自上而下的神經(jīng)網(wǎng)絡從上一層 L+1 級的嵌入中接收輸入。在前向傳遞的過程中,對上一層 L+1 級的依賴取得了自上而下的效果。嵌入在 t+1 層中的 L 級還取決于嵌入在 t 層中的 L 級嵌入和 t 層中其他附近位置的 L 級嵌入的注意力加權(quán)總和。圖中沒有顯示級內(nèi)的交互。

2

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4839

    瀏覽量

    107979
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4786

    瀏覽量

    98263
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4419

    瀏覽量

    67678

原文標題:Hinton一作新論文:如何在神經(jīng)網(wǎng)絡中表示“部分-整體層次結(jié)構(gòu)”?

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    為什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神經(jīng)網(wǎng)絡引擎?

    我想知道為什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神經(jīng)網(wǎng)絡引擎,請問?您能否舉一些關(guān)于他們的用例的例子?
    發(fā)表于 03-25 06:01

    神經(jīng)網(wǎng)絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經(jīng)網(wǎng)絡的實現(xiàn)。什么是神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大
    的頭像 發(fā)表于 12-17 15:05 ?371次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的初步認識

    CNN卷積神經(jīng)網(wǎng)絡設計原理及在MCU200T上仿真測試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經(jīng)網(wǎng)絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經(jīng)網(wǎng)絡內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡的性能并最??大限度地減少其內(nèi)存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    , batch_size=512, epochs=20)總結(jié) 這個核心算法中的卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)和訓練過程,是用來對MNIST手寫數(shù)字圖像進行分類的。模型將圖像作為輸入,通過卷積和池化層提取圖像的特征,然后通過全連接層進行分類預測。訓練過程中,模型通過最小化損失函數(shù)來優(yōu)化模型參數(shù),從而提高分類準確性。
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡部署相關(guān)操作

    在完成神經(jīng)網(wǎng)絡量化后,需要將神經(jīng)網(wǎng)絡部署到硬件加速器上。首先需要將所有權(quán)重數(shù)據(jù)以及輸入數(shù)據(jù)導入到存儲器內(nèi)。 在仿真環(huán)境下,可將其存于一個文件,并在 Verilog 代碼中通過 readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(LNN):時間連續(xù)性與動態(tài)適應性的神經(jīng)網(wǎng)絡

    1.算法簡介液態(tài)神經(jīng)網(wǎng)絡(LiquidNeuralNetworks,LNN)是一種新型的神經(jīng)網(wǎng)絡架構(gòu),其設計理念借鑒自生物神經(jīng)系統(tǒng),特別是秀麗隱桿線蟲的神經(jīng)
    的頭像 發(fā)表于 09-28 10:03 ?1372次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經(jīng)網(wǎng)絡</b>

    神經(jīng)網(wǎng)絡的并行計算與加速技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和廣泛的應用前景。然而,神經(jīng)網(wǎng)絡模型的復雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計算方式面臨著巨大的挑戰(zhàn),如計算速度慢、訓練時間長等
    的頭像 發(fā)表于 09-17 13:31 ?1196次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的并行計算與加速技術(shù)

    何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經(jīng)常會出現(xiàn)“神經(jīng)網(wǎng)絡”、“黑箱”、“標注”等術(shù)語。這些概念對非專業(yè)
    的頭像 發(fā)表于 09-10 17:38 ?958次閱讀
    如<b class='flag-5'>何在</b>機器視覺中部署深度學習<b class='flag-5'>神經(jīng)網(wǎng)絡</b>

    基于神經(jīng)網(wǎng)絡的數(shù)字預失真模型解決方案

    在基于神經(jīng)網(wǎng)絡的數(shù)字預失真(DPD)模型中,使用不同的激活函數(shù)對整個系統(tǒng)性能和能效有何影響?
    的頭像 發(fā)表于 08-29 14:01 ?3535次閱讀

    無刷電機小波神經(jīng)網(wǎng)絡轉(zhuǎn)子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學模型的推導,得出轉(zhuǎn)角:與三相相電壓之間存在映射關(guān)系,因此構(gòu)建了一個以三相相電壓為輸人,轉(zhuǎn)角為輸出的小波神經(jīng)網(wǎng)絡來實現(xiàn)轉(zhuǎn)角預測,并采用改進遺傳算法來訓練網(wǎng)絡結(jié)構(gòu)與參數(shù),借助
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡專家系統(tǒng)在電機故障診斷中的應用

    摘要:針對傳統(tǒng)專家系統(tǒng)不能進行自學習、自適應的問題,本文提出了基于種經(jīng)網(wǎng)絡專家系統(tǒng)的并步電機故障診斷方法。本文將小波神經(jīng)網(wǎng)絡和專家系統(tǒng)相結(jié)合,充分發(fā)揮了二者故障診斷的優(yōu)點,很大程度上降低了對電機
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡RAS在異步電機轉(zhuǎn)速估計中的仿真研究

    眾多方法中,由于其結(jié)構(gòu)簡單,穩(wěn)定性好廣泛受到人們的重視,且已被用于產(chǎn)品開發(fā)。但是MRAS仍存在在低速區(qū)速度估計精度下降和對電動機參數(shù)變化非常敏感的問題。本文利用神經(jīng)網(wǎng)絡的特點,使估計更為簡單、快速
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經(jīng)網(wǎng)絡的步驟解析

    本文的目的是在一個神經(jīng)網(wǎng)絡已經(jīng)通過python或者MATLAB訓練好的神經(jīng)網(wǎng)絡模型,將訓練好的模型的權(quán)重和偏置文件以TXT文件格式導出,然后通過python程序?qū)xt文件轉(zhuǎn)化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1371次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的步驟解析

    NVIDIA實現(xiàn)神經(jīng)網(wǎng)絡渲染技術(shù)的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡渲染技術(shù)的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預覽版中增加神經(jīng)網(wǎng)絡著色技術(shù),讓開
    的頭像 發(fā)表于 04-07 11:33 ?1267次閱讀