91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

告別調參煉丹,使用隨機共享權重足矣!

2E1k_gh_baf5b3c ? 來源:陳年麗 ? 2019-08-28 17:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌大腦備受關注的“權重無關神經(jīng)網(wǎng)絡”終于開源了!其關鍵思想是通過不再強調權重來搜索網(wǎng)絡結構,僅使用隨機共享的權重,也可以執(zhí)行各種任務的神經(jīng)網(wǎng)絡。終于可以不用調參煉丹了嗎?快來復現(xiàn)看看!

神經(jīng)網(wǎng)絡訓練中 “權重” 有多重要不言而喻。但谷歌前段時間發(fā)表的研究表明,即使拋棄神經(jīng)網(wǎng)絡權重訓練,使用隨機共享權重,也可以執(zhí)行各種任務。

他們提出一種新的神經(jīng)網(wǎng)絡結構的搜索方法——權重無關神經(jīng)網(wǎng)絡(Weight Agnostic Neural Networks,WANN),其關鍵思想是通過不再強調權重來搜索網(wǎng)絡結構。

今天,該研究的兩位作者、谷歌大腦學生研究員 Adam Gaier和研究科學家David Ha在Google AI博客上撰文,介紹了該研究的核心思想和重要細節(jié),并宣布WANN的代碼已經(jīng)在GitHub上開源,以便讓廣泛的研究社區(qū)重現(xiàn)WANN實驗。

告別調參煉丹,使用隨機共享權重足矣!

當訓練神經(jīng)網(wǎng)絡完成一項給定任務時,無論是圖像分類還是強化學習,通常都需要調優(yōu)與網(wǎng)絡中每個連接相關的一組權重。另一種已經(jīng)取得實質性進展的成功的神經(jīng)網(wǎng)絡創(chuàng)建方法是神經(jīng)架構搜索,它利用人工設計的組件(如卷積網(wǎng)絡組件或transformer blocks)來構建神經(jīng)網(wǎng)絡架構。

研究表明,利用這些組件構建的神經(jīng)網(wǎng)絡結構,如深度卷積網(wǎng)絡,對圖像處理任務具有很強的歸納偏差,甚至可以在權重隨機初始化的情況下執(zhí)行。雖然神經(jīng)架構搜索提供了一些新的方法,可以為當前的任務域安排具有已知歸納偏差的手工工程組件,但在自動發(fā)現(xiàn)具有此類歸納偏差的新神經(jīng)網(wǎng)絡架構(用于不同的任務域)方面幾乎沒有進展。

我們可以用一個先天和后天的例子作為類比。正如生物學中某些從出生起就具有反捕食行為的物種一樣,他們無需學習就能執(zhí)行復雜的運動和感官任務,或許我們可以構建一個不需要訓練就能很好地完成任務的神經(jīng)網(wǎng)絡。當然,這些自然物種(作為類比,人工神經(jīng)網(wǎng)絡)通過訓練可以得到進一步的改善,但它們即使不學習也能執(zhí)行任務的能力表明,它們包含使它們非常適合于這些任務的偏差。

在“權重無關神經(jīng)網(wǎng)絡”(WANN)論文中,我們提出了搜索具有這類偏差的網(wǎng)絡的第一步:即使使用隨機共享的權重,也可以執(zhí)行各種任務的神經(jīng)網(wǎng)絡架構。

我們在這項工作中的動機是,在不學習任何權重參數(shù)的情況下,僅神經(jīng)網(wǎng)絡架構能在多大程度上編碼給定任務的解決方案。通過探索這樣的神經(jīng)網(wǎng)絡架構,我們提出了一種無需學習權重參數(shù)就能在其環(huán)境中運行良好的智能體。

此外,為了促進該領域的進步,我們還開放了源代碼,以便更廣泛的研究社區(qū)重現(xiàn)我們的WANN實驗。

左圖:一個手工設計的、完全連接的深度神經(jīng)網(wǎng)絡,有2760個權重連接。利用一種學習算法,我們可以求解2760個權重參數(shù)的集合,使該網(wǎng)絡能夠執(zhí)行一個雙足步行任務(BipedalWalker-v2)。

右圖:一個權重無關的神經(jīng)網(wǎng)絡架構,只有44個連接,但同樣能夠執(zhí)行雙足步行任務。與完全連接網(wǎng)絡不同的是, WANN仍然可以執(zhí)行任務,而不需要訓練每個連接的權重參數(shù)。實際上,為了簡化訓練,WANN被設計成在每個權重連接的值相同或共享時執(zhí)行,甚至就算共享權重參數(shù)是隨機采樣的,也會起作用。

搜索權重無關神經(jīng)網(wǎng)絡

我們從一組最小的神經(jīng)網(wǎng)絡架構候選對象開始,每個候選對象只有很少的連接,并使用一個完善的拓撲搜索算法(NEAT),通過逐個地添加單個連接和單個節(jié)點來演化架構。

WANN背后的關鍵思想是通過不再強調權重來搜索架構。與傳統(tǒng)的神經(jīng)架構搜索方法不同,新架構的所有權重參數(shù)都需要使用學習算法進行訓練,我們采用了一種更簡單、更有效的方法。

在搜索過程中,首先在每次迭代中為所有候選架構分配一個共享權重值,然后進行優(yōu)化,以便在更寬的共享權重值范圍內執(zhí)行良好。

用于搜索網(wǎng)絡拓撲空間的運算符

左:一個最小的網(wǎng)絡拓撲結構,輸入和輸出僅部分連接。

中間:網(wǎng)絡的改變有三種方式:

(1)插入節(jié)點:通過分割現(xiàn)有連接插入新節(jié)點。

(2)添加連接:通過連接兩個先前未連接的節(jié)點來添加一個新連接。

(3)更改激活:重新分配隱藏節(jié)點的激活函數(shù)。

右:可能的激活函數(shù)(線性,階躍,正弦, 余弦,高斯,tanh, sigmoid,inverse,絕對值,ReLU)

除了探索一系列與權重無關的神經(jīng)網(wǎng)絡之外,重要的是還要尋找只需要復雜到它們所需的程度的網(wǎng)絡架構。我們利用多目標優(yōu)化技術( multi-objective optimization),同時對網(wǎng)絡的性能和復雜度進行優(yōu)化。

權重無關神經(jīng)網(wǎng)絡搜索的概述,及其相應的網(wǎng)絡拓撲空間搜索算子。

訓練WANN架構

與傳統(tǒng)網(wǎng)絡不同的是,我們可以通過簡單地找到最佳的單個共享權重參數(shù)來訓練WANN,從而最大限度地提高其性能。在下面的例子中,可以看到我們的架構(在某種程度上)使用恒定的權重來完成一個 swing-up cartpole 任務:

WANN在不同的權重參數(shù)下執(zhí)行 swing-up cartpole 任務,也使用微調的權重參數(shù)。

正如我們在上面的圖中看到的,雖然WANN可以使用一系列共享權重參數(shù)來執(zhí)行其任務,但是其性能仍然無法與學習每個連接的權重的網(wǎng)絡相比較。

如果我們想進一步提高它的性能,我們可以使用WANN架構和最佳共享權重作為起點,使用學習算法微調每個連接的權重,就像通常訓練神經(jīng)網(wǎng)絡的方法一樣。以網(wǎng)絡架構的權重無關特性為出發(fā)點,通過學習微調網(wǎng)絡的性能,可能有助于為理解動物如何學習提供有洞察力的類比。

通過在性能和網(wǎng)絡簡單性方面的多目標優(yōu)化,我們的方法找到了一個簡單的WANN,用于賽車任務,它不需要顯式地訓練網(wǎng)絡的權重。

使用隨機權重的網(wǎng)絡架構不僅易于訓練,還具有其他優(yōu)勢。例如,通過使用相同WANN架構的副本,但是為WANN的每個副本都分配不同的權重值,我們可以為同一任務創(chuàng)建多個不同模型的集合。這種集合通常比單個模型能獲得更好的性能。下面是一個MNIST分類器處理隨機權重的例子,可以說明這一點:

MNIST分類器進化為處理隨機權重。

具有隨機初始化的傳統(tǒng)網(wǎng)絡在 MNIST 上的精度約為 10%,但這種隨機權重的特殊網(wǎng)絡架構在 MNIST 上的精度 (》 80%) 明顯優(yōu)于隨機初始化網(wǎng)絡。當使用一組WANNs,為每個WANN分配一個不同的共享權重時,精度提高到 》 90%。

即使不使用集成方法,也可以將網(wǎng)絡中的權重值壓縮到一個網(wǎng)絡,從而使網(wǎng)絡能夠快速調整??焖僬{整權重的能力可能在持續(xù)的終身學習(lifelong learning)中很有用,在這種學習中,agent在整個生命周期中獲得、適應和轉移技能。這使得WANN特別適合利用 Baldwin效應, Baldwin效應是一種進化壓力,即獎勵那些傾向于學習有用行為的個體,而不會陷入“l(fā)earning to learn”這個昂貴的計算陷阱。

結論

我們希望這項工作可以作為一個墊腳石,幫助發(fā)現(xiàn)新的基礎神經(jīng)網(wǎng)絡組件,如卷積網(wǎng)絡,其發(fā)現(xiàn)和應用已經(jīng)在深度學習領域取得了令人難以置信的進展。自卷積神經(jīng)網(wǎng)絡被發(fā)現(xiàn)以來,研究界可用的計算資源顯著增加。如果我們將這些資源投入到自動發(fā)現(xiàn)神經(jīng)網(wǎng)絡架構中,并希望實現(xiàn)網(wǎng)絡架構的突破性改進,那么我們相信,使用新的構建塊來搜索也是值得的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111551
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4838

    瀏覽量

    107912

原文標題:“互聯(lián)網(wǎng) + 海關”背景下,企業(yè)關務系統(tǒng)的選擇和應用以及與合規(guī)內控的結合

文章出處:【微信號:gh_baf5b3c5005b,微信公眾號:通關機器人】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    tFUS如何精準調實現(xiàn)神經(jīng)活動的雙向調節(jié)?

    HUIYING經(jīng)顱聚焦超聲刺激(tFUS)參數(shù)效應概述經(jīng)顱聚焦超聲刺激(tFUS)作為一種非侵入性神經(jīng)調節(jié)技術,其核心優(yōu)勢在于通過精確調控超聲參數(shù)實現(xiàn)對神經(jīng)活動的雙向調節(jié)(興奮或抑制)。參數(shù)選擇直接決定聲波在顱內的傳播效率、空間靶向性及生理效應。研究表明,tFUS的神經(jīng)調制效果并非由單一參數(shù)主導,而是多參數(shù)協(xié)同作用的結果。例如,高頻脈沖重復頻率(PRF)和高
    的頭像 發(fā)表于 02-22 17:22 ?107次閱讀
    tFUS如何精準<b class='flag-5'>調</b><b class='flag-5'>參</b>實現(xiàn)神經(jīng)活動的雙向調節(jié)?

    值傳遞、指針傳遞、引用傳遞介紹

    進行操作,也就是說,即使形的值發(fā)生改變,實參的值也完全不受影響。   2、指針傳遞:指針傳遞其實是值傳遞的一種,它傳遞的是地址。值傳遞過程中,被調函數(shù)的形作為被調函數(shù)的局部變量來處
    發(fā)表于 01-21 06:48

    快速切換多通道微波源:APMS系列相信號源提供高達40GHz的4通道相輸出

    安鉑克APMS系列多通道相微波信號發(fā)生器將多通道相輸出、微波頻率覆蓋與快速切換能力三者高度集成于一個僅1U高的標準機箱內,為核心研發(fā)與生產測試提供了高效、緊湊的激勵工具。
    的頭像 發(fā)表于 01-13 16:23 ?187次閱讀
    快速切換多通道微波源:APMS系列相<b class='flag-5'>參</b>信號源提供高達40GHz的4通道相<b class='flag-5'>參</b>輸出

    如何在LTspice仿真中實現(xiàn)偽隨機數(shù)和真隨機數(shù)的生成

    本文討論如何在LTspice仿真中利用flat()、gauss()和mc()函數(shù)來實現(xiàn)偽隨機數(shù)和真隨機數(shù)的生成,并介紹如何使用設置面板的Hacks部分中的 Use the clock
    的頭像 發(fā)表于 01-09 14:08 ?4714次閱讀
    如何在LTspice仿真中實現(xiàn)偽<b class='flag-5'>隨機</b>數(shù)和真<b class='flag-5'>隨機</b>數(shù)的生成

    PID調實用方法

    ) 周圍抖動 在講了PI和PD系統(tǒng)的調節(jié)方式后,下面分享一下PID系統(tǒng)的調節(jié)方式,首先我們先按照PI系統(tǒng)進行調節(jié),先調P在調I,讓系統(tǒng)有一定的過沖后達到穩(wěn)定. 在出現(xiàn)了上面的 PI 波形之后,下面就開始調節(jié)D,慢慢增加D,將過沖補償?shù)?,直到系統(tǒng)穩(wěn)定,最終效果如下圖,PID系統(tǒng)就基本調節(jié)完成了
    發(fā)表于 11-28 07:17

    安信可雷達模組如何快速配網(wǎng)和調

    安信可配網(wǎng)助手app介紹 安信可配網(wǎng)助手app是由安信可開發(fā)的一款 可拿來對安信可模組進行配網(wǎng)以及對雷達模組進行調的APP 。 下面將對APP搭配安信可雷達模組Rd-01、Rd-03_V2
    的頭像 發(fā)表于 10-31 08:59 ?652次閱讀
    安信可雷達模組如何快速配網(wǎng)和<b class='flag-5'>調</b><b class='flag-5'>參</b>?

    微店關鍵詞搜索接口核心突破:動態(tài)權重算法與語義引擎的實戰(zhàn)落地

    本文詳解微店搜索接口從基礎匹配到智能推薦的技術進階路徑,涵蓋動態(tài)權重、語義理解與行為閉環(huán)三大創(chuàng)新,助力商家提升搜索轉化率、商品曝光與用戶留存,實現(xiàn)技術驅動的業(yè)績增長。
    的頭像 發(fā)表于 10-15 14:38 ?457次閱讀

    告別數(shù)月等待:數(shù)字孿生場景生成從此進入“日級”時代

    告別數(shù)月等待:數(shù)字孿生場景生成從此進入“日級”時代
    的頭像 發(fā)表于 09-05 17:33 ?2591次閱讀
    <b class='flag-5'>告別</b>數(shù)月等待:數(shù)字孿生場景生成從此進入“日級”時代

    隨機數(shù)和偽隨機數(shù)的區(qū)別

    隨機數(shù)在當前程序運行環(huán)境中是一種常用參數(shù),目前主要分為兩種,偽隨機數(shù)和真隨機數(shù),本期我們就來講一下二者的區(qū)別。
    的頭像 發(fā)表于 08-27 17:46 ?2671次閱讀

    用拼多多 API 實現(xiàn)拼多多店鋪商品搜索權重提升

    ? 在電商平臺如拼多多上,商品搜索權重直接影響曝光率和銷量。權重高的商品更容易出現(xiàn)在搜索結果前列,吸引更多用戶點擊。通過拼多多 API(應用程序接口),賣家可以自動化優(yōu)化商品信息,提升搜索權重。本文
    的頭像 發(fā)表于 08-19 17:23 ?835次閱讀
    用拼多多 API 實現(xiàn)拼多多店鋪商品搜索<b class='flag-5'>權重</b>提升

    亞馬遜云科技現(xiàn)已上線OpenAI開放權重模型

    客戶現(xiàn)可通過Amazon Bedrock和Amazon SageMaker AI使用OpenAI開放權重模型,實現(xiàn)將先進的開放權重模型與全球最廣泛云服務的深度集成。 亞馬遜云科技首次上線OpenAI
    的頭像 發(fā)表于 08-06 19:29 ?870次閱讀

    穩(wěn)壓器分調與穩(wěn)壓器統(tǒng)調的區(qū)別

    在電力與電氣設備的運行過程中,電壓的穩(wěn)定至關重要。自動調壓器作為一種關鍵設備,能夠有效調節(jié)電壓,確保設備在合適的電壓環(huán)境下運行。而在自動調壓器(穩(wěn)壓器)的應用中,分調與統(tǒng)調是兩種常見的調節(jié)模式。理解
    的頭像 發(fā)表于 07-26 14:54 ?940次閱讀

    微電機關鍵零部件制造誤差對其質量的影響權重分析

    質量影響的權值,最后綜合計算出微電機關鍵零部件制造誤差對微電機質量影響的權重。該方法能很好解決不存在尺寸鏈或復雜尺寸鏈關系的零部件制造誤差對產品質量影響的權值計算問題。 純分享帖,需要者可點擊附件免費
    發(fā)表于 06-23 07:16

    告別延遲!Ethernetip轉modbustcp網(wǎng)關在熔煉車間監(jiān)控的極速時代

    告別延遲!Ethernetip轉modbustcp網(wǎng)關在熔煉車間監(jiān)控的極速時代
    的頭像 發(fā)表于 05-20 19:20 ?442次閱讀
    <b class='flag-5'>告別</b>延遲!Ethernetip轉modbustcp網(wǎng)關在熔煉車間監(jiān)控的極速時代

    HJ55系列三相變頻電源 電壓可分調可統(tǒng)調

    HJ55系列三相變頻電源是一種高性能的電源設備,廣泛應用于工業(yè)、科研、測試等領域。它具備分調和統(tǒng)調功能,能夠滿足不同場景下的電壓和頻率調節(jié)需求。以下是關于HJ55系列三相變頻電源的分調和統(tǒng)調功能
    的頭像 發(fā)表于 03-26 11:55 ?2790次閱讀
    HJ55系列三相變頻電源 電壓可分<b class='flag-5'>調</b>可統(tǒng)<b class='flag-5'>調</b>