91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度學習和智能理論在未來會帶來什么?

lviY_AI_shequ ? 來源:YXQ ? 2019-07-08 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,圖靈獎得主、深度學習巨頭Geoffrey Hinton和Yann LeCun在ACM FCRC 2019上發(fā)表了精彩演講。

二人分別在大會上做了題為《深度學習革命》和《深度學習革命:續(xù)集》的精彩演講。目前視頻已經(jīng)公開:

https://www.youtube.com/watch?v=VsnQf7exv5I

新智元對演講內(nèi)容進行了整理。

Geoffrey Hinton:《深度學習革命》

Geoffrey Hinton

Hinton表示,自從20世紀50年代開始,人工智能存在兩種范式:分別是邏輯啟發(fā)的方法生物學啟發(fā)的方法

邏輯啟發(fā)的方法(The logic-inspired approach):智能的本質(zhì)是使用符號規(guī)則來操縱符號表達。我們應該專注于推理

生物學啟發(fā)的方法(The biologically-inspired approach):智能的本質(zhì)是學習神經(jīng)網(wǎng)絡中連接的優(yōu)勢。我們應該專注于學習和感知

不同的范式便使得最終的目標有所不同。因此,在內(nèi)部表示(internal representation)方面也存在著兩種觀點:

內(nèi)部表示是符號表達式。程序員可以用一種明確的語言把它們交給計算機;可以通過對現(xiàn)有表示應用規(guī)則派生新的表示。

內(nèi)部表示與語言完全不同。它們是神經(jīng)活動的向量(big vectors);它們對神經(jīng)活動的其他載體有直接的因果影響;這些向量是從數(shù)據(jù)中學到的。

由此也導致了兩種讓計算機完成任務的方式。

首先是智能設計:有意識地精確計算出你將如何操縱符號表示來執(zhí)行任務,然后極其詳細地告訴計算機具體要做什么。

其次是學習:向計算機展示大量輸入和所需輸出的例子。讓計算機學習如何使用通用的學習程序?qū)⑤斎胗成涞捷敵觥?/p>

Hinton舉了一個例子:人們花了50年的時間,用符號型人工智能(symbolic AI)來完成的任務就是“看圖說話”。

針對這項任務,人們嘗試了很長時間來編寫相應的代碼,即便采用神經(jīng)網(wǎng)絡的方法依舊嘗試了很長一段時間。最終,這項任務得到很好解決的方法竟然是基于純學習的方法。

因此,對于神經(jīng)網(wǎng)絡而言,存在如下的核心問題

包含數(shù)百萬權(quán)重和多層非線性神經(jīng)元的大型神經(jīng)網(wǎng)絡是非常強大的計算設備。但神經(jīng)網(wǎng)絡能否從隨機權(quán)重開始,并從訓練數(shù)據(jù)中獲取所有知識,從而學習一項困難的任務(比如物體識別或機器翻譯)?

針對這項問題,前人們付出了不少的努力:

針對如何訓練人工神經(jīng)網(wǎng)絡,Hinton認為分為兩大方法,分別是監(jiān)督訓練和無監(jiān)督訓練。

監(jiān)督訓練:向網(wǎng)絡顯示一個輸入向量,并告訴它正確的輸出;調(diào)整權(quán)重,減少正確輸出與實際輸出之間的差異。

無監(jiān)督訓練:僅向網(wǎng)絡顯示輸入;調(diào)整權(quán)重,以便更好地從隱含神經(jīng)元的活動中重建輸入(或部分輸入)。

而反向傳播(backpropagation algorithm)只是計算權(quán)重變化如何影響輸出錯誤的一種有效方法。不是一次一個地擾動權(quán)重并測量效果,而是使用微積分同時計算所有權(quán)重的誤差梯度。

當有一百萬個權(quán)重時,反向傳播方法要比變異方法效率高出一百萬倍。

然而,反向傳播算法卻又讓人感到失望。

在20世紀90年代,雖然反向傳播算法的效果還算不錯,但并沒有達到人們所期待的那樣——深度網(wǎng)絡訓練非常困難;在中等規(guī)模的數(shù)據(jù)集上,一些其他機器學習方法甚至比反向傳播更有效。

符號型人工智能的研究人員稱,期望在大型深層神經(jīng)網(wǎng)絡中學習困難的任務是愚蠢的,因為這些網(wǎng)絡從隨機連接開始,且沒有先驗知識。

Hinton舉了三個非?;恼Q的理論:

而后,深度學習開始被各種拒絕:

2007年:NIPS program committee拒絕了Hinton等人的一篇關(guān)于深度學習的論文。因為他們已經(jīng)接收了一篇關(guān)于深度學習的論文,而同一主題的兩篇論文就會“顯得過多”。

2009年:一位評審員告訴Yoshua Bengio,有關(guān)神經(jīng)網(wǎng)絡的論文在ICML中沒有地位。

2010年:一位CVPR評審員拒絕了Yann LeCun的論文,盡管它擊敗了最先進的論文。審稿人說它沒有告訴我們?nèi)魏侮P(guān)于計算機視覺的信息,因為一切都是“學到的”。

而在2005年至2009年期間,研究人員(在加拿大!)取得了幾項技術(shù)進步,才使反向傳播能夠更好地在前饋網(wǎng)絡中工作。

到了2012年,ImageNet對象識別挑戰(zhàn)賽(ImageNet object recognition challenge)有大約100萬張從網(wǎng)上拍攝的高分辨率訓練圖像。

來自世界各地的領先計算機視覺小組在該數(shù)據(jù)集上嘗試了一些當時最好的計算機視覺方法。其結(jié)果如下:

這次比賽的結(jié)果后,計算機視覺相關(guān)的組委會們才突然發(fā)覺原來深度學習是有用的!

Hinton在演講中討論了一種全新的機器翻譯方式。

對于每種語言,我們都有一個編碼器神經(jīng)網(wǎng)絡和一個解碼器神經(jīng)網(wǎng)絡。編碼器按原句中的單詞順序讀取(它最后的隱藏狀態(tài)代表了句子所表達的思想)。而解碼器用目標語言表達思想。

自2014年年以來,神經(jīng)網(wǎng)絡機器翻譯得了很大的發(fā)展。

接下來,Hinton談到了神經(jīng)網(wǎng)絡視覺的未來。

他認為卷積神經(jīng)網(wǎng)絡獲得了巨大的勝利,因為它若是在一個地方能行得通,在其它地方也能使用。但它們識別物體的方式與我們不同,因此是對抗的例子。

人們通過使用對象的坐標系與其部分的坐標系之間的視點不變幾何關(guān)系來識別對象。Hinton認為神經(jīng)網(wǎng)絡也能做到這一點(參考鏈接:arxiv.org/abs/1906.06818)。

那么,神經(jīng)網(wǎng)絡的未來又是什么呢?

Hinton認為:

幾乎所有人工神經(jīng)網(wǎng)絡只使用兩個時間尺度:對權(quán)重的緩慢適應和神經(jīng)活動的快速變化。但是突觸在多個不同的時間尺度上適應。它可以使快速權(quán)重(fast weight)進行short-term memory將使神經(jīng)網(wǎng)絡變得更好,可以改善優(yōu)化、可以允許真正的遞歸。

Yann LeCun演講:《深度學習革命:續(xù)集》

Yann LeCun

Jeff剛才提到了監(jiān)督學習,監(jiān)督學習在數(shù)據(jù)量很大時效果很好,可以做語音識別、圖像識別、面部識別、從圖片生成屬性、機器翻譯等。

如果神經(jīng)網(wǎng)絡具有某些特殊架構(gòu),比如Jeff在上世紀八九十年代提出的那些架構(gòu),可以識別手寫文字,效果很好,到上世紀90年代末時,我在貝爾實驗室研發(fā)的這類系統(tǒng)承擔了全美手寫文字識別工作的10%-20%,不僅在技術(shù)上,而且在商業(yè)上也是一個成功。

到后來,整個社群一度幾乎拋棄了神經(jīng)網(wǎng)絡,一方面是因為是缺乏大型數(shù)據(jù)集,還有部分原因是當時編寫的軟件過于復雜,投資很大,還有一部分原因是當時的計算機速度不夠快,不足以運行其他所有應用。

卷積神經(jīng)網(wǎng)絡其實是受到了生物學的啟發(fā),它并不是照搬生物學,但確實從中得到很多啟發(fā),比如視覺皮層的結(jié)構(gòu),以及在學習信號處理時自然而然產(chǎn)生的一些觀點,比如filtering是處理音視頻信號的好辦法,而卷積是filtering的一種方式。這些經(jīng)典理念早在上世紀五六十年代就由Hubel和wiesel等人在神經(jīng)科學領域提出,日本科學家Fukushima在上世紀80年代對其也有貢獻。

我從這些觀點和成果中受到啟發(fā),我發(fā)現(xiàn)可以利用反向傳播訓練神經(jīng)網(wǎng)絡來復現(xiàn)這些現(xiàn)象。卷積網(wǎng)絡的理念是,世界上的物體是由各個部分構(gòu)成的,各個部分由motif構(gòu)成,而motif是由材質(zhì)和邊緣的基本組合,邊緣是由像素的分布構(gòu)成的。如果一個層級系統(tǒng)能夠檢測到有用的像素組合,再依次到邊緣、motif、最后到物體的各個部分,這就是一個目標識別系統(tǒng)。

層級表示不僅適用于視覺目標,也適用于語音、文本等自然信號。我們可以使用卷積網(wǎng)絡識別面部、識別路上的行人。

在上世紀90年代到2010年左右,出現(xiàn)了一段所謂“AI寒冬”,但我們沒有停下腳步,在人臉識別、行人識別,將機器學習用在機器人技術(shù)上,使用卷積網(wǎng)絡標記整個圖像,圖像中的每個像素都會標記為“能”或“不能”被機器人穿越,而且數(shù)據(jù)收集是自動的,無需手動標記。

幾年之后,我們使用類似的系統(tǒng)完成目標分割任務,整個系統(tǒng)可以實現(xiàn)VGA實時部署,對圖像上的每個像素進行分割。這個系統(tǒng)可以檢測行人、道路、樹木,但當時這個結(jié)果并未馬上得到計算機社群的認可。

最近的視覺識別系統(tǒng)的一個范例是Facebook的“全景特征金字塔網(wǎng)絡”,可以通過多層路徑提取圖像特征,由多層路徑特征生成輸出圖像,其中包含圖像中全部實例和目標的掩模,并輸出分類結(jié)果,告訴你圖像中目標的分類信息。不僅是目標本身的分類,還包括背景、材質(zhì)等分類,比如草地、沙地、樹林等??梢韵胂螅@種系統(tǒng)對于自動駕駛會很有用。

醫(yī)療成像及圖像分割

卷積網(wǎng)絡對于醫(yī)學成像應用也很有幫助。與上面提到的網(wǎng)絡類似,它也分為解碼器部分,負責提取圖像特征,另一部分負責生成輸出圖像,對其進行分割。

神經(jīng)網(wǎng)絡機器翻譯

在翻譯應用上,采用了許多網(wǎng)絡架構(gòu)上的創(chuàng)新,如自注意力機制、輕量卷積、動態(tài)卷積等,實現(xiàn)基于語境的動態(tài)卷積網(wǎng)絡內(nèi)核。在ICML2019上的最新機器翻譯卷積網(wǎng)絡模型,其參數(shù)數(shù)量達到200M至300M,WMT數(shù)據(jù)集上的BLEU得分:英語-德語29.7,英語-法語43.2,漢語-英語24.4。

自動駕駛系統(tǒng)

游戲

無模型強化學習很適合游戲領域應用?,F(xiàn)在強化學習領域的一大問題就是數(shù)據(jù)的缺乏,使用強化學習訓練系統(tǒng)需要大量的重復試驗和試錯,要達到人類訓練15分鐘的水平,機器需要大概80小時的實時游戲,對于圍棋來說,要達到超人的水平,機器需要完成大約2000萬盤的自對弈。Deepmind最近的《星際爭霸2》AI則完成了大約200年的游戲時間。

這種海量重復試驗的方式在現(xiàn)實中顯然不可行,如果你想教一個機器人抓取目標,或者教一臺自動駕駛車學會駕駛,如此多的重復次數(shù)是不行的。純粹的強化學習只能適用于虛擬世界,那里的嘗試速度要遠遠快于現(xiàn)實世界。

這就引出了一個問題:為什么人和動物的學習速度這么快?

和自動駕駛系統(tǒng)不同,我們能夠建立直覺上真實的模型,所以不會把車開下懸崖。這是我們掌握的內(nèi)部模型,那么我們是怎么學習這個模型的,如何讓機器學會這個模型?基本上是基于觀察學會的。

動物身上也存在類似的機制。預測是智能的不可或缺的組成部分,當實際情況和預測出現(xiàn)差異時,實際上就是學習的過程。

上圖顯示了嬰兒學習早期概念和語言的過程。嬰兒基本上是通過觀察學習這個世界的,但其中也有一小部分是通過交流。

自監(jiān)督學習:預測與重建

以視頻內(nèi)容預測為例,給定一段視頻數(shù)據(jù),從其中一段視頻內(nèi)容預測另外一段空白處的內(nèi)容。自監(jiān)督學習的典型場景是,事先不公布要空出哪一段內(nèi)容,實際上根本不用真的留出空白,只是讓系統(tǒng)根據(jù)一些限制條件來對輸入進行重建。系統(tǒng)只通過觀察來完成任務,無需外部交互,學習效率更高。

機器在學習過程中被輸入了多少信息?對于純強化學習而言,獲得了一些樣本的部分碎片信息(就像蛋糕上的櫻桃)。對于監(jiān)督學習,每個樣本獲得10-10000bit信息(蛋糕表面的冰層),對于半監(jiān)督學習,每個樣本可獲得數(shù)百萬bit的信息(整個蛋糕內(nèi)部)。

自監(jiān)督學習的必要性

機器學習的未來在與自監(jiān)督和半監(jiān)督學習,而非監(jiān)督學習和純強化學習。自監(jiān)督學習就像填空,在NLP任務上表現(xiàn)很好(實際上是預測句子中缺失的單詞),但在圖像識別和理解任務上就表現(xiàn)一般。

為什么?因為這世界并不全是可預測的。對于視頻預測任務,結(jié)果可能有多重可能,訓練系統(tǒng)做出唯一一種預測的結(jié)果往往會得到唯一“模糊”的結(jié)果,即所有未來結(jié)果的“平均”。這并不是理想的預測。

我們需要利用隱變量來處理不確定性。訓練樣本只是整個可能的輸出集合的表示。

幾百年以來,理論的提出往往伴隨著之后的偉大發(fā)明和創(chuàng)造。深度學習和智能理論在未來會帶來什么?值得我們拭目以待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265300
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124396

原文標題:圖靈獎得主Hinton和 LeCun最新演講:深度學習如何繼續(xù)革命?

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    人工智能與機器學習在這些行業(yè)的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器學習
    的頭像 發(fā)表于 02-04 14:44 ?470次閱讀

    機器學習深度學習中需避免的 7 個常見錯誤與局限性

    ,并驗證輸出結(jié)果,就能不斷提升專業(yè)技能,養(yǎng)成優(yōu)秀數(shù)據(jù)科學家的工作習慣。需避免的機器學習深度學習數(shù)據(jù)錯誤訓練數(shù)據(jù)驅(qū)動的人工智能模型時,我們
    的頭像 發(fā)表于 01-07 15:37 ?187次閱讀
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業(yè)制造領域 復雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標準化缺陷模式 非標產(chǎn)品分類:對形狀、顏色、紋理多變的產(chǎn)品進行智能分類 外觀質(zhì)量評估:基于學習的外觀質(zhì)量標
    的頭像 發(fā)表于 11-27 10:19 ?220次閱讀

    5G與6G:從“萬物互聯(lián)“到“智能無界“的跨越

    智能手機、智能家居、智能汽車日益普及的今天,我們已經(jīng)習慣了高速網(wǎng)絡帶來的便利。而當我們還在享受5G帶來
    發(fā)表于 10-10 13:59

    《AI芯片:科技探索與AGI愿景》—— 勾勒計算未來的戰(zhàn)略羅盤

    、數(shù)據(jù)與算力三者間錯綜復雜的共生關(guān)系,并前瞻性地討論了能耗、倫理與全球競爭等關(guān)鍵議題。 書中一幅AGI技術(shù)演進路線圖(如圖2)令人印象深刻,它清晰地標定了我們從“深度學習爆發(fā)”到“具身智能”,最終邁向
    發(fā)表于 09-17 09:32

    如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 討論人工智能(AI)或深度
    的頭像 發(fā)表于 09-10 17:38 ?900次閱讀
    如何在機器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經(jīng)網(wǎng)絡

    深度學習對工業(yè)物聯(lián)網(wǎng)有哪些幫助

    深度學習作為人工智能的核心分支,通過模擬人腦神經(jīng)網(wǎng)絡的層級結(jié)構(gòu),能夠自動從海量工業(yè)數(shù)據(jù)中提取復雜特征,為工業(yè)物聯(lián)網(wǎng)(IIoT)提供了從數(shù)據(jù)感知到智能決策的全鏈路升級能力。以下從技術(shù)賦能、場景突破
    的頭像 發(fā)表于 08-20 14:56 ?1022次閱讀

    自動駕駛中Transformer大模型取代深度學習嗎?

    持續(xù)討論。特別是自動駕駛領域,部分廠商開始嘗試將多模態(tài)大模型(MLLM)引入到感知、規(guī)劃與決策系統(tǒng),引發(fā)了“傳統(tǒng)深度學習是否已過時”的激烈爭論。然而,從技術(shù)原理、算力成本、安全需求與實際落地路徑等維度來看,Transforme
    的頭像 發(fā)表于 08-13 09:15 ?4184次閱讀
    自動駕駛中Transformer大模型<b class='flag-5'>會</b>取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢

    。 ? 一、AI核心技術(shù)突破 ? ? 1. ? 深度學習(Deep Learning) ? ? ? 深度學習是目前AI發(fā)展的核心驅(qū)動力,尤其是Transformer架構(gòu)的廣泛應用,使得
    的頭像 發(fā)表于 07-16 15:01 ?1853次閱讀

    深度學習遇上嵌入式資源困境,特征空間如何破局?

    近年來,隨著人工智能(AI)技術(shù)的迅猛發(fā)展,深度學習(Deep Learning)成為最熱門的研究領域之一。語音識別、圖像識別、自然語言處理等領域,
    發(fā)表于 07-14 14:50 ?1241次閱讀
    當<b class='flag-5'>深度</b><b class='flag-5'>學習</b>遇上嵌入式資源困境,特征空間如何破局?

    CES Asia 2025蓄勢待發(fā),聚焦低空經(jīng)濟與AI,引領未來產(chǎn)業(yè)新變革

    可能性。智能無人機物流配送、巡檢監(jiān)測等領域的應用愈發(fā)成熟,大大提高了工作效率和精準度。低空經(jīng)濟的發(fā)展,不僅帶動了相關(guān)技術(shù)的進步,還創(chuàng)造了新的就業(yè)機會和經(jīng)濟增長點。 人工智能領域同樣發(fā)展迅猛,
    發(fā)表于 07-09 10:29

    物聯(lián)網(wǎng)未來發(fā)展趨勢如何?

    ,人們才會更加信任和接受物聯(lián)網(wǎng)技術(shù)。 綜上所述,物聯(lián)網(wǎng)行業(yè)的未來發(fā)展趨勢非常廣闊。智能家居、工業(yè)互聯(lián)網(wǎng)、智慧城市、醫(yī)療保健以及數(shù)據(jù)安全和隱私保護都將成為物聯(lián)網(wǎng)行業(yè)的熱點領域。我們有理由相信,不久的將來,物聯(lián)網(wǎng)將進一步改變我們
    發(fā)表于 06-09 15:25

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎算法的應用

    : 一、機器人視覺:從理論到實踐 第7章詳細介紹了ROS2機器視覺領域的應用,涵蓋了相機標定、OpenCV集成、視覺巡線、二維碼識別以及深度學習目標檢測等內(nèi)容。通過
    發(fā)表于 05-03 19:41

    OpenVINO?工具套件的深度學習工作臺中無法導出INT8模型怎么解決?

    無法 OpenVINO? 工具套件的深度學習 (DL) 工作臺中導出 INT8 模型
    發(fā)表于 03-06 07:54

    如何排除深度學習工作臺上量化OpenVINO?的特定層?

    無法確定如何排除要在深度學習工作臺上量化OpenVINO?特定層
    發(fā)表于 03-06 07:31