91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度光學和人工智能推理應用,實現高速高帶寬低功耗AI計算

工程師鄧生 ? 來源:機器之心 ? 作者:Gordon Wetzstein等 ? 2020-12-10 14:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

相比于電子計算,光計算具有高速、高帶寬、低功耗的優(yōu)勢,但目前光計算還不夠成熟,只在某些特定領域得到了非常有限的應用。近日,Nature 上一篇 Perspective 文章剖析了深度光學和深度光子學的人工智能推理應用,展示了該領域(尤其是光 - 電混合系統(tǒng))的發(fā)展?jié)摿Α?/p>

為了高速且低功耗地執(zhí)行各種應用中的人工智能任務,我們需要加速器。光計算系統(tǒng)也許能夠滿足這些領域特定的需求,但即便已經歷半個世紀的研究,通用型光計算系統(tǒng)仍還未發(fā)展成一項成熟的實用技術。但是,人工智能推理(尤其是用于視覺計算應用的推理)也許能為基于光學和光子學系統(tǒng)的推理提供機會。

本文將回顧用于人工智能的光學計算的近期研究成果并探討其潛力和挑戰(zhàn)。

計算系統(tǒng)的能力正與它們試圖理解的飛速增長的視覺數據進行軍備競賽。在自動駕駛機器人視覺、智能家居、遙感、顯微技術、監(jiān)控、國防和物聯網等多種應用中,計算成像系統(tǒng)都會記錄和處理前所未有的巨量數據。對這些數據的解讀不可能由人類完成,而是要使用基于人工智能(AI)構建的算法。

在這些應用之中,深度神經網絡(DNN)正快速發(fā)展成為視覺數據處理的標準算法方法。這主要是因為 DNN 在許多基準上都取得了當前最佳的結果,而且往往超出其它方法一大截。深度學習近來的這些突破性進展主要得益于現代圖形處理單元(GPU)的強大處理能力和并行計算能力以及大規(guī)模視覺數據集的可用性,這些進展讓 DNN 可以高效地使用監(jiān)督式機器學習策略執(zhí)行訓練。

但是,高端 GPU 和其它運行日趨復雜的神經網絡的加速器的功耗和帶寬需求非常高,它們需要大量處理時間而且具有尺寸龐大的外形。這些限制讓人難以在邊緣設備中使用 DNN,比如相機、自動化載具、機器人或物聯網外圍設備。以自動汽車中的視覺系統(tǒng)為例,其必須要能使用有限的計算資源實時地做出穩(wěn)定可靠的決策。當汽車在高速行駛時,瞬間的決策關乎人的生死。事實上,如果計算成像系統(tǒng)能做到更精簡,那么幾乎所有邊緣設備都能從中受益,這能帶來更低的延遲以及尺寸、重量和功耗方面的改進。

DNN 一般都包含訓練和推理兩個階段,這兩個階段的計算需求差異很大。在訓練階段,會向 DNN 輸入大量有標注的樣本,然后針對某個特定任務,使用迭代方法優(yōu)化該 DNN 的參數。訓練完成后,可使用該 DNN 來執(zhí)行推理:以前向通過的方式向該網絡輸入一個數據(比如一張圖像),經過該網絡處理后計算得到所需結果。雖然某些應用也會使用 GPU 來執(zhí)行推理,但對許多邊緣設備而言,由于前述原因,使用 GPU 并不現實。

盡管電子 AI 加速器很靈活,但光神經網絡(ONN)和光子回路可能為該應用與其它機器學習應用帶來一次范式轉換。光計算系統(tǒng)有望實現大規(guī)模的并行計算,同時設備尺寸還更小,而且在某些實現中的功耗非常低。事實上,在計算系統(tǒng)中使用光來實現通信的光互連(optical interconnect)技術已經在現如今的數據中心中得到了廣泛應用,而且在計算系統(tǒng)更深處越來越多地使用光互連可能是持續(xù)擴展的關鍵。

不同于電互連技術,隨著光學、光電和電子設備的更深度整合,光互連有望為通信的帶寬密度和單位比特的能量消耗帶來幾個數量級的提升和改善。這種改進過的互連技術能實現電 - 光混合 DNN,而且這種低功耗、高并行的集成技術還可用作模擬光處理器的部件。

盡管光計算機潛力巨大而且也已歷經約半個世紀的研究,但通用型光計算仍還不是一項成熟的實用技術。但是,推理任務(尤其是用于視覺計算應用的推理任務)已可使用全光學或光 - 電混合系統(tǒng)來很好地實現。舉個例子,線性光學元件可以近乎「免費」地計算卷積、傅立葉變換、隨機投影和許多其它運算,因為這些運算可作為光與物質交互或光傳播的副產物。這些運算是 DNN 架構的基本構建模塊,驅動著大多數現代視覺計算算法。我們有望以光速執(zhí)行這些運算,同時功耗需求很低乃至沒有。本文認為這具有變革性的潛力。

回顧光計算的歷史

下圖 1 展示了人工智能及相關光學和光子學實現的時間軸。其中展示了一些經過挑選的里程碑和論文,并重點關注了近期進展。

eb1f7d1017a3412d9d32c6f3570c06cb.png

以具體年份計則如下所示:

1949 年,Donald O. Hebb 發(fā)表《行為的組織(The Organization of Behavior)》一書

1957 年,Frank Rosenblatt 提出感知器

1960 年,Widrow & Hoff 提出自適應開關電路

1964 年,Lugt 提出光學相關性(Optical correlation)

1982 年,John Hopfield 提出 Hopfield 網絡;Kohonen 提出自組織特征圖

1984 年,Goodman et al. 發(fā)表論文《用于超大規(guī)模集成電路系統(tǒng)的光互連(Optical interconnections for VLSI systems)》

1985 年,Farhat et al. 發(fā)表論文《Hopfield 模型的光學實現(Optical implementation of the Hopfield model)》

1986 年,Rumelhart et al. 提出使用反向傳播的多層感知器

2006 年,Hinton & Salakhutdinov 提出深度自編碼器

2012 年,Krizhevksy et al. 提出深度 CNN

2017 年,Shen et al. 提出使用納米光子電路的深度學習;Tait et al. 提出神經形態(tài)光子網絡

2018 年,Chang et al. 提出光 CNN;Lin et al. 提出全光衍射神經網絡

2019 年,Feldman et al. 提出高帶寬光子神經突觸網絡

用于人工智能的光子回路

現代 DNN 架構是級聯的線性層后面跟著非線性激活函數,而且這會重復很多次。最一般形式的線性層是全連接層。在這種情況下,每個輸出神經元都是所有輸入神經元的加權和。從數學上看,這可以表示成一種矩陣 - 向量乘法,從而可以有效地使用光學技術實現。也就是說我們可以使用光子回路來執(zhí)行人工智能的相關計算。不過相關技術還面臨著可編程性等有待解決的問題。

使用自由空間、透鏡和復雜介質進行計算

還有一種可替代光子回路的選擇:在自由空間或某種介質中傳播的光場上直接構建計算能力。(見下圖 2)從數學上講,在自由空間中傳播的波可用基爾霍夫衍射積分(Kirchhoff’s diffraction integral)來描述,這相當于讓該場與一個固定的核(kernel)執(zhí)行卷積。該運算又是卷積神經網絡(CNN)的一大基本構建模塊,而 CNN 又是最常用的視覺計算框架。

圖 2:光波傳播概況。如圖所示,上面一行展示了波在自由空間和不同介質中的傳播,下面一行是相應的線性矩陣運算。其中 a 是波穿過自由空間的情況,其在數學上被描述成波場與一個復值核的卷積。b-g 則使用了不同的介質,它們也因此有各自不同的矩陣。

使用深度計算光學和成像來執(zhí)行推理

計算成像領域研究的是光學和圖像處理的聯合設計,這可用于增強計算式相機(computational camera)能力等應用。將相機解釋成編碼器 - 解碼器系統(tǒng)會很有幫助。因此,我們可以從整體角度將相機設計問題看作是光學和成像處理的端到端優(yōu)化問題。因此可以針對經由損失函數和訓練數據集定義的特定任務對物理透鏡和深度神經網絡進行聯合優(yōu)化。(見下圖 3)

圖 3:光學編碼器 - 電子解碼器系統(tǒng)示意圖。其中傳感器充當瓶頸,在角度、波長譜、曝光時間、相位和其它入射光指標上進行積分。自由曲面透鏡或定制傳感器電子設備能以離線方式針對特定任務進行優(yōu)化,然后經過生產加工后用于從光學和電子方面記錄圖像編碼。然后可以使用神經網絡或其它可微分的圖像處理算法來從觀測結果提取所需的信息。這些編碼器和解碼器一起可共同組成一個混合式的光 - 電神經網絡。

我們也可以將光學操作的原理解讀為一種形式的計算,即與處理數據記錄的電子平臺一起工作的預處理器或協處理器?;谶@一解讀,我們可以讓光學組件做盡可能多的工作,進而優(yōu)化計算成像系統(tǒng)的延遲和功耗需求。

顯微鏡應用

光學顯微鏡也是深度學習方法已經取得重大影響的一個領域,其涵蓋多種模態(tài),包括相干成像以及明視野顯微鏡和熒光顯微鏡。解決顯微圖像重建和增強的反向問題已經是一項持續(xù)數十年的熱門研究課題,之前方法的一大關鍵是建立成像系統(tǒng)的前向模型?;谏疃葘W習的數據驅動方法是解決光學顯微鏡反向問題的另一條途徑。

圖 4:深度光學和光子學應用示例 I。a. 光學圖像分類;b. 混合光電圖像分類;c. 使用偽隨機投影的圖像分類;d. 虛擬染色;e. 虛擬重新聚焦。

圖 5:深度光學和光子學應用示例 I。a. 單像素相機;b. 用于視頻超分辨率的神經傳感器;c. 納米光子回路;d. 光子集成電路;e. 光學干涉儀;f. 逆向設計的非均勻介質。

展望未來

文章認為,混合光 - 電計算系統(tǒng)是這一領域最有發(fā)展前景的方向?;旌舷到y(tǒng)既具備光計算的帶寬和速度優(yōu)勢,又具備電計算的靈活性,而且還能利用模擬和數字光學 / 光電 / 電子系統(tǒng)的高能效技術基礎?;旌瞎?- 電推理機器能將 AI 推理用于計算機視覺、機器人學、顯微和其它視覺計算任務,進而實現光學計算機早該具有的變革性能力。

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 光學
    +關注

    關注

    4

    文章

    866

    瀏覽量

    38108
  • 低功耗
    +關注

    關注

    12

    文章

    3438

    瀏覽量

    106689
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265295
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何在邊緣AI應用場景中實現高性能、低功耗推理(上)

    。這種方法需要巨大的帶寬才能將海量數據傳輸到云端。 邊緣設備越來越多地使用AI推理技術,以實現快速實時響應并提高數據隱私和安全性,同時避免與云連接產生的延遲和成本。這也降低了
    的頭像 發(fā)表于 02-27 07:48 ?6598次閱讀
    如何在邊緣<b class='flag-5'>AI</b>應用場景中<b class='flag-5'>實現</b>高性能、<b class='flag-5'>低功耗</b><b class='flag-5'>推理</b>(上)

    三款DFB激光器芯片,人工智能等高帶寬、低功耗場景可用

    ,系統(tǒng)對功耗、穩(wěn)定性和可靠性的要求也愈發(fā)嚴苛。 ? 在這樣的行業(yè)困境下,大功率DFB激光器芯片憑借其帶寬、低功耗等特性,成為滿足高端應用需求、推動光通信技術突破的關鍵組件,在數據中心
    的頭像 發(fā)表于 09-12 07:28 ?7538次閱讀

    AI 芯片浪潮下,職場晉升新契機?

    方向,就明確涵蓋了人工智能芯片的研發(fā)、部署與優(yōu)化技術崗位 。如果你從事 GPU 相關研發(fā)工作,在申報職稱時,就需著重突出在圖形處理加速、大規(guī)模并行計算等方面的成果,因為 GPU 的并行結構及強大浮點
    發(fā)表于 08-19 08:58

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應用場景。從數據采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,
    發(fā)表于 08-07 14:23

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢
    發(fā)表于 07-16 15:29

    大模型推理顯存和計算量估計方法研究

    隨著人工智能技術的飛速發(fā)展,深度學習大模型在各個領域得到了廣泛應用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應用帶來了挑戰(zhàn)。為了解決這一問題,本文將探討大模型
    發(fā)表于 07-03 19:43

    Nordic收購 Neuton.AI 關于產品技術的分析

    示例和支持,方便開發(fā)者在 Nordic 的各類芯片上實現高效的邊緣 AI 應用; 如果對這個AI人工智能應用感興趣,請評論區(qū)聯系我們.
    發(fā)表于 06-28 14:18

    MAX78000采用超低功耗卷積神經網絡加速度計的人工智能微控制器技術手冊

    人工智能(AI)需要超強的計算能力,而Maxim則大大降低了AI計算所需的功耗。MAX78000
    的頭像 發(fā)表于 05-08 11:42 ?985次閱讀
    MAX78000采用超<b class='flag-5'>低功耗</b>卷積神經網絡加速度計的<b class='flag-5'>人工智能</b>微控制器技術手冊

    MAX78002帶有低功耗卷積神經網絡加速器的人工智能微控制器技術手冊

    人工智能(AI)需要超強的計算能力,而Maxim則大大降低了AI計算所需的功耗。MAX78002
    的頭像 發(fā)表于 05-08 10:16 ?844次閱讀
    MAX78002帶有<b class='flag-5'>低功耗</b>卷積神經網絡加速器的<b class='flag-5'>人工智能</b>微控制器技術手冊

    適用于數據中心和AI時代的800G網絡

    隨著人工智能AI)技術的迅猛發(fā)展,數據中心面臨著前所未有的計算和網絡壓力。從大語言模型(LLM)訓練到生成式AI應用,海量數據處理需求推動了網絡
    發(fā)表于 03-25 17:35

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    低功耗特性。搭載 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPS的 AI 計算能力,使其在計算機視覺、邊緣
    發(fā)表于 03-19 17:54

    支持實時物體識別的視覺人工智能微處理器RZ/V2MA數據手冊

    DRP-AI 采用了一種由動態(tài)可重構處理器(DRP)和 AI-MAC組成的人工智能加速器,該加速器可加速人工智能推理,
    的頭像 發(fā)表于 03-18 18:12 ?916次閱讀
    支持實時物體識別的視覺<b class='flag-5'>人工智能</b>微處理器RZ/V2MA數據手冊

    用于實時人類和物體識別的視覺-AI ASSP人工智能微處理器RZ/V2M數據手冊

    配置了DRP和AI-MAC的人工智能硬件IP DRP-AI高速人工智能推理
    的頭像 發(fā)表于 03-14 17:41 ?935次閱讀
    用于實時人類和物體識別的視覺-<b class='flag-5'>AI</b> ASSP<b class='flag-5'>人工智能</b>微處理器RZ/V2M數據手冊

    智能光學計算成像技術與應用

    智能光學計算成像是一個將人工智能AI)與光學成像技術相結合的前沿領域,它通過
    的頭像 發(fā)表于 03-07 17:18 ?1521次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>光學</b><b class='flag-5'>計算</b>成像技術與應用