91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習的發(fā)展會帶給硬件架構怎樣的影響?

張康康 ? 2019-07-29 18:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


2019 ISSCC 大會于2月17—21日在美國舊金山開幕,Facebook 首席 AI 科學家 Yann LeCun 在會上發(fā)表了主題演講「深度學習硬件:過去、現在和未來」,詳細介紹了深度學習研究的發(fā)展將如何影響未來硬件架構。

如今,只要在網絡上搜索“深度學習”算法,都會顯示很多相關的信息,在過去的數十年里,人工智能已經越來越成功地應用于生物識別、語音識別、視頻識別、翻譯等。國內更是誕生了諸如曠視科技、商湯科技、極鏈科技Video++、依圖科技等優(yōu)秀人工智能初創(chuàng)企業(yè)。設計人員將大量高度并行的計算加載到硬件上,尤其是最初為快速圖像渲染而開發(fā)的圖形處理單元(GPU)。這些芯片特別適合于計算密集型“訓練”階段,該階段使用許多經過驗證的例子來調整系統(tǒng)參數。在“推理”階段,其中部署深度學習處理的輸入,需要更大的存儲器訪問和快速響應,目前已經可以使用GPU實現。

深度學習與GPU

為了快速應對增長的需求,許多公司都正在開發(fā)能夠直接賦予深度學習能力的硬件,迫切的需要進行推理以及培訓。近年來隨著深度學習的迅速發(fā)展,卷積神經網絡(Convolutional Neural Network)被廣泛使用,特別是在圖像識別場景中的應用。為了滿足更多場景應用,需要有一種能夠根據實際場景需求替換不同CNN網絡模型的系統(tǒng)框架。在過去的20年里,視頻、游戲等產業(yè)推動了GPU的進步,其繪制圖形所需的矩陣正是深度學習所需的計算類型。

GPU技術的進步則是推動了神經網絡的發(fā)展,因為在沒有GPU的情況下訓練深度學習模型在大多數情況下會非常緩慢。許多人把生產中深度學習的想法想的過于復雜,我們可以在生產中使用CPU和選擇的網絡服務器進行深入學習。生產中進行訓練是非常罕見的。即使你想每天更新你的模型權重,也不需要在生產中進行訓練。這意味著你只是在生產過程中進行“推理”,比“培訓”更快更容易。你可以使用任何你喜歡的Web服務器,并將其設置為簡單的API調用。如果能夠有效地批量處理數據,GPU只會提供更快的速度。

GPU在處理圖形的時候,從最初的設計就能夠執(zhí)行并行指令,從一個GPU核心收到一組多邊形數據,到完成所有處理并輸出圖像可以做到完全獨立。由于最初GPU就采用了大量的執(zhí)行單元,這些執(zhí)行單元可以輕松的加載并行處理,而不像CPU那樣的單線程處理。另外,現代的GPU也可以在每個指令周期執(zhí)行更多的單一指令。所以GPU比CPU更適合深度學習的大量矩陣、卷積運算的需求。深度學習的應用與其原先的應用需求頗為類似。GPU廠家順理成章的在深度學習,找到了新增長點。

深度學習發(fā)展是否出現“瓶頸”

我們之所以使用GPU加速深度學習,是因為深度學習所要計算的數據量異常龐大,用傳統(tǒng)的計算方式需要漫長的時間。但如果未來深度學習的數據量有所下降,或者說我們不能提供給深度學習所需要的足夠數據量,是否就意味著深度學習也要進入“瓶頸”了呢?

做深度神經網絡訓練需要大量模型,然后才能實現數學上的收斂。深度學習要真正接近成人的智力,它所需要的神經網絡規(guī)模非常龐大,它所需要的數據量,會比我們做語言識別、圖像處理要多得多。假設說,我們發(fā)現我們沒有辦法提供這樣的數據,則很有可能出現瓶頸。

目前,深度學習還在蓬勃發(fā)展往上的階段。比如我們現階段主要做得比較成熟的語音、圖像、視頻方面,整個的數據量還是在不斷的增多的,網絡規(guī)模也在不斷的變復雜??梢哉f深度學習是GPU計算發(fā)展的關鍵,誰能找到最適合深度學習的模式,誰就是勝利者。

結語:

深度學習經過這么長時間的發(fā)展,在網絡的種類、復雜程度和處理的信息量上都發(fā)生了天翻地覆的變化。當前,網絡種類上,從早期的 AlexNet 和 GoogleNet 到現在各企業(yè)推出的 GAN以及各種深度強化學習的網絡,它們各自網絡結構都有不同,開發(fā)者在適應最新的網絡上常常會遇到一些麻煩。處理的信息量也在成倍地增長,算力需求越來越高的情況下,也將對搭載處理單元的硬件有著更高的要求。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396
  • 深度學習技術

    關注

    0

    文章

    11

    瀏覽量

    6948
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能與機器學習在這些行業(yè)的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領域。人工智能(AI)與機器學習(ML)的深度應用,徹底重塑了整個行業(yè)的
    的頭像 發(fā)表于 02-04 14:44 ?470次閱讀

    機器學習深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關注數據、模型
    的頭像 發(fā)表于 01-07 15:37 ?187次閱讀
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課(11大系列課程,共5000+分鐘)

    的亮點及優(yōu)勢? 一、課程亮點 工業(yè)級案例:包含雙CCD光學分選轉盤、機械手手眼協(xié)調等12個完整項目 源碼交付:所有案例提供LabVIEW源代碼,包含深度學習模型DLL 硬件聯動:支持工業(yè)相機硬觸發(fā)
    發(fā)表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    的亮點及優(yōu)勢? 一、課程亮點 工業(yè)級案例:包含雙CCD光學分選轉盤、機械手手眼協(xié)調等12個完整項目 源碼交付:所有案例提供LabVIEW源代碼,包含深度學習模型DLL 硬件聯動:支持工業(yè)相機硬觸發(fā)
    發(fā)表于 12-03 13:50

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業(yè)制造領域 復雜缺陷檢測:處理傳統(tǒng)算法難以描述的非標準化缺陷模式 非標產品分類:對形狀、顏色、紋理多變的產品進行智能分類 外觀質量評估:基于學習的外觀質量標準判定 精密
    的頭像 發(fā)表于 11-27 10:19 ?220次閱讀

    請問UART硬件FIFO深度是多少?如何避免數據溢出?

    UART 硬件 FIFO 深度是多少?如何避免數據溢出?
    發(fā)表于 11-21 06:59

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優(yōu)勢如下: ①模塊化特性②標準接口③開源
    發(fā)表于 09-12 17:30

    如何在機器視覺中部署深度學習神經網絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經常會出現“神經網絡”、“黑箱”、“標注”等術語。這些概
    的頭像 發(fā)表于 09-10 17:38 ?900次閱讀
    如何在機器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經網絡

    自動駕駛中Transformer大模型會取代深度學習嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領域的驚艷表現,“Transformer架構是否正在取代傳統(tǒng)深度學習”這一話題一直被
    的頭像 發(fā)表于 08-13 09:15 ?4184次閱讀
    自動駕駛中Transformer大模型會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構限制,難以高效處理AI任務中的大規(guī)模并行計算需求。因此,專為AI優(yōu)化的芯片應運而生,成為推動深度
    的頭像 發(fā)表于 07-09 15:59 ?1558次閱讀

    Transformer架構概述

    由于Transformer模型的出現和快速發(fā)展,深度學習領域正在經歷一場翻天覆地的變化。這些突破性的架構不僅重新定義了自然語言處理(NLP)的標準,而且拓寬了視野,徹底改變了AI的許多
    的頭像 發(fā)表于 06-10 14:24 ?1286次閱讀
    Transformer<b class='flag-5'>架構</b>概述

    上能電氣即將亮相上海SNEC展會

    隨著上海SNEC展會臨近,行業(yè)再次聚焦“技術創(chuàng)新”與“系統(tǒng)價值”的深度融合。“430政策”與“531政策”的相繼實施,標志著行業(yè)加速邁向高質量發(fā)展新階段。
    的頭像 發(fā)表于 05-30 16:10 ?838次閱讀

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現代計算機中不可或缺的一部分,已經從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應用于人工智能、科學計算
    的頭像 發(fā)表于 05-30 10:36 ?1852次閱讀
    GPU<b class='flag-5'>架構</b><b class='flag-5'>深度</b>解析

    解鎖未來汽車電子技術:軟件定義車輛與區(qū)域架構深度解析

    解鎖未來汽車電子技術:軟件定義車輛與區(qū)域架構深度解析 ——立即下載白皮書,搶占智能汽車發(fā)展先機 *附件:解鎖未來汽車電子技術:軟件定義車輛與區(qū)域架構
    的頭像 發(fā)表于 04-27 11:58 ?1398次閱讀

    如何排除深度學習工作臺上量化OpenVINO?的特定層?

    無法確定如何排除要在深度學習工作臺上量化OpenVINO?特定層
    發(fā)表于 03-06 07:31