91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU深度學(xué)習(xí)面臨的挑戰(zhàn)分析

我快閉嘴 ? 來源:AI前線 ? 作者:Ben Dickson ? 2020-12-11 15:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能的興起觸發(fā)了市場(chǎng)對(duì) GPU 的大量需求,但 GPU 在 AI 場(chǎng)景中的應(yīng)用面臨使用壽命短、使用成本高等問題?,F(xiàn)場(chǎng)可編程門陣列 (FPGA) 這一可以定制化硬件處理器反倒是更好的解決方案。隨著可編程性等問題在 FPGA 上的解決,F(xiàn)PGA 將成為市場(chǎng)人工智能應(yīng)用的選擇。

在過去的十年里,人工智能的再一次興起使顯卡行業(yè)受益匪淺。英偉達(dá) (Nvidia) 和 AMD 等公司的股價(jià)也大幅上漲,因?yàn)槭聦?shí)表明,它們的 GPU 在訓(xùn)練和運(yùn)行 深度學(xué)習(xí)模型 方面效果明顯。實(shí)際上,英偉達(dá)也已經(jīng)對(duì)自己的業(yè)務(wù)進(jìn)行了轉(zhuǎn)型,之前它是一家純粹做 GPU 和游戲的公司,現(xiàn)在除了作為一家云 GPU 服務(wù)提供商外,英偉達(dá)還成立了專業(yè)的人工智能研究實(shí)驗(yàn)室。

不過,機(jī)器學(xué)習(xí)軟件公司 Mipsology 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人盧多維奇?拉祖爾 (Ludovic Larzul) 表示,GPU 還存在著一些缺陷,這使其在 AI 應(yīng)用中面臨著一些挑戰(zhàn)。

Larzul 表示,想要解決這些問題的解決方案便是實(shí)現(xiàn)現(xiàn)場(chǎng)可編程門陣列 (FPGA),這也是他們公司的研究領(lǐng)域。FPGA 是一種處理器,可以在制造后定制,這使得它比一般處理器更高效。但是,很難對(duì) FPGA 進(jìn)行編程,Larzul 希望通過自己公司開發(fā)的新平臺(tái)解決這個(gè)問題。

專業(yè)的人工智能硬件已經(jīng)成為了一個(gè)獨(dú)立的產(chǎn)業(yè),但對(duì)于什么是深度學(xué)習(xí)算法的最佳基礎(chǔ)設(shè)施,人們?nèi)匀粵]有定論。如果 Mipsology 成功完成了研究實(shí)驗(yàn),許多正受 GPU 折磨的 AI 開發(fā)者將從中受益。

GPU 深度學(xué)習(xí)面臨的挑戰(zhàn)

三維圖形是 GPU 擁有如此大的內(nèi)存和計(jì)算能力的根本原因,它與 深度神經(jīng)網(wǎng)絡(luò) 有一個(gè)共同之處:都需要進(jìn)行大量矩陣運(yùn)算。

顯卡可以并行執(zhí)行矩陣運(yùn)算,極大地加快計(jì)算速度。圖形處理器可以把訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時(shí)間從幾天、幾周縮短到幾小時(shí)、幾分鐘。

隨著圖形硬件公司供貨的不斷增加,GPU 在深度學(xué)習(xí)中的市場(chǎng)需求還催生了大量公共云服務(wù),這些服務(wù)為深度學(xué)習(xí)項(xiàng)目提供強(qiáng)大的 GPU 虛擬機(jī)。

但是顯卡也受硬件和環(huán)境的限制。Larzul 解釋說:“神經(jīng)網(wǎng)絡(luò)訓(xùn)練通常是在一個(gè)確定的環(huán)境中進(jìn)行的,運(yùn)行神經(jīng)網(wǎng)絡(luò)的系統(tǒng)會(huì)在部署中遇到各種限制——這可能會(huì)對(duì) GPU 的實(shí)際使用造成壓力?!?/p>

GPU 需要大量的電力,會(huì)產(chǎn)生大量的熱量,并需要使用風(fēng)扇冷卻。當(dāng)你在臺(tái)式工作站、筆記本電腦或機(jī)架式服務(wù)器上訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),這不是什么大問題。但是,許多部署深度學(xué)習(xí)模型的環(huán)境對(duì) GPU 并不友好,比如自動(dòng)駕駛汽車、工廠、機(jī)器人和許多智慧城市環(huán)境,在這些環(huán)境中硬件必須忍受熱、灰塵、濕度、運(yùn)動(dòng)和電力限制等環(huán)境因素。

Larzul 說:“在一些關(guān)鍵的應(yīng)用場(chǎng)景中,比如智慧城市的視頻監(jiān)控,要求硬件暴露在對(duì) GPU 有不利影響的環(huán)境因素 (比如太陽) 下?!?GPU 受晶體管技術(shù)的限制,導(dǎo)致它們?cè)诟邷叵逻\(yùn)行時(shí)需要及時(shí)冷卻,而這并不總是可以實(shí)現(xiàn)的。要做到這點(diǎn)需要更多的電力、維護(hù)成本等。”

使用壽命也是一個(gè)問題。一般來說,GPU 的使用 壽命約為 2-5 年,這對(duì)那些每隔幾年就換一次電腦的玩家來說不是什么大問題。但在其他領(lǐng)域,如汽車行業(yè),需要硬件有更高的耐用性,這就帶來了問題。特別是過多的暴露在惡劣的環(huán)境中,再加上高強(qiáng)度的使用,GPU 的使用壽命將會(huì)更短。

Larzul 說:“從商業(yè)可行性方面考慮,自動(dòng)駕駛汽車等應(yīng)用可能需要多達(dá) 7-10 個(gè) GPU(其中大多數(shù)會(huì)在不到四年的時(shí)間內(nèi)失效),對(duì)于大多數(shù)購車者來說,智能或自動(dòng)駕駛汽車的成本將變得不切實(shí)際?!?/p>

機(jī)器人、醫(yī)療保健和安全系統(tǒng)等其他行業(yè)也面臨著類似的挑戰(zhàn)。

FPGA 和深度學(xué)習(xí)

FPGA 是可定制的硬件設(shè)備,可對(duì)其組件進(jìn)行調(diào)節(jié),因此可以針對(duì)特定類型的架構(gòu) (如 卷積神經(jīng)網(wǎng)絡(luò)) 進(jìn)行優(yōu)化。其可定制性特征降低了對(duì)電力的需求,并在運(yùn)算速度和吞吐量方面提供了更高的性能。它們的使用壽命也更長,大約是 GPU 的 2-5 倍,并且對(duì)惡劣環(huán)境和其它特殊環(huán)境因素有更強(qiáng)的適應(yīng)性。

有一些公司已經(jīng)在他們的人工智能產(chǎn)品中使用了 FPGA。微軟 就是其中一家,它將基于 FPGA 的機(jī)器學(xué)習(xí)技術(shù)作為其 Azure 云服務(wù)產(chǎn)品的一部分來提供。

不過 FPGA 的缺陷是難于編程。配置 FPGA 需要具備硬件描述語言 (如 Verilog 或 VHDL) 的知識(shí)和專業(yè)技能。機(jī)器學(xué)習(xí)程序是用 Python 或 C 等高級(jí)語言編寫的,將其邏輯轉(zhuǎn)換為 FPGA 指令非常困難。在 FPGA 上運(yùn)行 TensorFlow、PyTorch、Caffe 和其他框架建模的神經(jīng)網(wǎng)絡(luò)通常需要消耗大量的人力時(shí)間和精力。

“要對(duì) FPGA 進(jìn)行編程,你需要組建一支懂得如何開發(fā) FPGA 的硬件工程師團(tuán)隊(duì),并聘請(qǐng)一位了解神經(jīng)網(wǎng)絡(luò)的優(yōu)秀架構(gòu)師,花費(fèi)幾年時(shí)間去開發(fā)一個(gè)硬件模型,最終編譯運(yùn)行在 FPGA 上,與此同時(shí)你還需要處理 FPGA 使用效率和使用頻率的問題?!癓arzul 說。此外你還需要具備廣泛的數(shù)學(xué)技能,以較低的精度準(zhǔn)確地計(jì)算模型,并需要一個(gè)軟件團(tuán)隊(duì)將 AI 框架模型映射到硬件架構(gòu)。

Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這一差距。Zebra 是一種軟件平臺(tái),開發(fā)者可以輕松地將深度學(xué)習(xí)代碼移植到 FPGA 硬件上。

Larzul 說:“我們提供了一個(gè)軟件抽象層,它隱藏了通常需要高級(jí) FPGA 專業(yè)知識(shí)的復(fù)雜性?!薄爸恍杓虞d Zebra,輸入一個(gè) Linux 命令,Zebra 就可以工作了——它不需要編譯,不需要對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行任何更改,也不需要學(xué)習(xí)任何新工具。不過你可以保留你的 GPU 用于訓(xùn)練?!?/p>

AI 硬件前景

Mipsology 的 Zebra 平臺(tái)是開發(fā)者探索在 AI 項(xiàng)目中使用 FPGA 的 眾多方案之一。Xilinx 是 FPGA 領(lǐng)域的領(lǐng)導(dǎo)者,已經(jīng)開發(fā)了 Zebra 并將其集成到了電路板中。其他公司,如谷歌和特斯拉,也正積極的為其開發(fā)專用的 AI 硬件,用于自己的云產(chǎn)品和邊緣計(jì)算產(chǎn)品環(huán)境中。

神經(jīng)形態(tài)芯片 方面也有著一些發(fā)展,這是一種專門為神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的計(jì)算機(jī)架構(gòu)。英特爾在神經(jīng)形態(tài)計(jì)算領(lǐng)域處于領(lǐng)先地位,已經(jīng)開發(fā)了幾種模型架構(gòu),不過該領(lǐng)域仍處于早期發(fā)展階段。

還有專門用于特定應(yīng)用的集成電路ASIC),即專為某一特定人工智能需求制造的芯片。但 ASIC 缺乏 FPGA 的靈活性,無法重新編程。

Larzul 最后說,“我們決定專注于軟件業(yè)務(wù),探索研究提升神經(jīng)網(wǎng)絡(luò)性能和降低延遲的方案。Zebra 運(yùn)行在 FPGA 上,因此無需更換硬件就可以支持 AI 推理。FPGA 固件的每次刷新都能給我們帶來更高的性能提升,這得益于其高效性和較短的開發(fā)周期。另外,F(xiàn)PGA 的可選擇方案很多,具有很好的市場(chǎng)適應(yīng)性。”
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636309
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135450
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265363
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)

    、GPU加速訓(xùn)練(可選) 雙軌教學(xué):傳統(tǒng)視覺算法+深度學(xué)習(xí)方案全覆蓋 輕量化部署:8.6M超輕OCR模型,適合嵌入式設(shè)備集成 無監(jiān)督學(xué)習(xí):無需缺陷樣本即可訓(xùn)練高精度檢測(cè)模型 持續(xù)更新:
    發(fā)表于 12-04 09:28

    【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課程(11大系列課程,共5000+分鐘)

    GPU加速訓(xùn)練(可選) 雙軌教學(xué):傳統(tǒng)視覺算法+深度學(xué)習(xí)方案全覆蓋 輕量化部署:8.6M超輕OCR模型,適合嵌入式設(shè)備集成 無監(jiān)督學(xué)習(xí):無需缺陷樣本即可訓(xùn)練高精度檢測(cè)模型 持續(xù)更新:
    發(fā)表于 12-03 13:50

    如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場(chǎng)景

    檢測(cè)應(yīng)用 微細(xì)缺陷識(shí)別:檢測(cè)肉眼難以發(fā)現(xiàn)的微小缺陷和異常 紋理分析:對(duì)材料表面紋理進(jìn)行智能分析和缺陷識(shí)別 3D表面重建:通過深度學(xué)習(xí)進(jìn)行高精度3D建模和檢測(cè) 電子行業(yè)應(yīng)用 PCB板復(fù)雜
    的頭像 發(fā)表于 11-27 10:19 ?220次閱讀

    AI芯片市場(chǎng)鏖戰(zhàn),GPU與ASIC誰將占據(jù)主動(dòng)?

    ,正圍繞性能、成本、靈活性等核心維度展開激烈角逐,各自憑借獨(dú)特優(yōu)勢(shì)占據(jù)細(xì)分市場(chǎng),同時(shí)也面臨著技術(shù)迭代與市場(chǎng)需求變革帶來的挑戰(zhàn)GPU憑借其與生俱來的并行計(jì)算基因,成
    的頭像 發(fā)表于 10-30 12:06 ?768次閱讀
    AI芯片市場(chǎng)鏖戰(zhàn),<b class='flag-5'>GPU</b>與ASIC誰將占據(jù)主動(dòng)?

    Omdia高級(jí)首席分析師暢談運(yùn)營商面臨的網(wǎng)絡(luò)挑戰(zhàn)

    Omdia高級(jí)首席分析師Sameer Ashfaq Malik指出,運(yùn)營商面臨三大核心網(wǎng)絡(luò)挑戰(zhàn):傳統(tǒng)服務(wù)收入低迷、新興服務(wù)(如人工智能)規(guī)?;M(jìn)程緩慢,以及運(yùn)營成本(OPEX)持續(xù)攀升?!癆I
    的頭像 發(fā)表于 10-13 09:19 ?1117次閱讀

    深度學(xué)習(xí)對(duì)工業(yè)物聯(lián)網(wǎng)有哪些幫助

    、實(shí)施路徑三個(gè)維度展開分析: 一、深度學(xué)習(xí)如何突破工業(yè)物聯(lián)網(wǎng)的技術(shù)瓶頸? 1. 非結(jié)構(gòu)化數(shù)據(jù)處理:解鎖“沉睡數(shù)據(jù)”價(jià)值 傳統(tǒng)困境 :工業(yè)物聯(lián)網(wǎng)中70%以上的數(shù)據(jù)為非結(jié)構(gòu)化數(shù)據(jù)(如設(shè)備振動(dòng)波形、紅外圖像、日志文本),傳統(tǒng)方法難以
    的頭像 發(fā)表于 08-20 14:56 ?1025次閱讀

    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行GPU性能分析

    在大語言模型的強(qiáng)化學(xué)習(xí)訓(xùn)練過程中,GPU 性能優(yōu)化至關(guān)重要。隨著模型規(guī)模不斷擴(kuò)大,如何高效地分析和優(yōu)化 GPU 性能成為開發(fā)者面臨的主要
    的頭像 發(fā)表于 07-23 10:34 ?2400次閱讀
    如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行<b class='flag-5'>GPU</b>性能<b class='flag-5'>分析</b>

    FOPLP工藝面臨挑戰(zhàn)

    FOPLP 技術(shù)目前仍面臨諸多挑戰(zhàn),包括:芯片偏移、面板翹曲、RDL工藝能力、配套設(shè)備和材料、市場(chǎng)應(yīng)用等方面。
    的頭像 發(fā)表于 07-21 10:19 ?1535次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>

    別讓 GPU 故障拖后腿,捷智算GPU維修室來救場(chǎng)!

    在AI浪潮洶涌的當(dāng)下,GPU已然成為眾多企業(yè)與科研機(jī)構(gòu)的核心生產(chǎn)力。從深度學(xué)習(xí)模型訓(xùn)練,到影視渲染、復(fù)雜科學(xué)計(jì)算,GPU憑借強(qiáng)大并行計(jì)算能力,極大提升運(yùn)算效率。然而,就像高速運(yùn)轉(zhuǎn)的精密
    的頭像 發(fā)表于 07-17 18:56 ?1148次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來救場(chǎng)!

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    自家GPU 提出的多卡算力互連技術(shù),是早期為了應(yīng)對(duì)深度學(xué)習(xí)對(duì)超高算力需求而單卡算力不足的局面的解決方案,當(dāng)然這都是官方用來吹牛的話術(shù)。我自己在2019年左右第一次接觸到多卡交火的GIY玩法(從學(xué)生到
    發(fā)表于 06-18 19:31

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?1855次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)<b class='flag-5'>深度</b>解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)
    的頭像 發(fā)表于 05-29 10:12 ?4326次閱讀

    存儲(chǔ)示波器的存儲(chǔ)深度對(duì)信號(hào)分析有什么影響?

    存儲(chǔ)深度(Memory Depth)是數(shù)字示波器的核心參數(shù)之一,它直接決定了示波器在單次采集過程中能夠記錄的采樣點(diǎn)數(shù)量。存儲(chǔ)深度對(duì)信號(hào)分析的影響貫穿時(shí)域細(xì)節(jié)捕捉、頻域分析精度、觸發(fā)穩(wěn)定
    發(fā)表于 05-27 14:39

    智慧路燈的推廣面臨哪些挑戰(zhàn)?

    引言 在智慧城市建設(shè)的宏偉藍(lán)圖中,叁仟智慧路燈的推廣面臨哪些挑戰(zhàn)?叁仟智慧路燈作為重要的基礎(chǔ)設(shè)施,承載著提升城市照明智能化水平、實(shí)現(xiàn)多功能集成服務(wù)的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發(fā)表于 03-27 17:02 ?706次閱讀

    智慧路燈在數(shù)據(jù)采集與分析方面面臨挑戰(zhàn)

    叁仟智慧路燈作為現(xiàn)代城市基礎(chǔ)設(shè)施的重要組成部分,通過集成多種傳感器、通信模塊和智能控制算法,實(shí)現(xiàn)了高效節(jié)能、多功能集成和智能化管理。然而,在數(shù)據(jù)采集與分析方面,智慧路燈仍面臨諸多挑戰(zhàn)。 一、技術(shù)
    的頭像 發(fā)表于 03-11 21:22 ?585次閱讀
    智慧路燈在數(shù)據(jù)采集與<b class='flag-5'>分析</b>方面<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>