91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

和谷歌研究人員一起探索數(shù)據(jù)并行的邊界極限

nlfO_thejiangme ? 來(lái)源:YXQ ? 2019-03-22 08:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過(guò)去的幾年里,神經(jīng)網(wǎng)絡(luò)在圖像分類(lèi)、機(jī)器翻譯和語(yǔ)音識(shí)別等領(lǐng)域獲得了長(zhǎng)足的進(jìn)步,取得了十分優(yōu)異的結(jié)果。這樣的成績(jī)離不開(kāi)軟件和硬件的對(duì)訓(xùn)練過(guò)程的加速和改進(jìn)。更快速的訓(xùn)練使得模型質(zhì)量飛速提升,不僅在相同的時(shí)間內(nèi)可以處理更多的數(shù)據(jù),也使得研究人員得以迅速?lài)L試更多的想法,研究出更好的模型。

隨著軟硬件和數(shù)據(jù)中心云計(jì)算的迅速發(fā)展,支撐神經(jīng)網(wǎng)絡(luò)的算力大幅提升,讓模型訓(xùn)練地又好又快。但該如何利用這前所未有的算力來(lái)得到更好的結(jié)果是擺在所有研究人員面前的一個(gè)問(wèn)題,我們是否應(yīng)該用更大的算力來(lái)實(shí)現(xiàn)更快的訓(xùn)練呢?

并行計(jì)算

分布式計(jì)算是使用大規(guī)模算力最常用的方法,可以同時(shí)使用不同平臺(tái)和不同架構(gòu)的處理器。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時(shí)候,一般會(huì)使用模型并行和數(shù)據(jù)并行兩種方式。其中模型并行會(huì)將模型分別置于不同的計(jì)算單元上,使得大規(guī)模的模型訓(xùn)練成為可能,但通常需要對(duì)網(wǎng)絡(luò)架構(gòu)進(jìn)行裁剪以適應(yīng)不同的處理器。而數(shù)據(jù)并行著是將訓(xùn)練樣本分散在多個(gè)計(jì)算單元上,并將訓(xùn)練結(jié)果進(jìn)行同步。

數(shù)據(jù)并行幾乎可以用于任何模型的訓(xùn)練加速,它是目前使用最為廣泛也最為簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)并行訓(xùn)練手段。對(duì)于想SGD等常見(jiàn)的訓(xùn)練優(yōu)化算法來(lái)說(shuō),數(shù)據(jù)并行的規(guī)模與訓(xùn)練樣本的批量大小息息相關(guān)。我們需要探索對(duì)于數(shù)據(jù)并行方法的局限性,以及如何充分利用數(shù)據(jù)并行方法來(lái)加速訓(xùn)練。

實(shí)驗(yàn)中使用的模型、數(shù)據(jù)集和優(yōu)化器。

谷歌的研究人員在先前的研究中評(píng)測(cè)了數(shù)據(jù)并行對(duì)于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的影響,深入探索了批次(batch)的大小與訓(xùn)練時(shí)間的關(guān)系,并在六種不同的神經(jīng)網(wǎng)絡(luò)/數(shù)據(jù)集上利用三種不同的優(yōu)化方法進(jìn)行了測(cè)試。在實(shí)驗(yàn)中研究人員在約450個(gè)負(fù)載上訓(xùn)練了超過(guò)100k個(gè)模型并發(fā)現(xiàn)了訓(xùn)練時(shí)間與批量大小的關(guān)系。

研究人員分別從數(shù)據(jù)集、網(wǎng)絡(luò)架構(gòu)、優(yōu)化器等角度探索了這一關(guān)系的變化,發(fā)現(xiàn)在不同的負(fù)載上訓(xùn)練時(shí)間和批量大小的關(guān)系發(fā)生了劇烈的變化。研究結(jié)果中包含了71M個(gè)模型的測(cè)評(píng)結(jié)果,完整的描繪了100k個(gè)模型的訓(xùn)練曲線,并在論文中的24個(gè)圖中充分體現(xiàn)了出來(lái)。

訓(xùn)練時(shí)間與批量大小間的普遍聯(lián)系

在理想的數(shù)據(jù)并行系統(tǒng)中,模型間的同步時(shí)間可忽略不計(jì),訓(xùn)練時(shí)間可以使用訓(xùn)練的步數(shù)(steps)來(lái)測(cè)定。在這一假設(shè)下,研究人員從實(shí)驗(yàn)的結(jié)果中發(fā)現(xiàn)了三個(gè)區(qū)間的關(guān)系:在完美區(qū)間內(nèi)訓(xùn)練時(shí)間隨著批量大小線性減小,隨之而來(lái)的是遞減拐點(diǎn),最后將達(dá)到最大數(shù)據(jù)并行的極限,無(wú)論如何增大批量的大小即使不考慮硬件,模型的訓(xùn)練時(shí)間也不會(huì)明顯減小。

盡管上述的基本關(guān)系在不同測(cè)試中成立,但研究人員發(fā)現(xiàn)上述過(guò)程中的拐點(diǎn)在不同數(shù)據(jù)集和神經(jīng)網(wǎng)絡(luò)架構(gòu)中的表現(xiàn)十分不同。這意味著簡(jiǎn)單的數(shù)據(jù)并行可以再當(dāng)今硬件極限的基礎(chǔ)上為某些工作提供加速,但除此之外有些工作也許還需要其他方法來(lái)充分利用大規(guī)模算力。

在上面的例子中可以看到,ResNet-8在CIFAR-10并不能從超過(guò)1024的批大小中獲得明顯的加速,而ResNet-50在ImageNet上則可以一直將批大小提升到65536以上來(lái)減小訓(xùn)練時(shí)間。

優(yōu)化任務(wù)

如果可以預(yù)測(cè)出哪一種負(fù)載最適合于數(shù)據(jù)并行訓(xùn)練,我們就可以針對(duì)性的修改任務(wù)負(fù)載以充分利用硬件算力。但遺憾的是實(shí)驗(yàn)結(jié)果并沒(méi)有給出一個(gè)明確的計(jì)算最大有效批次的方法。拐點(diǎn)與網(wǎng)絡(luò)架構(gòu)、數(shù)據(jù)集、優(yōu)化器都有著密切的關(guān)系。例如在相同的數(shù)據(jù)集和優(yōu)化器上,不同的架構(gòu)可能會(huì)有截然不同的最大可用批次數(shù)量。

研究人員認(rèn)為這主要來(lái)源于網(wǎng)絡(luò)寬度和深度的不同,但對(duì)于某些網(wǎng)絡(luò)來(lái)說(shuō)甚至沒(méi)有深度和寬度的概念,所以無(wú)法得到一個(gè)較為清晰的關(guān)系來(lái)計(jì)算最大可用批次數(shù)量。甚至當(dāng)我們發(fā)現(xiàn)有的網(wǎng)絡(luò)架構(gòu)可以接受更大的批次,但在不同數(shù)據(jù)集上的表現(xiàn)又無(wú)法得到統(tǒng)一的結(jié)論,有時(shí)小數(shù)據(jù)集上大批次的表現(xiàn)甚至要好于大數(shù)據(jù)上的結(jié)果。

fig 4圖中顯示了遷移模型和LSTM模型在相同數(shù)據(jù)集上最大批次的不同,右圖則顯示了較大的數(shù)據(jù)集與最大batch也沒(méi)有絕對(duì)的相關(guān)性,LM1B規(guī)模較小但可以達(dá)到較大的batch。但毋庸置疑的是,在優(yōu)化算法上的微小改動(dòng)都會(huì)使得訓(xùn)練結(jié)果在增加批量大小的過(guò)程中發(fā)生極大的變化。這意味著我們可以通過(guò)設(shè)計(jì)新的優(yōu)化器來(lái)最大化的利用數(shù)據(jù)并行的能力。

未來(lái)的工作

雖然利用通過(guò)增加批量大小來(lái)提高數(shù)據(jù)并行能力是提速的有效手段,但由于衰減效應(yīng)的存在無(wú)法達(dá)到硬件的極限能力。研究表明優(yōu)化算法也許可以指導(dǎo)我們找到充分利用硬件算力的解決方案。研究人員未來(lái)的工作將集中于對(duì)于不同優(yōu)化器的測(cè)評(píng),探索恩能夠加速數(shù)據(jù)并行能力的新方法,盡可能的延伸批量大小對(duì)應(yīng)訓(xùn)練時(shí)間的加速范圍。

如果想探索研究人員們?cè)谇О賯€(gè)模型上訓(xùn)練出的數(shù)據(jù),可以直接訪問(wèn)colab:https://colab.research.google.com/github/google-research/google-research/blob/master/batch_science/reproduce_paper_plots.ipynb詳細(xì)過(guò)程見(jiàn)論文包含了24個(gè)豐富完整的測(cè)評(píng)圖,描繪了神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程各種參數(shù)隨批量變化的完整過(guò)程:https://arxiv.org/pdf/1811.03600.pdf

ref:https://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.html

Paper:https://arxiv.org/pdf/1811.03600.pdf

代碼:https://colab.research.google.com/github/google-research/google-research/blob/master/batch_science/reproduce_paper_plots.ipynb

https://blog.skymind.ai/distributed-deep-learning-part-1-an-introduction-to-distributed-training-of-neural-networks/https://blog.inten.to/hardware-for-deep-learning-part-3-gpu-8906c1644664?gi=bdd1e2e4331ehttps://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.htmlhttps://blog.csdn.net/xbinworld/article/details/74781605

Headpic from: https://dribbble.com/shots/4038074-Data-Center

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111636
  • 并行計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    30

    瀏覽量

    9752
  • 分布式計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    4688

原文標(biāo)題:和谷歌研究人員一起,探索數(shù)據(jù)并行的邊界極限

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何將 VisionFive 2 與業(yè)余無(wú)線電一起使用?

    將 VisionFive 2 與業(yè)余無(wú)線電一起使用
    發(fā)表于 03-25 07:01

    為什么不能將 USB 磁盤(pán)與 exFat 一起使用?

    不能將 USB 磁盤(pán)與 exFat 一起使用
    發(fā)表于 03-04 06:27

    高壓放大器:助力科研實(shí)驗(yàn)創(chuàng)新突破新邊界

    在材料科學(xué)實(shí)驗(yàn)室,研究人員正通過(guò)高壓電場(chǎng)操控納米材料的結(jié)構(gòu)排列;在半導(dǎo)體測(cè)試中心,工程師們利用千伏級(jí)脈沖信號(hào)檢測(cè)芯片的極限性能;在生物醫(yī)學(xué)實(shí)驗(yàn)室,科學(xué)家通過(guò)高壓電場(chǎng)打開(kāi)細(xì)胞膜,實(shí)現(xiàn)基因的無(wú)創(chuàng)導(dǎo)入
    的頭像 發(fā)表于 01-23 14:57 ?184次閱讀
    高壓放大器:助力科研實(shí)驗(yàn)創(chuàng)新突破新<b class='flag-5'>邊界</b>

    谷歌評(píng)論卡,碰碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    研究人員復(fù)興針孔相機(jī)技術(shù)以推動(dòng)下代紅外成像發(fā)展

    研究人員運(yùn)用具有數(shù)百年歷史的針孔成像原理,開(kāi)發(fā)出種無(wú)需透鏡的高性能中紅外成像系統(tǒng)。這種新型相機(jī)能夠在大范圍距離內(nèi)和弱光條件下拍攝極其清晰的照片,使其在傳統(tǒng)相機(jī)難以應(yīng)對(duì)的場(chǎng)景中發(fā)揮重要作用。 研究
    的頭像 發(fā)表于 11-17 07:40 ?283次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    理論、實(shí)驗(yàn)及仿真統(tǒng)一起來(lái),催生了數(shù)據(jù)密集型科學(xué),這就是第四范式。它利用大量的計(jì)算和數(shù)據(jù)處理來(lái)研究復(fù)雜的問(wèn)題和現(xiàn)象。特點(diǎn)如下: 第四范式帶來(lái)的質(zhì)變: 第五范式: 科學(xué)范式的演變:二、科學(xué)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    章 具身智能芯片 第9章 從AI芯片到AGI芯片 圖2 各章重點(diǎn)及邏輯框架 該書(shū)可供AI和芯片領(lǐng)域的各層次人群閱讀,無(wú)論是學(xué)習(xí)者還是研究人員。 對(duì)于本人來(lái)說(shuō),讀這本書(shū)不但是為了豐富這方面的知識(shí),更主要的是為孩子讀研選擇個(gè)有前景的專(zhuān)業(yè)方向,以便適于社會(huì)發(fā)展及就業(yè)方向需要
    發(fā)表于 09-05 15:10

    N9H20如何將 SPI 閃存與非作系統(tǒng) BSP 一起使用?

    N9H20如何將 SPI 閃存與非作系統(tǒng) BSP 一起使用?
    發(fā)表于 09-01 08:27

    N9H20如何將非作系統(tǒng) NVTFAT 與 SPI 閃存一起使用?

    N9H20如何將非作系統(tǒng) NVTFAT 與 SPI 閃存一起使用?
    發(fā)表于 09-01 06:38

    大小鼠糖水偏好實(shí)驗(yàn)系統(tǒng)

    基因操作對(duì)動(dòng)物行為的影響,或者用于研究獎(jiǎng)賞系統(tǒng)和成癮行為。大小鼠糖水實(shí)驗(yàn)系統(tǒng)套裝為研究人員提供了個(gè)強(qiáng)大的工具,用于準(zhǔn)確監(jiān)測(cè)動(dòng)物對(duì)甜味的偏好。通過(guò)精心設(shè)計(jì)的實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析,這
    發(fā)表于 08-14 13:40

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    到AGI,一起來(lái)探索AI芯片 本書(shū)從創(chuàng)新視角出發(fā),系統(tǒng)梳理了AI芯片的前沿技術(shù)與未來(lái)方向,串聯(lián)從算法到系統(tǒng)的實(shí)現(xiàn)路徑,全景式展現(xiàn)AI芯片的技術(shù)原理與應(yīng)用場(chǎng)景。 書(shū)中核心內(nèi)容可分為算法創(chuàng)新、工藝創(chuàng)新、材料
    發(fā)表于 07-28 13:54

    光纖能與電線一起走嗎

    光纖與電線在特定條件下可以一起布線,但需嚴(yán)格遵守安全規(guī)范和物理隔離要求,以下是詳細(xì)分析: 、光纖與電線的物理特性差異 光纖 傳輸介質(zhì):以光信號(hào)傳輸數(shù)據(jù),不導(dǎo)電,因此不受電磁干擾(EMI
    的頭像 發(fā)表于 07-14 10:40 ?8540次閱讀

    尋開(kāi)發(fā)伙伴 一起搞細(xì)胞電阻儀,有興趣的朋友來(lái)聊聊!

    尋開(kāi)發(fā)伙伴 一起搞細(xì)胞電阻儀,有興趣的朋友來(lái)聊聊!
    發(fā)表于 07-10 15:51

    超聲波水下測(cè)距換能器:探索水下世界的“千里眼”

    : ()更高的測(cè)量精度 通過(guò)采用更先進(jìn)的信號(hào)處理技術(shù)和高精度的傳感器,進(jìn)步提高超聲波水下測(cè)距換能器的測(cè)量精度,滿足更高要求的測(cè)量需求。 (二)更遠(yuǎn)的測(cè)量距離 研究人員正在探索新的材
    發(fā)表于 06-26 10:43

    研究人員開(kāi)發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測(cè)瘧疾

    瘧疾曾度在委內(nèi)瑞拉銷(xiāo)聲匿跡,但如今正卷土重來(lái)。研究人員已經(jīng)訓(xùn)練出個(gè)模型來(lái)幫助檢測(cè)這種傳染病。
    的頭像 發(fā)表于 04-25 09:58 ?1089次閱讀