91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中低精度計算產(chǎn)生高準(zhǔn)確度結(jié)果的解決方案

zhKF_jqr_AI ? 2018-03-29 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有人認(rèn)為,用低精度訓(xùn)練機(jī)器學(xué)習(xí)模型會限制訓(xùn)練的精度,事實真的如此嗎?本文中,斯坦福大學(xué)的DAWN人工智能研究院介紹了一種名為bit recentering的技術(shù),它可以用低精度的計算實現(xiàn)高準(zhǔn)確度的解決方案。以下是論智對原文的編譯,文末附原論文地址。

低精度計算在機(jī)器學(xué)習(xí)中已經(jīng)吸引了大量關(guān)注。一些公司甚至已經(jīng)開始研發(fā)能夠原生支持并加速低精度操作的硬件了,比如微軟的腦波計劃(Project Brainwave)和谷歌的TPU。雖然使用低精度計算對系統(tǒng)來說有很多好處,但是低精度方法仍然主要用于推理,而非訓(xùn)練。此前,低精度訓(xùn)練算法面臨著一個基本困境(fundamental tradeoff):當(dāng)使用較少的位進(jìn)行計算時,舍棄誤差就會增加,這就限制了訓(xùn)練的準(zhǔn)確度。根據(jù)傳統(tǒng)觀點,這種制約限制了研究人員在系統(tǒng)中部署低精度訓(xùn)練算法的能力,但是這種限制能否改變?是否有可能設(shè)計一種使用低精度卻不會限制準(zhǔn)確度的算法呢?

答案是肯定的。在某些情況下我們可以從低精度訓(xùn)練中獲得高準(zhǔn)確度的解決方案,在這里我們使用了一種新的隨機(jī)梯度下降方法,稱為高準(zhǔn)確度低精度(HALP)法。HALP比之前的算法表現(xiàn)更好,因為它減少了兩個限制低精度隨機(jī)梯度下降準(zhǔn)確度的噪聲源:梯度方差和舍棄誤差。

為了減少梯度方差帶來的噪音,HALP使用常見的SVRG(stochastic variance-reduced gradient)技術(shù)。SVRG能定期使用完全梯度來減少隨機(jī)梯度下降中使用的梯度樣本的方差。

為了降低量化數(shù)字帶來的噪聲,HALP使用了名為“bit centering”的新技術(shù),它背后的原理是,當(dāng)我們接近最優(yōu)點時,梯度漸變的幅度變小。也就是說攜帶的信息變少,于是我們能對其進(jìn)行壓縮。通過動態(tài)地重新調(diào)整低精度數(shù)字,我們可以在算法收斂時降低量化噪聲。

將這兩種技術(shù)結(jié)合,HALP能夠以和全精度SVRG同樣的線性收斂率生成任意準(zhǔn)確地解決方案,同時在低精度迭代時使用的是固定位數(shù)。這個結(jié)果顛覆了有關(guān)低精度訓(xùn)練算法的傳統(tǒng)觀點。

為什么低精度的隨機(jī)梯度下降有所限制?

首先先交代一下背景:我們想要解決以下這個訓(xùn)練問題:

這是用來訓(xùn)練許多機(jī)器學(xué)習(xí)模型(包括深度神經(jīng)網(wǎng)絡(luò))的經(jīng)典實證問題:讓風(fēng)險最小化。解決這個問題的標(biāo)準(zhǔn)方法之一是隨機(jī)梯度下降,它是一種通過運行接近最佳值的迭代算法。

在每次迭代時,it是從{1,..., N}中隨機(jī)挑選的一個指數(shù),我們雖然想運行這樣的算法,但是要保證迭代wt是低精度的。也就是說,我們希望它們使用較少位的定點運算(通常為8位或16位)。但是,當(dāng)直接對隨機(jī)梯度下降更新規(guī)則而進(jìn)行這項操作時,我們遇到了問題:問題的解決方案w可能無法再選中的定點表示中顯示出來。例如,如果一個8位的定點表示,可以儲存{-128,-127,…,127}之間的整數(shù),正確的解決方法是w*=100.5,那么我們與解決方案的距離不可能小于0.5,因為我們不能表示非整數(shù)。除此之外,將梯度轉(zhuǎn)換為定點導(dǎo)致的舍棄誤差可能會減慢收斂速度,這也影響了低精度SGD的準(zhǔn)確性。

Bit Centering

當(dāng)我們運行隨機(jī)梯度下降時,在某種意義上,我們世紀(jì)正對一堆梯度樣本進(jìn)行平均(或總結(jié))。Bit Centering背后的關(guān)鍵思想是隨著梯度漸變逐漸變小,我們可以用同樣的位數(shù)、以較小的誤差對它們求平均值。想要知道為什么,想像一下,你想對[-100, 100]之間的數(shù)字求平均值,然后和[-1, 1]的平均值作比較。在前一個集合中,我們需要選擇一個定點表示,它可以覆蓋整個集合(例如{-128,-127,…,127})。而在第二個集合中,我們選擇的定點要覆蓋[-1, 1],例如{-128/127,-127/127,..., 126/127,127/127}。這就意味著在固定位數(shù)情況下,第二種情況中的相鄰可表示數(shù)字之間的差值比第一種情況更小,因此舍棄誤差也更低。

這個關(guān)鍵的想法讓我們得到了啟發(fā)。為了在[-1, 1]中求出比[-100, 100]中更少誤差的平均數(shù),我們需要用一個不同的定點表示,即我們應(yīng)該不斷更新低精度表示:隨著梯度漸變得越小,我們應(yīng)該用位數(shù)更小的定點數(shù)字,覆蓋更小的范圍。

但是我們該如何更新表示呢?我們要覆蓋的范圍到底多大?如果目標(biāo)是帶有參數(shù)μ的強(qiáng)凸,那么不管我們何時在某一點w采取完整的梯度漸變是,都可以用以下公式限制最佳位置

這種不等式為最終的解決方案提供了一系列可能的定位,所以無論何時計算完整梯度,我們都可以重新居中并縮放低精度表示以覆蓋此范圍。下圖說明了這一過程。

低精度計算產(chǎn)生高準(zhǔn)確度結(jié)果的解決方案

HALP

HALP是運行SVRG并在每個時期都使用具有完全梯度的bit centering更新低精度表示的算法。原論文有對這一方法的具體描述,在這里我們只簡單做些介紹。首先,我們證明了,對于強(qiáng)凸的Lipschitz光滑函數(shù),只要我們使用的位數(shù)b滿足

其中κ是該問題的條件數(shù)字,那么為了適當(dāng)設(shè)置尺寸和時間長度,HALP將以線性速度收斂到任意準(zhǔn)確度的解。更顯然的是,0<γ<1,

其中wk+1表示第K次迭代后的值。下表表現(xiàn)了這一變化過程

低精度計算產(chǎn)生高準(zhǔn)確度結(jié)果的解決方案

圖表通過對具有100個特征和1000個樣本的合成數(shù)據(jù)集進(jìn)行線性回歸,來評估HALP。將它與全精度梯度下降、SVRG、低精度的梯度下降和低精度的SVRG進(jìn)行比較。需要注意的是,盡管只有8位(受到浮點錯誤的限制),HALP仍能收斂到精度非常高的結(jié)果上。在這種情況下,HALP可以比全精度SVRG收斂到更高精度的結(jié)果中,因為HALP較少使用浮點運算,因此對浮點的非準(zhǔn)確性不敏感。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:斯坦福DAWN實驗室實現(xiàn)用低精度計算產(chǎn)生高準(zhǔn)確度結(jié)果

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    精度機(jī)器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運動控制方案

    人控制”應(yīng)用中,系統(tǒng)必須具備計算力、低延遲控制環(huán)路、實時反饋和多傳感器融合能力。 傳統(tǒng)的PLC或單片機(jī)方案并發(fā)計算與多軸同步控制方面往
    發(fā)表于 11-14 15:48

    電流不平衡測量精度受諧波影響嗎?

    影響最終測量精度。以下是具體影響機(jī)制、實例及解決方案: 一、諧波影響測量精度的核心機(jī)制 電流不平衡的本質(zhì)是 “三相電流的正負(fù)序分量比例”,而諧波(尤其是含負(fù)序、零序特性的諧波)會直接
    的頭像 發(fā)表于 11-05 16:08 ?1164次閱讀

    電能質(zhì)量在線監(jiān)測裝置的諧波測量準(zhǔn)確度受哪些因素影響?

    電能質(zhì)量在線監(jiān)測裝置的諧波測量準(zhǔn)確度,是硬件性能、算法設(shè)計、外部環(huán)境、運維管理等多因素共同作用的結(jié)果,任何一個環(huán)節(jié)的偏差都可能導(dǎo)致測量誤差。以下從 硬件核心組件、算法處理邏輯、外部干擾環(huán)境、運維管理
    的頭像 發(fā)表于 10-15 16:55 ?745次閱讀

    電能質(zhì)量在線監(jiān)測裝置的精度等級對其測量結(jié)果準(zhǔn)確性有何影響?

    電能質(zhì)量在線監(jiān)測裝置的精度等級是衡量其測量結(jié)果準(zhǔn)確性的 核心量化指標(biāo) ,直接決定了測量值與 “真實值” 的偏差范圍。精度等級越高(如 A 級),誤差限值越嚴(yán)格,測量
    的頭像 發(fā)表于 09-26 17:40 ?1376次閱讀

    電磁干擾對電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度有哪些具體影響?

    ?電磁干擾(EMI)是影響電能質(zhì)量在線監(jiān)測裝置 精度等級穩(wěn)定性 和 測量準(zhǔn)確度 的核心環(huán)境因素之一,其影響通過干擾裝置內(nèi)部硬件電路、信號傳輸鏈路及數(shù)據(jù)處理過程實現(xiàn),最終直接反映在關(guān)鍵測量參數(shù)的偏差上
    的頭像 發(fā)表于 09-18 10:29 ?1260次閱讀
    電磁干擾對電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級和<b class='flag-5'>準(zhǔn)確度</b>有哪些具體影響?

    溫度對電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度有哪些具體影響?

    ?溫度對電能質(zhì)量在線監(jiān)測裝置的 精度等級 (出廠規(guī)定的誤差范圍)和 準(zhǔn)確度 (實際測量值與真值的偏差)的影響,主要通過改變裝置核心部件的參數(shù)特性實現(xiàn),最終可能導(dǎo)致實際測量誤差超出精度等級規(guī)定的范圍
    的頭像 發(fā)表于 09-18 10:27 ?827次閱讀
    溫度對電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級和<b class='flag-5'>準(zhǔn)確度</b>有哪些具體影響?

    電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度的關(guān)系是否受測量參數(shù)的影響?

    ,導(dǎo)致同一裝置對不同參數(shù)的 “精度等級標(biāo)稱” 與 “實際準(zhǔn)確度表現(xiàn)” 的匹配關(guān)系完全不同 —— 部分參數(shù)的準(zhǔn)確度易符合其精度等級,部分參數(shù)則可能因測量難度
    的頭像 發(fā)表于 09-12 10:02 ?712次閱讀
    電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級和<b class='flag-5'>準(zhǔn)確度</b>的關(guān)系是否受測量參數(shù)的影響?

    環(huán)境因素對電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度的影響程度有多大?

    環(huán)境因素對電能質(zhì)量在線監(jiān)測裝置的影響程度,核心體現(xiàn)為準(zhǔn)確度偏離標(biāo)稱精度等級的 “量化幅度”—— 在標(biāo)準(zhǔn)規(guī)定的環(huán)境范圍內(nèi)(如 IEC 61000-4-30、GB/T 19862-2016),影響通常
    的頭像 發(fā)表于 09-11 18:01 ?971次閱讀
    環(huán)境因素對電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級和<b class='flag-5'>準(zhǔn)確度</b>的影響程度有多大?

    如何查詢電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度的關(guān)系受哪些環(huán)境因素影響?

    要查詢電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度的關(guān)系受哪些環(huán)境因素影響,可通過以下系統(tǒng)化方法實現(xiàn): 一、查閱國際與國家標(biāo)準(zhǔn)中的環(huán)境要求 IEC 61000 系列標(biāo)準(zhǔn) IEC 61000-4-30
    的頭像 發(fā)表于 09-11 17:54 ?884次閱讀
    如何查詢電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級和<b class='flag-5'>準(zhǔn)確度</b>的關(guān)系受哪些環(huán)境因素影響?

    電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度的關(guān)系是否受環(huán)境因素影響?

    電能質(zhì)量在線監(jiān)測裝置的精度等級和準(zhǔn)確度的關(guān)系 會受環(huán)境因素顯著影響 ,核心原因在于:環(huán)境因素雖不改變精度等級本身(固定的出廠標(biāo)稱),但會直接改變準(zhǔn)確度(實際測量偏差),進(jìn)而打破 “
    的頭像 發(fā)表于 09-11 17:34 ?894次閱讀
    電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級和<b class='flag-5'>準(zhǔn)確度</b>的關(guān)系是否受環(huán)境因素影響?

    電能質(zhì)量在線監(jiān)測裝置的精度等級與準(zhǔn)確度的關(guān)系

    要理解電能質(zhì)量在線監(jiān)測裝置(以下簡稱 “監(jiān)測裝置”)的 精度等級 與 準(zhǔn)確度 的關(guān)系,需先明確兩者的核心定義,再從 “設(shè)計目標(biāo) - 實際表現(xiàn)”“條件性 - 驗證性” 兩個維度拆解其關(guān)聯(lián)與差異,最終
    的頭像 發(fā)表于 09-11 17:29 ?1292次閱讀
    電能質(zhì)量在線監(jiān)測裝置的<b class='flag-5'>精度</b>等級與<b class='flag-5'>準(zhǔn)確度</b>的關(guān)系

    關(guān)于CAPSENSE?每個 Vref 電壓的準(zhǔn)確度的疑問求解

    我認(rèn)為CAPSENSE?在感應(yīng)電容時使用 Vref 電壓值。 根據(jù)組件數(shù)據(jù)表,Vref 電壓值根據(jù) VDDA 設(shè)置而變化。 PSoC? 4 電容式感應(yīng) ( CAPSENSE? ) 您能否告訴我們每個 Vref 電壓(從 1.2V 到 2.743V)的準(zhǔn)確度?
    發(fā)表于 07-15 07:35

    電工儀表準(zhǔn)確度等級詳解

    一、準(zhǔn)確度等級的定義 以下是“JJF1001-2011通用計量術(shù)語”對準(zhǔn)確度準(zhǔn)確度等級的相關(guān)定義: 1、測量準(zhǔn)確度 measurement accuracy,sccuracy
    的頭像 發(fā)表于 05-19 10:20 ?5310次閱讀
    電工儀表<b class='flag-5'>準(zhǔn)確度</b>等級詳解

    直線測量儀的精度如何評估?

    進(jìn)行測試,通過測量結(jié)果與標(biāo)準(zhǔn)值的對比,評估測量儀的精度。這種方法直接且有效,但需要高精度的標(biāo)準(zhǔn)件作為參考。 2.與其他高精度儀器對比:將直線
    發(fā)表于 04-21 16:26

    利用隔離式精密信號鏈保持?jǐn)?shù)據(jù)采集的準(zhǔn)確度

    數(shù)字時代改變了解決問題的范式,將智能引入邊緣可以應(yīng)對全新的復(fù)雜挑戰(zhàn)。數(shù)據(jù)采集(DAQ)系統(tǒng)成為了邊緣智能的核心。在數(shù)據(jù)采集領(lǐng)域,準(zhǔn)確度和可靠性至關(guān)重要。為確保達(dá)到準(zhǔn)確度和完整性,隔離式精密信號鏈的重要性不容忽視。
    的頭像 發(fā)表于 03-17 14:43 ?1431次閱讀