91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾AI實驗室推出了高性能的神經網絡壓縮工具Distiller

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-11-06 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,英特爾AI 實驗室推出了高性能的神經網絡壓縮工具Distiller,便捷地實現了更小更快更高效的神經網絡計算。Distiller目前在PyTorch中實現了一系列壓縮分析算法,包括稀疏引導算法和低精度近似算法。工具包主要由以下三個部分組成:

一套集成了剪枝、正則化與量化的算法;

一系列分析和評價壓縮表現的工具;

以及一系列前沿壓縮算法的實現樣例。

更小更快更節(jié)能

目前的絕大多數神經網絡都越來越深,其參數達到了百萬量級。如此龐大的模型即使在硬件加速的條件下也是十分消耗資源的計算密集型算法,即使只考慮推理階段也需要花費較多的時間。在某些低延時的場合,比如說自動駕駛和控制領域這樣的處理時間就會造成很多問題。同時在消費電子上較長的延時也會造成用戶體驗的下降。

大型模型同時也會消耗大量的內存,以及隨之而來的算力與能耗,這對于移動設備來說是十分重要的問題。同樣對于大型數據中心來說模型的能耗也是不同忽視的問題。同時考慮到存儲和傳輸的限制,神經網絡的壓縮具有十分重要的現實需求。在精度可以接受的條件下,壓縮的越小神經網絡需要的計算資源和帶寬就越少。由于深度神經網絡的權重矩陣具有稀疏性,通過正則化和剪枝以及量化過程可以很好的壓縮模型的體量。

稀疏的神經網絡模型表示可以被大幅度壓縮。目前很多神經網絡性能都受制于帶寬,這意味著它們的計算性能主要取決于可用的帶寬,帶寬不足的情況下硬件需要用更多的時間將數據輸入到計算單元中。全連接層、RNN和LSTM等典型的結構就受制于帶寬。如果能夠減小這些層所需要的帶寬就能大幅提高它們的速度。

通過修剪模型中的某些權重、核甚至是整個層實現減小帶寬提高速度的功能,但同時卻不影響算法最終精度的表現,也減小了功耗和延時。最后考慮到讀寫非片上存儲的能耗是片上存儲的兩個量級以上,如果較小的模型可以保存在片上存儲中,可以使性能得到質的飛躍,讓延時和能耗也隨之降低。所以同時稀疏或者壓縮表示時,可以有效提升算法的表現。

工具框架

Distiller目前的設計與PyTorch進行集成,其設計理念如下圖所示,PyTorch的訓練與Distiller進行交互。在distiller中包含了調度、算法和應用等主要模塊以及匯總、日志的輔助功能,在很多常見的科學計算包的基礎上利用jupyter實現交互功能,基于tensorboard實現模型和日志信息的展示。

算法

Distiller中集成了先進的剪枝和量化算法,幫助用戶有效的壓縮模型的體量。

剪枝算法主要分為了權重正則化、權重修剪、低精度等三種實現方式,7種具體的方法。

幅度剪枝利用閾值來將每一個權重進行二值化,小于閾值的權重將被設為0,不同的層可以設置不同的權值;

敏感度剪枝與閾值的方法類似,但使用了敏感因子s與這一層的權重分布標準差σ的乘積來作為閾值。越敏感的層(靠近輸入的)設置的s就越?。?/p>

level剪枝通過設置稀疏度來實現剪枝,這種方法相較于前面方法穩(wěn)定,因為目標的稀疏程度與元素的賦值不相關。

自動梯度剪枝(AGP)

這種方法的稀疏度將會隨著初始稀疏和最終稀疏自適應的變化;

RNN剪枝

結構剪枝(通過移除整個核、濾波器甚至是整個特征圖來實現):包含了結構排序剪枝和對于較少激活特征圖的激活相關剪枝。

量化也是一類重要的壓縮算法,Distall中同時也集成了四種量化算法:

DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients

PACT: Parameterized Clipping Activation for Quantized Neural Networks

WRPN: Wide Reduced-Precision Networks

對稱線性量化

安 裝

如果想要使用這個工具的小伙伴,可以到git上下載

$ git clone https://github.com/NervanaSystems/distiller.git

$ cd distiller

然后利用你喜歡的工具創(chuàng)建一個python虛擬環(huán)境

$ python3 -m virtualenv env

激活環(huán)境并安裝對應的依賴包:

$ source env/bin/activate

$ pip3 install -r requirements.txt

注:這一版本依賴于CUDA8.0,會自動安裝PyTorch3.1

然后就可以愉快的使用了,可以通過運行下面的文件來熟悉工具的使用:

distiller/examples/classifier_compression/compress_classifier.py

#example

$ python3 compress_classifier.py --arch simplenet_cifar ../../../data.cifar10 -p 30 -j=1 --lr=0.01

#對于cifar10壓縮

$ time python3 compress_classifier.py -a alexnet --lr 0.005 -p 50 ../../../data.imagenet -j 44 --epochs 90 --pretrained --compress=../sensitivity-pruning/alexnet.schedule_sensitivity.yaml

#利用yaml配置文件來運行

另外example下還有多個例子可以嘗試。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10311

    瀏覽量

    180919
  • 神經網絡
    +關注

    關注

    42

    文章

    4839

    瀏覽量

    108052

原文標題:英特爾推出全新可便捷實現「更小更快更高效的神經網絡計算」的壓縮工具Distiller

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    燧弘華創(chuàng)攜手英特爾共建聯合實驗室

    ,由燧弘華創(chuàng)與英特爾聯合主辦的“智聚芯能 共繪新篇”2026技術研討會在福州召開。會上,燧弘華創(chuàng)-英特爾聯合實驗室正式揭牌并全面啟動建設,旨在通過多元算力解決方案的聯合創(chuàng)新,為下一代人工智能數據中心(AIDC)筑牢
    的頭像 發(fā)表于 04-07 13:53 ?73次閱讀

    英特爾Arria 10器件:高性能與低功耗的完美結合

    英特爾Arria 10器件:高性能與低功耗的完美結合 在當今電子技術飛速發(fā)展的時代,現場可編程門陣列(FPGA)和片上系統(tǒng)(SoC)在眾多領域發(fā)揮著至關重要的作用。英特爾的Arria 10器件家族
    的頭像 發(fā)表于 03-29 13:05 ?179次閱讀

    性能再越級!英特爾推出全新酷睿Ultra 200HX Plus系列移動處理器

    Plus系列專為高性能游戲、流媒體、內容創(chuàng)作和工作站應用而優(yōu)化。新推出的兩款新處理器——英特爾酷睿 Ultra 9 290HX Plus和酷睿 Ultra 7 270HX Plus,不僅
    的頭像 發(fā)表于 03-19 16:43 ?208次閱讀

    英特爾與華陽通用聯手推出全新AI Box解決方案

    英特爾宣布推出基于最新英特爾 酷睿 Ultra 架構的AI Box解決方案,將PC級旗艦算力引入汽車、工業(yè)自動化、軌道交通、機器人等多種工業(yè)環(huán)境,為各行各業(yè)接入
    的頭像 發(fā)表于 03-02 14:15 ?665次閱讀

    香港科技大學與英特爾共建聯合實驗室,聚焦高能效智能計算

    香港科技大學與英特爾宣布成立“香港科技大學-英特爾聯合實驗室”(以下簡稱“聯合實驗室”)。該實驗室將開展為期三年的研究計劃,重點探索高能效近
    的頭像 發(fā)表于 02-05 16:30 ?661次閱讀
    香港科技大學與<b class='flag-5'>英特爾</b>共建聯合<b class='flag-5'>實驗室</b>,聚焦高能效智能計算

    英特爾與憶聯重磅推出企業(yè)級網絡存儲解決方案

    為應對AI大模型時代多元化的存儲挑戰(zhàn)與存算分離部署需求,英特爾與憶聯基于既有合作成果,再度深化協(xié)同創(chuàng)新。依托RDMA與NVMe硬件技術,結合SPDK高性能存儲服務,重磅推出企業(yè)級
    的頭像 發(fā)表于 02-02 09:14 ?1198次閱讀
    <b class='flag-5'>英特爾</b>與憶聯重磅<b class='flag-5'>推出</b>企業(yè)級<b class='flag-5'>網絡</b>存儲解決方案

    NMSIS神經網絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經網絡內核,旨在最大限度地提高 Nuclei N 處理器內核上的神經網絡性能并最??大限度地減少其內存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    Solidigm 成立AI中央實驗室,配備高性能、大密度存儲測試集群

    實驗室。該實驗室配備了專為多種AI工作負載量身打造的高性能、高密度的存儲測試集群。 這座先進的 AI 中央
    的頭像 發(fā)表于 10-10 17:03 ?894次閱讀

    無刷電機小波神經網絡轉子位置檢測方法的研究

    MATLAB/SIMULINK工具對該方法進行驗證,實驗結果表明該方法在全程速度下效果良好。 純分享帖,點擊下方附件免費獲取完整資料~~~ *附件:無刷電機小波神經網絡轉子位置檢測方法的研究.pdf
    發(fā)表于 06-25 13:06

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅動的“實時響應、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計算事
    的頭像 發(fā)表于 06-20 17:32 ?998次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產品—英特爾Gaudi 3 AI加速器。 英特爾副總裁兼客戶端顯卡總經理Vivian
    的頭像 發(fā)表于 05-21 00:57 ?7646次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5574次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業(yè)用戶和AI開發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1893次閱讀

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經網絡處理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    發(fā)表于 04-23 10:55

    英特爾與聯想為北京市第八十中學人工智能實驗室揭牌

    近日,英特爾攜手聯想集團為北京市第八十中學建立的人工智能實驗室揭牌儀式舉行。英特爾中國首席營銷官呂冬先生、聯想集團政企業(yè)務產品與方案推廣及客戶運營總監(jiān)陳晰先生、北京市第八十中學任煒東校長、霍斌副校長
    的頭像 發(fā)表于 04-09 09:21 ?1016次閱讀