91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾四大層面,提升DeepRec訓(xùn)練和推理能力

英特爾中國 ? 來源:英特爾中國 ? 作者:英特爾中國 ? 2022-07-10 10:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從淘寶到天貓應(yīng)用,從搜索、推薦到廣告等場景,對井噴式的數(shù)據(jù)進(jìn)行超大規(guī)模訓(xùn)練推理的應(yīng)用,已經(jīng)在我們身邊落地開花。阿里巴巴集團(tuán)的開源推薦引擎 DeepRec (PAI-TF) 主要用于稀疏模型訓(xùn)練和預(yù)測,可支撐千億特征、萬億樣本的超大規(guī)模稀疏訓(xùn)練。

從2019 年開始,英特爾就與阿里巴巴PAI團(tuán)隊(duì)緊密合作,將英特爾 AI 技術(shù)應(yīng)用到 DeepRec 中。特別是英特爾處理器內(nèi)置的英特爾DL Boost (英特爾深度學(xué)習(xí)加速),為 DeepRec 實(shí)現(xiàn)了四個(gè)層面上的優(yōu)化:框架優(yōu)化、算子優(yōu)化、子圖優(yōu)化和模型優(yōu)化。

四大層面,提升DeepRec 訓(xùn)練和推理能力

自英特爾 至強(qiáng) 可擴(kuò)展處理器問世以來,通過從 AVX-256 升級到 AVX-512,英特爾將 AVX 的能力提高了一倍,極大地提升了深度學(xué)習(xí)訓(xùn)練和推理能力。第三代英特爾 至強(qiáng) 可擴(kuò)展處理器之后,英特爾推出支持 BFloat16 (BF16) 數(shù)據(jù)類型的指令集,也應(yīng)用到 DeepRec 的優(yōu)化中。

框架優(yōu)化:DeepRec 集成了英特爾開源的跨平臺深度學(xué)習(xí)性能加速庫oneDNN (oneAPI Deep Neural Network Library),該程序庫已經(jīng)針對大量主流算子實(shí)現(xiàn)了性能優(yōu)化。與搭載 BF16 指令的第三代英特爾至強(qiáng)可擴(kuò)展處理器同時(shí)使用,可顯著提高模型訓(xùn)練和推理性能。

算子優(yōu)化:搜索廣告推薦模型中存在著大量稀疏算子,調(diào)用 AVX-512 指令加以優(yōu)化后,大幅提升了數(shù)據(jù)讀寫效率和性能。

子圖優(yōu)化:圖優(yōu)化是 AI 性能優(yōu)化的主要有效手段之一。在大規(guī)模稀疏場景下,DeepRec 加入多種子圖融合功能,減少大量冗余操作,配合英特爾 AVX-512 指令加速,實(shí)現(xiàn)了子圖性能的明顯提升。

模型優(yōu)化:基于CPU 平臺,英特爾在 DeepRec 構(gòu)建了涵蓋多個(gè)主流模型的獨(dú)有推薦模型集合,涉及召回、排序、多目標(biāo)等多種常見場景;并針對硬件平臺進(jìn)行性能優(yōu)化,相較于其他框架在 CPU 平臺上帶來跨越式性能提升。

阿里巴巴 PAI 團(tuán)隊(duì)的測試結(jié)果證明:基于 Criteo 數(shù)據(jù)集,使用BF16優(yōu)化后,模型WDL精度或AUC可以逼近FP32,并且BF16模型的訓(xùn)練性能提升達(dá)1.4倍,效果顯著。

未來,英特爾還會從優(yōu)化器算子、attention 子圖、添加多目標(biāo)模型等多個(gè)角度進(jìn)一步實(shí)施優(yōu)化,更大程度地發(fā)揮 CPU 平臺硬件優(yōu)勢、尤其是新硬件特征的效果最大化,從而為稀疏場景打造更高性能的 CPU 解決方案。

當(dāng)然,英特爾為 DeepRec 的優(yōu)化并不僅限于 CPU 層面。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10301

    瀏覽量

    180463
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11279

    瀏覽量

    225015

原文標(biāo)題:發(fā)揮CPU平臺硬件優(yōu)勢,英特爾助力DeepRec優(yōu)化超大規(guī)模稀疏訓(xùn)練

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    英特爾炮轟,AMD回?fù)?!掌機(jī)市場芯片之爭

    英特爾推出的才是專為掌機(jī)設(shè)計(jì)的最新處理器,信心源于新一代旗艦產(chǎn)品Panther Lake處理器。該處理器是首款基于英特爾18A工藝節(jié)點(diǎn)制造的消費(fèi)級SoC,在“每瓦性能”數(shù)據(jù)上表現(xiàn)優(yōu)異,結(jié)合XeSS 3超級采樣技術(shù)和Arc核顯,英特爾
    的頭像 發(fā)表于 01-12 09:09 ?1800次閱讀

    銳寶智聯(lián)入選英特爾首批尊享級合作伙伴

    余年深耕物聯(lián)網(wǎng)領(lǐng)域的技術(shù)沉淀、持續(xù)創(chuàng)新能力及廣泛市場影響力,成功入選首批 “尊享級” 合作伙伴,成為英特爾生態(tài)中核心協(xié)同力量的重要一員。
    的頭像 發(fā)表于 12-02 18:16 ?1430次閱讀
    銳寶智聯(lián)入選<b class='flag-5'>英特爾</b>首批尊享級合作伙伴

    英特爾舉辦行業(yè)解決方案大會,共同打造機(jī)器人“芯”動脈

    11月19日,在2025英特爾行業(yè)解決方案大會上,英特爾展示了基于英特爾? 酷睿? Ultra平臺的最新邊緣AI產(chǎn)品及解決方案,并預(yù)覽了針對邊緣側(cè)的英特爾? 酷睿? Ultra處理器(
    的頭像 發(fā)表于 11-19 21:51 ?6772次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業(yè)解決方案大會,共同打造機(jī)器人“芯”動脈

    特斯拉要自建超大型晶圓廠,馬斯克:與英特爾合作 “有必要”

    特斯拉CEO馬斯克周(6日) 盤后于股東大會上表示,隨著自動駕駛與機(jī)器人應(yīng)用快速擴(kuò)張,特斯拉需要自行建造一座大型晶圓廠,以滿足未來龐大的運(yùn)算需求,并透露公司可能與芯片大廠英特爾展開合作。消息公布后,英特爾聞訊大漲近4%。
    的頭像 發(fā)表于 11-07 18:07 ?2045次閱讀

    發(fā)力圖形工作站和AI推理市場,英特爾大顯存GPU亮相灣芯展

    英特爾發(fā)布了面向?qū)I(yè)的銳炫Pro B50和B60。這兩款顯卡比較RTX2000和5660Ti,有哪些性能上的優(yōu)勢?在支持AI推理工作站和大模型部署上,B60有哪些獨(dú)到之處?10月16日,在深圳舉行的灣區(qū)半導(dǎo)體大會上,英特爾中國區(qū)
    的頭像 發(fā)表于 10-22 13:40 ?1.1w次閱讀
    發(fā)力圖形工作站和AI<b class='flag-5'>推理</b>市場,<b class='flag-5'>英特爾</b>大顯存GPU亮相灣芯展

    英特爾Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    英特爾? Gaudi 2EAI加速器現(xiàn)已為DeepSeek-V3.1提供深度優(yōu)化支持。憑借出色的性能和成本效益,英特爾Gaudi 2E以更低的投入、更高的效率,實(shí)現(xiàn)從模型訓(xùn)練的深度突破到推理
    的頭像 發(fā)表于 08-26 19:18 ?3028次閱讀
    <b class='flag-5'>英特爾</b>Gaudi 2E AI加速器為DeepSeek-V3.1提供加速支持

    美國政府將入股英特爾

    據(jù)彭博社報(bào)道稱,特朗普政府正在與芯片制造商英特爾進(jìn)行談判,希望美國政府入股這家陷入困境的公司,隨后該公司股價(jià)周上漲 7% 。 英特爾是唯一一家有能力在美國本土生產(chǎn)最快芯片的美國公司,
    的頭像 發(fā)表于 08-17 09:52 ?1110次閱讀

    特朗普質(zhì)疑英特爾CEO陳立武涉嫌嚴(yán)重利益沖突,應(yīng)立即辭職

    8月7日,外媒報(bào)道,美國總統(tǒng)特朗普周要求英特爾新任CEO陳立武立即辭職,稱他因與中國企業(yè)的關(guān)系而“陷入高度沖突”,并對這家陷入困境的美國芯片巨頭扭轉(zhuǎn)局面的計(jì)劃表示懷疑。英特爾股票周
    的頭像 發(fā)表于 08-08 10:11 ?4156次閱讀
    特朗普質(zhì)疑<b class='flag-5'>英特爾</b>CEO陳立武涉嫌嚴(yán)重利益沖突,應(yīng)立即辭職

    使用英特爾? NPU 插件C++運(yùn)行應(yīng)用程序時(shí)出現(xiàn)錯(cuò)誤:“std::Runtime_error at memory location”怎么解決?

    使用OpenVINO?工具套件版本 2024.4.0 構(gòu)建C++應(yīng)用程序 使用英特爾? NPU 插件運(yùn)行了 C++ 應(yīng)用程序 遇到的錯(cuò)誤: Microsoft C++ exception: std::runtime_error at memory location
    發(fā)表于 06-25 08:01

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動的“實(shí)時(shí)響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶端計(jì)算事業(yè)部邊緣計(jì)算
    的頭像 發(fā)表于 06-20 17:32 ?896次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣AI的“智能引擎”

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和英特爾
    的頭像 發(fā)表于 05-20 12:27 ?5452次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴(kuò)展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI 加速器: 英特爾Gaud
    發(fā)表于 05-20 11:03 ?1845次閱讀

    英特爾宣布裁員20% 或2萬人失業(yè)

    據(jù)外媒彭博社的報(bào)道,在當(dāng)?shù)貢r(shí)間4月24日,英特爾宣布裁員計(jì)劃,比例超20%。按照截至2024年底英特爾在全球擁有108900名員工來計(jì)算的話,預(yù)計(jì)此次裁員將波及大約2.2萬名員工。旨在精簡管理,并重
    的頭像 發(fā)表于 04-25 17:34 ?622次閱讀

    1.9倍性能提升英特爾至強(qiáng)6在MLPerf基準(zhǔn)測試中表現(xiàn)卓越

    與第五代至強(qiáng)處理器相比,英特爾至強(qiáng)6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測試結(jié)果,其中,英特爾??至強(qiáng)??6性能核處理器在本次測試的六個(gè)
    的頭像 發(fā)表于 04-07 10:58 ?677次閱讀

    英特爾酷睿Ultra AI PC上部署多種圖像生成模型

    全新英特爾酷睿Ultra 200V系列處理器對比上代Meteor Lake,升級了模塊化結(jié)構(gòu)、封裝工藝,采用全新性能核與能效核、英特爾硬件線程調(diào)度器、Xe2微架構(gòu)銳炫GPU、第代NPU等,由此也帶來了CPU性能
    的頭像 發(fā)表于 04-02 15:47 ?1486次閱讀
    在<b class='flag-5'>英特爾</b>酷睿Ultra AI PC上部署多種圖像生成模型