91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新的機器學(xué)習(xí)技術(shù):FPGA加速機器學(xué)習(xí)推理,提速175倍輕松處理EB數(shù)據(jù)集

DPVg_AI_era ? 來源:lq ? 2019-09-01 07:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由麻省理工學(xué)院助理教授Philip Harris和核科學(xué)實驗室博士后Dylan Rankin等國際科學(xué)家團隊測試的新機器學(xué)習(xí)技術(shù)可以在眨眼間發(fā)現(xiàn)大型強子對撞機(LHC)海量數(shù)據(jù)中的特定粒子特征。

MIT助理教授Philip Harris和核科學(xué)實驗室博士后Dylan Rankin等國際科學(xué)家團隊正在測試一種新的機器學(xué)習(xí)技術(shù),該技術(shù)可以在眨眼間在大型強子對撞機(LHC)浩瀚如海的數(shù)據(jù)中發(fā)現(xiàn)特定粒子特征。

新系統(tǒng)既復(fù)雜又迅速,可以在數(shù)據(jù)集不斷變大變復(fù)雜的情況下,讓我們得以一窺機器學(xué)習(xí)將在粒子物理學(xué)的未來發(fā)現(xiàn)中,會發(fā)揮怎樣舉足輕重的作用。

機器學(xué)習(xí)成為攻堅利器

大型強子對撞機每秒造成大約4000萬次碰撞。篩選如此大量數(shù)據(jù),需要強大的計算機,來識別其中需要科學(xué)家去關(guān)注的碰撞,無論是暗物質(zhì)還是希格斯粒子。

現(xiàn)在,費米實驗室(Fermilab),歐洲核子研究中心(CERN),麻省理工學(xué)院,華盛頓大學(xué)和其他地方的科學(xué)家們已經(jīng)測試了一種新的機器學(xué)習(xí)系統(tǒng),與現(xiàn)有方法相比,該系統(tǒng)可將處理速度提高30到175倍!

傳統(tǒng)方法目前每秒只能處理不到一個圖像。相比之下,新的機器學(xué)習(xí)系統(tǒng)每秒最多可以查看600張圖像。在訓(xùn)練期間,系統(tǒng)學(xué)會挑選出一種特定類型的后碰撞粒子模式。

哈里斯說:“我們所識別的碰撞模式,頂夸克是大型強子對撞機上探測的基本粒子之一。能夠分析盡可能多的數(shù)據(jù)非常重要,每一條數(shù)據(jù)都帶有關(guān)于粒子如何相互作用的有趣信息?!?/p>

等目前的LHC升級完成后,數(shù)據(jù)將以前所未有的方式涌入;到2026年,17英里的粒子加速器預(yù)計將產(chǎn)生20倍于目前的數(shù)據(jù),同時圖像也將以比現(xiàn)在更高的分辨率拍攝。總而言之,科學(xué)家和工程師估計大型強子對撞機所需的計算能力是目前的10倍以上。

哈里斯繼續(xù)說道:“未來的挑戰(zhàn)迫在眉睫,隨著計算變得更加準確,以及探測出更加精確的效果,它變得越來越難。”

該項目的研究人員對他們的新系統(tǒng)進行了訓(xùn)練,以識別頂夸克的圖像,這是最龐大的基本粒子類型,比質(zhì)子重180倍。

“通過我們提供的機器學(xué)習(xí)架構(gòu),就能夠獲得高質(zhì)量的科學(xué)質(zhì)量結(jié)果,與世界上最好的頂夸克識別算法相媲美,”哈里斯解釋說?!案咚賹嵤┖诵乃惴ㄊ刮覀兡軌蜢`活地在最需要的關(guān)鍵時刻增強LHC計算?!?/p>

EB級的數(shù)據(jù)集也能輕松處理

憑借大型數(shù)據(jù)集和高數(shù)據(jù)采集速率,高性能和高吞吐量計算資源是實驗粒子物理計劃的基本要素。這些實驗在探測器技術(shù)的復(fù)雜性和粒子束的強度方面不斷增加。

因此,粒子物理數(shù)據(jù)集的大小正在增加,就像處理數(shù)據(jù)的算法的復(fù)雜性一樣。例如,大型強子對撞機(HL-LHC)的高亮度階段,將提供比當前LHC運行多15倍的數(shù)據(jù)。

HL-LHC將以40 MHz的速率碰撞質(zhì)子束,碰撞環(huán)境中每次碰撞的粒子數(shù)將是原來的5倍。

Compact Muon Solenoid(CMS)實驗將針對HL-LHC進行升級,讀取通道的數(shù)量將增加10倍。通過一系列在線過濾器,CMS旨在以5 kHz的速率存儲HL-LHC碰撞事件。

這樣的數(shù)據(jù)速率導(dǎo)致數(shù)據(jù)集的規(guī)模為EB級。未來的中微子實驗,如深層地下中微子實驗(DUNE)和宇宙學(xué)實驗、平方公里陣列(SKA),預(yù)計將產(chǎn)生百億億字節(jié)的數(shù)據(jù)集。

大規(guī)模粒子物理實驗面臨著高吞吐量計算資源的挑戰(zhàn)。在具有增強的并行化的專用硬件上新的異構(gòu)計算范例,例如現(xiàn)場可編程門陣列(FPGA),能夠提供具有極大潛在增益的解決方案。

機器學(xué)習(xí)算法在粒子物理中用于模擬,重建和分析中,不斷增長的應(yīng)用,自然地部署在這樣的平臺上。

實驗證明,機器學(xué)習(xí)推理的加速即Web服務(wù),代表了粒子物理實驗的異構(gòu)計算解決方案,只需要對當前計算模型的最小修改。

作為示例,我們重新訓(xùn)練ResNet50卷積神經(jīng)網(wǎng)絡(luò),以展示LHC頂級夸克噴射標記的最先進性能,并應(yīng)用ResNet50模型和中微子事件分類的遷移學(xué)習(xí)。

使用Microsoft的Project Brainwave來加速ResNet50圖像分類模型,我們使用Brainwave作為云(邊緣或本地)服務(wù)的實驗物理軟件框架實現(xiàn)了60(10)毫秒的平均推斷時間,顯示了一個因素導(dǎo)致模型推斷延遲比傳統(tǒng)CPU推斷提高了30-175倍。

作為粒子物理計算模型的邊緣或云服務(wù),協(xié)處理器加速器可以具有更高的占空比,并且可能更具成本效益。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1661

    文章

    22442

    瀏覽量

    637488
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42367
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137074

原文標題:MIT提出FPGA加速機器學(xué)習(xí)推理,提速175倍輕松處理EB數(shù)據(jù)集

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法

    編碼是機器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之,模型沒辦法直接處理文本形式的分類數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red
    的頭像 發(fā)表于 02-10 15:58 ?372次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>特征工程:分類變量的數(shù)值化<b class='flag-5'>處理</b>方法

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不
    的頭像 發(fā)表于 01-07 15:37 ?255次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    文了解Mojo編程語言

    CPU、GPU 和其他加速器的支持,簡化了并行編程模型。 漸進式類型系統(tǒng) 結(jié)合靜態(tài)類型檢查和類型推導(dǎo),既保證編譯時安全性,又保留動態(tài)類型的靈活性。 應(yīng)用場景 AI 與機器學(xué)習(xí) 用于訓(xùn)練大型模型和實時
    發(fā)表于 11-07 05:59

    量子機器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對比與應(yīng)用

    在傳統(tǒng)機器學(xué)習(xí)數(shù)據(jù)編碼確實相對直觀:獨熱編碼處理類別變量,標準化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個過程更像是數(shù)據(jù)清洗,而非核心算法組
    的頭像 發(fā)表于 09-15 10:27 ?823次閱讀
    量子<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>入門:三<b class='flag-5'>種數(shù)據(jù)</b>編碼方法對比與應(yīng)用

    超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是家邊緣AI 公司,致力于讓機器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 ,速度也快10 ,甚至可以在最
    發(fā)表于 07-31 11:38

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】 + 04 + 機器學(xué)習(xí)YOLO體驗

    、 機器學(xué)習(xí)YOLO體驗 1.在線訓(xùn)練 Sipeed矽速科技擁有自研搭建的MaixHub平臺,可以快速簡單的完成yolo訓(xùn)練。 下面我將展示訓(xùn)練拍攝標注和訓(xùn)練的相關(guān)圖片 數(shù)據(jù)
    發(fā)表于 07-24 21:35

    FPGA機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效
    的頭像 發(fā)表于 07-16 15:34 ?2967次閱讀

    大模型推理顯存和計算量估計方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應(yīng)用帶來了挑戰(zhàn)。為了解決這問題,本文將探討大模型
    發(fā)表于 07-03 19:43

    邊緣計算中的機器學(xué)習(xí):基于 Linux 系統(tǒng)的實時推理模型部署與工業(yè)集成!

    你好,旅行者!歡迎來到Medium的這角落。在本文中,我們將把機器學(xué)習(xí)模型(神經(jīng)網(wǎng)絡(luò))部署到邊緣設(shè)備上,利用從ModbusTCP寄存器獲取的實時
    的頭像 發(fā)表于 06-11 17:22 ?1088次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>:基于 Linux 系統(tǒng)的實時<b class='flag-5'>推理</b>模型部署與工業(yè)集成!

    使用MATLAB進行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)一種根據(jù)未標注數(shù)據(jù)進行推斷的機器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識別
    的頭像 發(fā)表于 05-16 14:48 ?1505次閱讀
    使用MATLAB進行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    視覺巡線,展示了如何從數(shù)據(jù)采集、模型訓(xùn)練到機器人部署的完整流程。 值得注意的是,深度學(xué)習(xí)模型的實時性對機器人計算資源提出了較高要求,優(yōu)化模型(如TensorRT
    發(fā)表于 05-03 19:41

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學(xué)習(xí)應(yīng)用設(shè)計的硬件加速器。它的開發(fā)源于對人工智能(AI)和機器
    的頭像 發(fā)表于 04-22 09:41 ?4588次閱讀
    TPU<b class='flag-5'>處理</b>器的特性和工作原理

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學(xué)習(xí)的完美結(jié)合**

    和更多外設(shè)接口。無論是運行還是休眠狀態(tài),功耗表現(xiàn)都非常出色! 3. 在傳感器數(shù)據(jù)采集與AI機器學(xué)習(xí)中的優(yōu)勢? 答:主頻高、功耗低,內(nèi)置專用核處理數(shù)據(jù)
    發(fā)表于 04-01 00:00

    Raspberry Pi Pico 2 上實現(xiàn):實時機器學(xué)習(xí)(ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應(yīng)用于麥克風(fēng)輸入。機器學(xué)習(xí)(ML)技術(shù)徹底改變
    的頭像 發(fā)表于 03-25 09:46 ?1270次閱讀
    Raspberry Pi Pico 2 上實現(xiàn):實時<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>(ML)音頻噪音抑制功能

    樹莓派5 + Hailo AI加速器:工業(yè)級數(shù)值數(shù)據(jù)處理實戰(zhàn),打通SQLite與機器學(xué)習(xí)全鏈路

    本文討論了在工業(yè)自動化背景下,開發(fā)者利用樹莓派5和HailoAI加速器進行工業(yè)級數(shù)值數(shù)據(jù)處理實戰(zhàn),打通SQLite與機器學(xué)習(xí)全鏈路時遇到的問題及解決方案。關(guān)鍵要點包括:1.開發(fā)者需求:
    的頭像 發(fā)表于 03-25 09:22 ?1280次閱讀
    樹莓派5 + Hailo AI<b class='flag-5'>加速</b>器:工業(yè)級數(shù)值<b class='flag-5'>數(shù)據(jù)處理</b>實戰(zhàn),打通SQLite與<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>全鏈路