91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU推理:AI算力配置新范式

阿丘科技 ? 2024-11-21 01:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

613ef124-a761-11ef-8084-92fbcf53809c.png

在當(dāng)前的人工智能領(lǐng)域,尤其是涉及到深度學(xué)習(xí)的推理階段,行業(yè)普遍認(rèn)為GPU是唯一的選擇。然而,GPU的成本相對較高,且對于某些特定的應(yīng)用場景,其高昂的價格和較高的能耗成為了一大負(fù)擔(dān)。

相比之下,CPU作為一種性價比極高的推理硬件,逐漸進(jìn)入了人們的視野,尤其是在對結(jié)果準(zhǔn)確度有較高要求且需要考慮成本效益的行業(yè)中,如制造業(yè)、圖像處理與分析等。經(jīng)過數(shù)年的內(nèi)部研究,阿丘科技的工業(yè)AI視覺算法平臺軟件AIDI已經(jīng)成功驗證了CPU推理的可行性,為行業(yè)提供了新的解決方案。

具體應(yīng)用場景01

舊產(chǎn)線改造

許多制造企業(yè)的生產(chǎn)線啟動時間較早,初期采用的傳統(tǒng)算法并不過多依賴于GPU資源。隨著時間的發(fā)展,這些產(chǎn)線的主板可能無法支持新增的GPU、NPU、TPU等加速卡。

在這種情況下,如果企業(yè)希望在其生產(chǎn)線上添加AI檢測功能,全面更換工控機(jī)會導(dǎo)致成本激增,并延長上線周期。通過使用AIDI提供的CPU推理模式,企業(yè)可以迅速實現(xiàn)AI檢測功能的上線,同時避免了高昂的硬件升級費用。

相關(guān)詞語解釋:

CPU(中央處理器,Central Processing Unit)

CPU是計算機(jī)的主要處理單元,負(fù)責(zé)執(zhí)行系統(tǒng)中的大部分基本指令集,包括算術(shù)邏輯運算、控制單元的功能以及數(shù)據(jù)的移動等。它通常設(shè)計為能夠高效地處理廣泛的任務(wù),從運行操作系統(tǒng)到執(zhí)行應(yīng)用程序的各種任務(wù)。

GPU(圖形處理器,Graphics Processing Unit)

GPU最初是為加速計算機(jī)圖形渲染而設(shè)計的處理器,但現(xiàn)在其應(yīng)用范圍已經(jīng)遠(yuǎn)遠(yuǎn)超出了圖形處理領(lǐng)域。GPU擁有大量的核心,能夠并行處理大量數(shù)據(jù),這使得它們在圖像和視頻處理、深度學(xué)習(xí)、科學(xué)計算等領(lǐng)域非常有用。

NPU(神經(jīng)網(wǎng)絡(luò)處理器,Neural Network Processing Unit)

NPU是一種專門為處理機(jī)器學(xué)習(xí)算法而設(shè)計的微處理器,尤其是針對深度學(xué)習(xí)任務(wù)。NPU優(yōu)化了對向量和矩陣運算的支持,這些運算是神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理過程中的基礎(chǔ)。

TPU(張量處理單元,Tensor Processing Unit)

TPU是由谷歌開發(fā)的一種定制ASIC(專用集成電路),專門用于加速機(jī)器學(xué)習(xí)工作負(fù)載,特別是針對使用TensorFlow框架的應(yīng)用程序。TPU能夠高效地執(zhí)行大規(guī)模的矩陣運算,這對于訓(xùn)練和推斷階段的深度學(xué)習(xí)模型至關(guān)重要。

02

輕量型項目

對于一些新的項目,尤其是那些算力需求較小的場景(如圖像小于500萬像素,僅需進(jìn)行圖像分類或單圖推理,且可接受100毫秒的延遲),使用單個GPU卡往往無法達(dá)到滿負(fù)荷運行的狀態(tài),從而造成資源浪費。

這類項目非常適合采用CPU進(jìn)行推理,訓(xùn)練階段則可以利用GPU工控機(jī)或云端資源。這種方法不僅能夠顯著降低硬件采購成本,還能確保項目的順利推進(jìn)。

03

舊產(chǎn)線改造的具體情形

如下圖所示,通過傳統(tǒng)算法進(jìn)行項目的測量與檢測,硬件配置主要為CPU+內(nèi)存+主板。

61635b2c-a761-11ef-8084-92fbcf53809c.png

圖:舊產(chǎn)線

目前,舊產(chǎn)線改造通常有以下兩種情形。

情形一:硬件配置基本不變,即CPU+內(nèi)存+主板,通過傳統(tǒng)算法做測量,而利用AI算法做外觀檢測。

616ab3fe-a761-11ef-8084-92fbcf53809c.png

圖:情形一

情形二:硬件配置基本不變,即CPU+內(nèi)存+主板,通過傳統(tǒng)算法做測量與外觀檢測,而利用AI算法做缺陷復(fù)判。

616e662a-a761-11ef-8084-92fbcf53809c.png

圖:情形二AIDI-CPU推理的優(yōu)勢01

推理速度比肩GTX1060,500萬圖像像素級推理僅需50ms

AIDI的CPU推理在速度方面表現(xiàn)出色,其底層采用DefectNet網(wǎng)絡(luò)+Aqinfer推理引擎的創(chuàng)新模式。

617a8f4a-a761-11ef-8084-92fbcf53809c.png

DefectNet網(wǎng)絡(luò)專門針對工業(yè)數(shù)據(jù)的特性而設(shè)計,具備輕量且檢測能力強(qiáng)的特點。Aqinfer自研推理引擎則針對工業(yè)場景中圖像分辨率高、目標(biāo)小的特點,在原本就較高的推理速度基礎(chǔ)上,進(jìn)一步優(yōu)化計算速度。

02

節(jié)省硬件成本,降低耗能風(fēng)險

CPU在市場上供應(yīng)充足,價格相對更為親民,相較于一些高性能GPU,CPU的獲取成本更低。對于企業(yè)來說,尤其是預(yù)算有限的中小企業(yè),選擇CPU推理可以在不犧牲太多性能的前提下,大幅降低硬件采購成本。

以一家小型服裝加工廠為例,在引入AI檢測系統(tǒng)時,如果選擇GPU方案,高昂的硬件成本可能使其望而卻步;而采用CPU推理方案,僅需利用現(xiàn)有的工控機(jī)資源,就能實現(xiàn)基本的質(zhì)量檢測功能。

同時,GPU的高功耗不僅增加了企業(yè)的用電成本,還會導(dǎo)致設(shè)備硬件容易因過熱等問題而損壞。相比之下,CPU的功耗較低,運行更加穩(wěn)定,能夠有效降低企業(yè)的能耗風(fēng)險和設(shè)備維護(hù)成本。在長期運行過程中,這一優(yōu)勢將為企業(yè)節(jié)省大量的資金和人力投入。

03

快速驗證,減少額外投資

利用CPU進(jìn)行AI推理,企業(yè)可以充分挖掘既有平臺的空閑算力,避免了為新的算力需求而進(jìn)行大規(guī)模的額外投資。在項目的初期驗證階段,CPU推理能夠快速搭建起一個低成本的測試環(huán)境,幫助企業(yè)快速驗證AI算法的可行性和有效性。例如,視覺團(tuán)隊可以先在現(xiàn)有的服務(wù)器上利用CPU進(jìn)行算法驗證,根據(jù)驗證結(jié)果再決定是否需要進(jìn)一步投資更強(qiáng)大的GPU算力。

成功案例

在某膠體檢測項目中,產(chǎn)品的檢測項涵蓋少膠、溢膠、斷膠、漏膠等關(guān)鍵指標(biāo)。老設(shè)備方案中,膠水識別采用的是傳統(tǒng)算法,但在實際應(yīng)用中,偶爾會出現(xiàn)定位不準(zhǔn)的問題,這對產(chǎn)品質(zhì)量產(chǎn)生了一定的影響。為了提高檢測精度,降低過檢率,企業(yè)決定引入AI檢測方案。

61824dc0-a761-11ef-8084-92fbcf53809c.png

由于新增GPU需要對工控機(jī)配置進(jìn)行復(fù)雜的修改,并且采購流程耗時較長,為了確保產(chǎn)線的正常運行,不耽誤生產(chǎn)進(jìn)度,項目團(tuán)隊最終選擇了CPU推理方案。經(jīng)過實際測試和驗證,該方案能夠直接上線,并且取得了令人滿意的效果。

618cdeca-a761-11ef-8084-92fbcf53809c.png

在此次項目中,圖像分辨率為1000W,客戶要求的CT(Cycle Time,周期時間)為1000ms,而實際CT時間僅為500ms,單圖推理時間更是縮短至100ms,完全滿足了上線要求。這一案例充分證明了阿丘科技AIDI的CPU推理在實際工業(yè)場景中的可行性和有效性,為其他類似項目提供了寶貴的參考經(jīng)驗。

綜上,CPU推理作為AI算力配置的新范式,在特定的應(yīng)用場景中展現(xiàn)出了獨特的優(yōu)勢。隨著技術(shù)的不斷發(fā)展和優(yōu)化,相信阿丘科技AIDI的CPU推理將在更多領(lǐng)域得到廣泛應(yīng)用,為企業(yè)的智能化轉(zhuǎn)型提供更加經(jīng)濟(jì)、高效的解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11281

    瀏覽量

    225090
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50102

    瀏覽量

    265518
  • AI算力
    +關(guān)注

    關(guān)注

    1

    文章

    143

    瀏覽量

    9887
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Hailo-8卡 + RK3588實測!26TOPS加持,助力AI視覺升級!

    近年來,AI視覺在邊緣端應(yīng)用廣泛,行業(yè)對AI推理硬件的要求也日益提升。傳統(tǒng)CPU在CNN等視覺模型推理任務(wù)中逐漸顯露瓶頸,而專用
    的頭像 發(fā)表于 03-02 16:46 ?89次閱讀
    Hailo-8<b class='flag-5'>算</b><b class='flag-5'>力</b>卡 + RK3588實測!26TOPS加持,助力<b class='flag-5'>AI</b>視覺升級!

    AI送上太空,是終極方案還是瘋狂幻想?評論區(qū)說出你的陣營!

    AI
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月06日 09:43:34

    墨芯人工智能千卡集群正式簽約入駐新疆中心

    ,通過構(gòu)建“西部訓(xùn)練、東部推理”的協(xié)同范式,推動資源在全國范圍內(nèi)的優(yōu)化配置。 當(dāng)下,我國
    的頭像 發(fā)表于 12-30 17:27 ?706次閱讀

    積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對AI推理需求

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年,人工智能正式邁入應(yīng)用推理時代。大模型從實驗室走向千行百業(yè),推理需求呈指數(shù)級爆發(fā)。然而,高昂的推理成本與有限的
    的頭像 發(fā)表于 12-11 08:57 ?7847次閱讀

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時扛住訓(xùn)練和推理場景,之前做自動駕駛算法時,用它跑模型時延直接降了20%。 但疑惑也有:這種
    發(fā)表于 10-27 13:12

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練與推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速芯片,形成高并發(fā)分布式系統(tǒng),以滿足大模型訓(xùn)練和
    的頭像 發(fā)表于 09-22 02:43 ?8442次閱讀

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的
    的頭像 發(fā)表于 09-19 15:26 ?1745次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷演進(jìn)和物聯(lián)網(wǎng)應(yīng)用的持續(xù)拓展,騰視科技的
    的頭像 發(fā)表于 09-19 15:25 ?834次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    北京2025年7月30日 /美通社/ -- 近日,北京積科技有限公司(以下簡稱"積科技")宣布其服務(wù)平臺上線赤兔推理引擎。積
    的頭像 發(fā)表于 07-30 21:44 ?920次閱讀

    借勢 RISC-V與 AI 浪潮,元石智打造范式

    AI技術(shù)飛速發(fā)展的當(dāng)下,需求呈指數(shù)級增長,成為推動行業(yè)前行的核心動力。與此同時,RISC-V架構(gòu)憑借其開源、靈活、可定制等特性,正逐漸嶄露頭角,為AI
    的頭像 發(fā)表于 07-25 14:51 ?693次閱讀
    借勢 RISC-V與 <b class='flag-5'>AI</b> 浪潮,元石智<b class='flag-5'>算</b>打造<b class='flag-5'>算</b><b class='flag-5'>力</b>新<b class='flag-5'>范式</b>

    一文看懂AI集群

    最近這幾年,AI浪潮席卷全球,成為整個社會的關(guān)注焦點。大家在討論AI的時候,經(jīng)常會提到AI集群。AI
    的頭像 發(fā)表于 07-23 12:18 ?1633次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    革命:RoCE實測推理時延比InfiniBand低30%的底層邏輯

    AI 訓(xùn)練與推理中的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心在高帶寬、低延遲、高可靠性的需求下實現(xiàn)資源的最優(yōu)配置
    的頭像 發(fā)表于 05-28 14:08 ?2117次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命:RoCE實測<b class='flag-5'>推理</b>時延比InfiniBand低30%的底層邏輯

    芯片的生態(tài)突圍與革命

    據(jù)的爆發(fā)式增長,大芯片已成為科技競爭的核心領(lǐng)域之一。 ? 大芯片的核心應(yīng)用場景豐富多樣。在人工智能訓(xùn)練與推理方面,大模型(如 GPT
    的頭像 發(fā)表于 04-13 00:02 ?3264次閱讀

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對
    發(fā)表于 03-25 12:00