91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能中訓練和推理的區(qū)別是什么,需要關注哪些要點

wFVr_Hardware_1 ? 來源:硬件十萬個為什么 ? 作者:硬件十萬個為什么 ? 2022-12-16 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們在學習人工智能時常會遇到訓練(Training)和推理(Inference)兩個概念,這是人工智能實現(xiàn)的兩個環(huán)節(jié)。今天我們一起討論一下以下兩個問題。

訓練和推理的區(qū)別是什么?

區(qū)分人工智能訓練和推理芯片/產品需要關注哪些要點?

1、訓練和推理的區(qū)別是什么?

訓練過程:又稱學習過程,是指通過大數(shù)據(jù)訓練出一個復雜的神經(jīng)網(wǎng)絡模型,通過大量數(shù)據(jù)的訓練確定網(wǎng)絡中權重和偏置的值,使其能夠適應特定的功能。在訓練中需要調整神經(jīng)網(wǎng)絡權重以使損失函數(shù)最小,通過反向傳播來執(zhí)行訓練以更新每層中的權重。訓練過程需要較高的計算性能、需要海量的數(shù)據(jù)、訓練出的網(wǎng)絡具有一定通用性。

推理過程:又稱判斷過程,是指利用訓練好的模型,使用新數(shù)據(jù)推理出各種結論。推理是預測或推斷的過程,借助在訓練中已確定參數(shù)的神經(jīng)網(wǎng)絡模型進行運算,利用輸入的新數(shù)據(jù)來一次性進行分類或輸出預測結果。

我們可以類比我們自己進行學習,并用自己學到的知識進行判斷的過程。學習的過程(訓練)是這樣的,當我們在學校開始學習一門新學科,為了掌握大量的知識,我們必須讀大量的書、專心聽老師講解,課后我們還要做大量的習題鞏固自己對知識的理解,并通過考試來驗證學習的結果,當我們考試通過后我們才算是完成了整個學習過程。每次考試,有的同學考分高,有的同學考分低,這個就是學習效果的差別了。當然,如果你不幸考試沒有通過,還要繼續(xù)重新學習,不斷提升你對知識的掌握程度,直到最終通過考試為止。而判斷的過程(推理)如下,我們應用所學的知識進行判斷,比如你從醫(yī)學專業(yè)畢業(yè),開始了你治病救人的工作,這時候你對病人病因的判斷就是你在做“推理”的工作,你診斷100個病人,其中99個你都能準確的判斷出病因,大家都夸你是一個好醫(yī)生,學有所成、判斷準確。

綜上,人工智能的這種訓練過程和推理過程,和人類大腦學習過程和判斷的過程非常相似。通常需要花很長時間來學習(即訓練),而學會之后進行判斷(即推理)的時間只需要一剎那就行了。

2、區(qū)分人工智能訓練和推理芯片/產品需要關注哪些要點? 根據(jù)承擔任務的不同,AI芯片/產品可以分為兩類,分別是訓練AI芯片和推理AI芯片,他們的主要區(qū)別是以下幾點。

(1)部署的位置不一樣

大量的訓練芯片都在云端,即部署于數(shù)據(jù)中心內,利用海量的數(shù)據(jù)和龐大而復雜的神經(jīng)網(wǎng)絡進行模型訓練,這類芯片都很復雜。目前,除了英偉達、超威、英特爾等芯片公司,谷歌等這些互聯(lián)網(wǎng)公司都有云端訓練芯片,國內華為、寒武紀還有好多初創(chuàng)公司也在做云端訓練芯片。

很多的推理芯片也會放置在云端,數(shù)據(jù)中心中很多服務器都會配置推理用的PCIE插卡,還有大量的推理芯片用在邊緣側(各種數(shù)據(jù)中心外的設備),如自動駕駛汽車、機器人、智能手機、無人機物聯(lián)網(wǎng)設備,它們都是用訓練好的模型進行推理。布局云端推理芯片和邊緣側推理芯片的公司更多,產品種類豐富,定制化程度也會高很多。

(2)性能要求不一樣

準確度/精度要求不一樣

我們從性能角度評價一個人工智能系統(tǒng)的效果,可以通過準確度/精度這樣的指標,比如在100個樣本中,能預測了 85 個樣本,準確率為 85%,人工智能 算法是基于概率論和統(tǒng)計學的,不可能達到 100% 的預測準確率,并且實現(xiàn)越高的準確度需要付出越大的努力和代價越大。我們經(jīng)常提到的數(shù)據(jù)精度,也會直接影響系統(tǒng)準確性,我們可以把數(shù)據(jù)的精度類比為照片中的像素數(shù),像素越多則分辨率越高,同樣,精度越高,表征事物越準確。提高精度也是有代價的,它需要系統(tǒng)提供更多的內存,并要耗費更長的處理時間,比如有數(shù)據(jù)證明采用int4精度與int8相比具有59%的加速。

實際應用中,并不是準確度越高越好或支持的數(shù)據(jù)精度越高越好,不同的應用場景對于性能指標的要求也是不一樣的。以圖像識別應用為例,在零售店人員跟蹤中,識別經(jīng)過某個過道的顧客,這種應用5% ~10%的誤差是可以接受的;但是在醫(yī)療診斷或汽車視覺的等應用中,準確度的要求就要高很多,準確度低了就無法應用??傊?,不同應用對于準確度和精度的容忍度是不一樣的,需要我們進行權衡。

回到推理和訓練產品,選擇時就有很大區(qū)別,比如在邊緣側的推理產品中,由于它對準確度的要求不高,我們可能只要支持int8甚至更低的精度就可以了。但是訓練產品,比如用于高性能計算(HPC)場景中,必須有能力實現(xiàn)高的準確度,支持的數(shù)據(jù)精度范圍也需要更加豐富,比如需要支持FP32、FP64這樣精度的數(shù)據(jù)。10月7日美國對我國新一期的芯片限制法案中,就有一條是對我們支持FP64計算類芯片的研發(fā)和生產進行限制。

計算量要求不一樣

訓練需要密集的計算,通過神經(jīng)網(wǎng)絡算出結果后,如果發(fā)現(xiàn)錯誤或未達到預期,這時這個錯誤會通過網(wǎng)絡層反向傳播回來(參考 機器學習中的函數(shù)(3) - “梯度下降”走捷徑,“BP算法”提效率 ),該網(wǎng)絡需要嘗試做出新的推測,在每一次嘗試中,它都要調整大量的參數(shù),還必須兼顧其它屬性。再次做出推測后再次校驗,通過一次又一次循環(huán)往返,直到其得到“最優(yōu)”的權重配置,達成預期的正確答案。如今,神經(jīng)網(wǎng)絡復雜度越來越高,一個網(wǎng)絡的參數(shù)可以達到百萬級以上,因此每一次調整都需要進行大量的計算。曾在斯坦福大學做過研究,在谷歌和百度都任職過的吳恩達這樣舉例“訓練一個百度的漢語語音識別模型不僅需要4TB的訓練數(shù)據(jù),而且在整個訓練周期中還需要20 exaflops(百億億次浮點運算)的算力”,訓練是一個消耗巨量算力的怪獸。 推理是利用訓練好的模型,使用新數(shù)據(jù)推理出各種結論,它是借助神經(jīng)網(wǎng)絡模型進行運算,利用輸入的新數(shù)據(jù)“一次性”獲得正確結論的過程,他不需要和訓練一樣需要循環(huán)往復的調整參數(shù),因此對算力的需求也會低很多。

存儲要求不一樣

訓練的時候反向調整會應用到前饋網(wǎng)絡計算的中間結果,所以需要很大的顯存,訓練的芯片存儲的設計和使用的方案是復雜的。訓練好的模型,需要使用大量數(shù)據(jù),大量數(shù)據(jù)要讀入顯存,顯存帶寬要足夠大、時延要足夠低。同時,我們在神經(jīng)網(wǎng)絡的訓練中使用梯度下降算法,顯存中除了加載模型參數(shù),還需要保存梯度信息的中間狀態(tài),因此訓練相比于推理,顯存需求大大增加,顯存足夠大才能運轉起來。

綜上,訓練和推理的芯片/產品部署的位置不一樣,對于性能準確度和精度的要求不一樣,對于算力能力和存儲大小的要求也不一樣,除了這些關鍵指標差異外。用于訓練場景的芯片高精度、高吞吐量,因此單芯片功耗大(甚至可以達到300W),這種芯片成本也很高;用于云端推理的芯片,更加關注算力、時延等的平衡,對功耗成本也非常敏感。參考英偉達的產品,它每一代產品并沒有開發(fā)專門的推理卡,其使用的是訓練卡的低配版本來做推理的。但邊緣測應用推理芯片,就一定要結合應用場景,做到低功耗、低成本。

3、我們如何去學習理解人工智能里的訓練和推理?

要學習理解人工智能,訓練和推理相關的知識是必須都要掌握的,如果你只學習了“訓練”中如何搭建網(wǎng)絡,參數(shù)調整等,那么你就無法了解結合實際應用“推理”是如何發(fā)揮作用的,接不了地氣;同樣,如果你只做過“推理”的操作,那么你也不能理解在實現(xiàn)推理判斷之前,需要做哪些準備工作,進行大量的計算,才能訓練出一個可用的、好的神經(jīng)網(wǎng)絡。 審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:人工智能中訓練和推理的區(qū)別是什么?

文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領域
    的頭像 發(fā)表于 02-22 08:24 ?268次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    開發(fā)智能體配置-內容合規(guī)

    智能體上架前,需完成“人工智能生成合成內容標識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內容合規(guī)】填寫。 人工智能
    發(fā)表于 02-07 11:44

    訓練推理:大模型算力需求的新拐點已至

    在大模型產業(yè)發(fā)展的早期階段,行業(yè)焦點主要集中在大模型訓練所需的算力投入。一個萬億參數(shù)大模型的訓練可能需要數(shù)千張GPU芯片連續(xù)運行數(shù)月,成本高達數(shù)千萬甚至上億元。但隨著大模型技術的成熟和應用落地,
    的頭像 發(fā)表于 02-05 16:07 ?979次閱讀
    從<b class='flag-5'>訓練</b>到<b class='flag-5'>推理</b>:大模型算力需求的新拐點已至

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    電子發(fā)燒友網(wǎng)綜合報道,在人工智能迅猛發(fā)展的當下,AI推理芯片需求正呈爆發(fā)式增長。 ? AI推理,即支撐如ChatGPT這類AI模型響應用戶問題和請求的計算過程。過去,英偉達在訓練大型A
    的頭像 發(fā)表于 02-03 17:15 ?3130次閱讀

    墨芯人工智能千卡集群正式簽約入駐新疆算力中心

    在“東數(shù)西算”國家工程全面推進的大背景下,新疆憑借其豐富的清潔能源和獨特的區(qū)位優(yōu)勢,正迅速崛起為國家級算力網(wǎng)絡的關鍵樞紐。近日,墨芯人工智能(以下簡稱“墨芯”)的千卡集群正式簽約入駐新疆算力中心
    的頭像 發(fā)表于 12-30 17:27 ?831次閱讀

    思必馳場景化推理AI重塑智能交互

    在AI技術從“感知”走向“認知”的今天,推理能力正成為推動人工智能向更高階躍遷的核心引擎。
    的頭像 發(fā)表于 12-12 11:31 ?808次閱讀

    PCB設計單點接地與多點接地的區(qū)別與設計要點

    一站式PCBA加工廠家今天為大家講講PCB設計的單點接地與多點接地有什么區(qū)別?單點接地與多點接地區(qū)別與設計要點。在PCB設計,接地系統(tǒng)的
    的頭像 發(fā)表于 10-10 09:10 ?2495次閱讀
    PCB設計<b class='flag-5'>中</b>單點接地與多點接地的<b class='flag-5'>區(qū)別</b>與設計<b class='flag-5'>要點</b>

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    應用。 為什么選擇 Neuton 作為開發(fā)人員,在產品中使用邊緣人工智能的兩個最大障礙是: ML 模型對于您所選微控制器的內存來說太大。 創(chuàng)建自定義 ML 模型本質上是一個手動過程,需要高度的數(shù)據(jù)科學知識
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    應用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    應用場景。從數(shù)據(jù)采集,到模型推理,都能完整且自如地參與,輕松解鎖人工智能全流程實訓,讓你深度體驗AI技術的魅力 。 四、九門課程全覆蓋,滿足多元學習需求 對于高校教學或者技術學習來說,課程覆蓋的廣度
    發(fā)表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應用.

    可以在廣泛的傳感器網(wǎng)絡的每個節(jié)點上進行人工智能處理,而在這種網(wǎng)絡,傳感器的尺寸和成本是關鍵,空間也非常寶貴。
    發(fā)表于 07-31 11:38

    信而泰×DeepSeek:AI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(NLP)、深度
    發(fā)表于 07-16 15:29

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘

    2025年年初,DeepSeek 成為全球人工智能(AI)領域的焦點,其DeepSeek-V3 和DeepSeek-R1 版本在行業(yè)內引發(fā)了結構性震動。 DeepSeek-V3 是一個擁有 6710
    發(fā)表于 06-09 14:38

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55