91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何在任何機器學習項目開始時預見對后續(xù)更新的需求

倩倩 ? 來源:AI科技大本營 ? 2020-03-25 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

高效的機器學習模型需要高質(zhì)量的數(shù)據(jù)。訓練你的機器學習模型并不是過程中的單個有限階段。即使將其部署到生產(chǎn)環(huán)境中,也可能需要穩(wěn)定的新訓練數(shù)據(jù)流來確保模型隨時間推移的預測準確性。

畢竟,訓練數(shù)據(jù)會顯式地調(diào)用數(shù)據(jù)集中的屬性,這些屬性代表外部世界中不斷變化的基本事實。如果不進行周期性的重新訓練,隨著現(xiàn)實世界變量的演變,模型的準確性自然會隨時間下降。

在本文中,我們將討論為什么不管你的初始訓練數(shù)據(jù)過程多么嚴格,繼續(xù)訓練你的機器學習模型都是至關重要的。我們還將討論再訓練的方法以及每種方法的優(yōu)點。

最后,我們將介紹如何在任何機器學習項目開始時預見對后續(xù)更新的需求。通過從一開始就建立再訓練流程,幫你設計一個可持續(xù)的預測模型。

數(shù)據(jù)漂移與再訓練需求

為什么大多數(shù)機器學習模型都需要更新才能保持準確性?答案在于訓練數(shù)據(jù)的性質(zhì)以及它如何告知機器學習模型的預測功能。

訓練數(shù)據(jù)是一個靜態(tài)數(shù)據(jù)集,機器學習模型可從該數(shù)據(jù)集中推斷出模式和關系,并形成對未來的預測。

隨著現(xiàn)實世界條件的變化,訓練數(shù)據(jù)的基本事實方面表示可能會不太準確。想象一下用于預測50個大型都會區(qū)租金成本的機器學習模型。從2000年到2019年的訓練數(shù)據(jù)可能會以驚人的準確性預測2020年的租金價格。在預測2050年的租金價格時,這種方法可能會不太有效,因為房地產(chǎn)市場的基本性質(zhì)可能在未來幾十年內(nèi)發(fā)生變化。

應用自然語言處理(NLP)來訓練聊天機器人提供了數(shù)據(jù)漂移的另一個有用的例子。我們使用語言的方式正在不斷演變,因此必須更新用于聊天機器人的訓練數(shù)據(jù)的語義分析,來反映當前的語言。想象一下,嘗試使用1980年代的培訓數(shù)據(jù)來訓練聊天機器人與現(xiàn)代消費者進行互動。在40年中,語言可能會發(fā)生重大變化,這迫使人們需要更新訓練數(shù)據(jù)。

這一現(xiàn)象已經(jīng)有了多種描述方法,包括數(shù)據(jù)漂移、概念漂移和模型衰減。不管你怎么稱呼它,它都代表了機器學習的硬道理:在未來的某個時候,你的訓練數(shù)據(jù)將不再為準確的預測提供基礎。

如何應對這個不可避免的挑戰(zhàn)呢?答案是定期使用新的或擴展的數(shù)據(jù)重新訓練你的模型。實際上,訓練你的模型是一個持續(xù)的過程,特別是在質(zhì)量要求很高的情況下。

你應該如何更新你的機器學習模型?簡單來說,你有兩個選擇:使用更新的輸入手動重新訓練模型,或構建一個旨在從新數(shù)據(jù)中不斷學習的模型。

手動模型重新訓練方法

手動更新機器學習模型的方法本質(zhì)上是復制你的初始訓練數(shù)據(jù)過程,但要使用一組更新的數(shù)據(jù)輸入。在這種情況下,你可以決定如何以及何時向算法提供新數(shù)據(jù)。

此選項的可行性取決于你定期獲取和準備新訓練數(shù)據(jù)的能力。你可以隨時監(jiān)控模型的性能,確定何時需要更新。如果模型的準確性明顯下降,則可能需要對更新的數(shù)據(jù)進行重新訓練。

這種方法的優(yōu)點之一是修修補補通常可以帶來真知灼見和創(chuàng)新。如果密切監(jiān)視模型并找出缺點,你可能會發(fā)現(xiàn)包含額外數(shù)據(jù)或以更基本的方式修改算法的價值。

模型訓練的持續(xù)學習方法

持續(xù)學習模型通常會從部署了數(shù)據(jù)的生產(chǎn)環(huán)境中合并新的數(shù)據(jù)流。

消費者每天都會參與持續(xù)學習的機器學習模型。以音樂流媒體平臺Spotify為例,該平臺使用協(xié)作過濾功能,根據(jù)具有相似愛好的其他用戶的偏好向用戶提供推薦,來創(chuàng)造價值和競爭優(yōu)勢。

當Spotify用戶收聽音樂時,與他們的選擇有關的數(shù)據(jù)會反饋到公司的預測算法中。由此產(chǎn)生的反饋循環(huán)完善了該應用為其用戶提供的推薦,并允許高級個性化設置,例如機器生成的個性化播放列表。Netflix等其他領先的消費媒體服務提供商也使用類似的持續(xù)學習系統(tǒng)。

如你所料,構建這些系統(tǒng)所需的技術專業(yè)知識和資源對于許多組織來說根本無法滿足。此外,你需要穩(wěn)定的數(shù)據(jù)流來進行自動集成。在持續(xù)學習模型中,人為干預是可能的,但它代表了一個真正的瓶頸。例如,Spotify在將其數(shù)百萬用戶生成的數(shù)據(jù)反饋回其算法之前,不需要對其進行清理或格式化。

無論是手動更新還是持續(xù)學習似乎都是更有效(可行)的選擇,你需要從戰(zhàn)略上考慮用于生成新數(shù)據(jù)來進行再培訓的勞動力和技術。如果你打算在可預見的將來使用你的模型,則需要合適的資源來保持該模型最新。

預測進化:選擇團隊

創(chuàng)建訓練數(shù)據(jù)需要人員、流程和工具的戰(zhàn)略組合。要解決收集、清理和標記數(shù)據(jù)的模糊性,你需要一個高效的技術人員團隊,其中包括熟練的技術人員和先進的技術。

許多組織無法管理或擴展內(nèi)部團隊來準備訓練數(shù)據(jù),因此他們尋求利用人類智能的替代方法。眾包勞動力是一種常見選擇,它使你可以在短時間內(nèi)找到數(shù)百名匿名工人。

然而,匿名眾包帶來了隱性成本,包括與員工的溝通不暢,這可能導致工作質(zhì)量低下。而且,如果在開發(fā)初期訓練數(shù)據(jù)集時這些缺點很明顯,那么當你嘗試重新訓練和更新模型時,這些缺點將讓人特別沮喪。

在一群匿名的眾包工人的情況下,幾乎不可能進行監(jiān)督或轉(zhuǎn)移機構記憶。每次開發(fā)新的訓練數(shù)據(jù)時,都有發(fā)現(xiàn)新的不一致和性能問題的風險。

或許你也可以選擇另一種方式,將這個問題外包給靠譜的、專業(yè)解決這種問題的企業(yè),會更有保障。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8556

    瀏覽量

    137043
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26215
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術為機器視覺(乃至生產(chǎn)自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?925次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經(jīng)網(wǎng)絡

    如何解決開發(fā)機器學習程序時Keil項目只能在調(diào)試模式下運行,但無法正常執(zhí)行的問題?

    如何解決開發(fā)機器學習程序時Keil項目只能在調(diào)試模式下運行,但無法正常執(zhí)行的問題
    發(fā)表于 08-28 07:28

    何在 Linux 階段進行 OTA 更新?

    何在 Linux 階段進行 OTA 更新
    發(fā)表于 08-20 08:27

    何在 uboot 階段進行 MA35D1 OTA 更新?

    何在 uboot 階段進行 MA35D1 OTA 更新
    發(fā)表于 08-20 06:05

    【「Yocto項目實戰(zhàn)教程:高效定制嵌入式Linux系統(tǒng)」閱讀體驗】+基礎概念學習理解

    系統(tǒng)的基礎知識,及yocto的基礎知識。這部分內(nèi)容對于我這樣有一定 Linux 基礎的讀者來說,起到了很好的復習和鞏固作用,同時也為后續(xù)學習 Yocto 項目奠定了堅實的理論基礎。 元數(shù)據(jù) 元數(shù)據(jù)架構
    發(fā)表于 08-04 22:29

    超小型Neuton機器學習模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2928次閱讀

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)機器
    的頭像 發(fā)表于 05-28 10:06 ?2166次閱讀

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識

    機器人技術的飛速發(fā)展,ROS 2 作為其核心工具之一,為開發(fā)者提供了強大的支持。與傳統(tǒng)的理論書籍不同,本書深入淺出地講解了 ROS 2 的架構、開發(fā)流程以及在智能機器項目中的應用,以代碼作為切入口,讓人
    發(fā)表于 04-27 11:24

    在任何平臺上使用PetaLinux的先決條件

    本篇文章介紹了在任何平臺上使用 PetaLinux 的先決條件。PetaLinux 是一種嵌入式 Linux 軟件開發(fā)套件 (SDK),主要用于基于 FPGA 的系統(tǒng)級芯片 (SoC) 設計或 FPGA 設計。
    的頭像 發(fā)表于 04-24 10:40 ?1610次閱讀
    <b class='flag-5'>在任何</b>平臺上使用PetaLinux的先決條件

    如何成為一名合格的KaihongOS北向應用開發(fā)工程師

    開發(fā)者社區(qū),與其他開發(fā)者交流經(jīng)驗。 開源貢獻:參與開源項目,貢獻代碼或文檔,以提升個人技能和社區(qū)影響力。 9. 持續(xù)學習 技術更新:跟蹤 KaihongOS 和相關技術的最新消息和更新
    發(fā)表于 04-23 06:46

    S32K118EVB-Q064如何在firs幀后停止tx?

    您好,我需要使用 CAN2.0 標準 ID。我需要每 500 毫秒發(fā)送一個數(shù)據(jù)幀,但是當傳輸開始時,micro 不會在第一幀后停止,而是始終在傳輸。我正在使用 S32K118EVB-Q064。 如何在 firs 幀后停止 tx?
    發(fā)表于 04-09 07:22

    可以在任何FLEXCOMM接口上使用MDIO嗎?

    我正在使用 NXP LPC55S28JBD100與 I2C 和 MDIO 設備通信。在MCUXpresso IDE的PINS工具中,我在FLEXCOMM3顯示屏中看到引腳列為MDIO和MDC。FLEXCOMM3 可以作為 MDIO 主站運行嗎?或者,我可以在任何 FLEXCOMM 接口上使用 MDIO 嗎?
    發(fā)表于 04-08 07:52

    **【技術干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    人臉識別指南:如何在樹莓派上安裝和設置 Dlib

    學習何在樹莓派上安裝Dlib并配置人臉識別功能,為您的AI項目奠定基礎。在樹莓派上安裝Dlib的詳細步驟要為樹莓派安裝Dlib并確保人臉識別項目順利運行,請按照以下詳細步驟操作。前置
    的頭像 發(fā)表于 03-24 17:31 ?1572次閱讀
    人臉識別指南:如<b class='flag-5'>何在</b>樹莓派上安裝和設置 Dlib