91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)項目難管理的原因是什么

汽車玩家 ? 來源: AI公園 ? 作者:Lukas Biewald ? 2020-04-19 11:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我看到過很多公司嘗試使用機器學(xué)習(xí) —— 有些大獲成功,有些慘敗。一個不變的事實是,機器學(xué)習(xí)團(tuán)隊很難設(shè)定目標(biāo)和期望。這是為什么呢?

機器學(xué)習(xí)項目難管理的原因是什么

1. 很難預(yù)先分辨出什么是難的,什么是容易的

是在國際象棋中擊敗卡斯帕羅夫更困難,還是撿起棋子并移動棋子更困難?計算機在二十多年前打敗了國際象棋世界冠軍,但是可靠地抓取和舉起物體仍然是一個未解決的研究問題。人類不擅長評估什么對人工智能來說是困難的,什么是容易的。即使在一個領(lǐng)域中,性能也可能有很大差異。預(yù)測情緒的準(zhǔn)確性有多高?在影評中,有大量的文本和作者很容易搞清楚他們的想法,現(xiàn)在能期待的準(zhǔn)確率是90-95%。在推特上,兩個人在80%的情況下對一條推文的觀點是一致的。在推文中,只要是關(guān)于航空公司的,那么總是把這條推文的情緒預(yù)測成負(fù)面的,就可以達(dá)到95%以上的準(zhǔn)確率。

度量標(biāo)準(zhǔn)也可能在項目的早期提升很多,然后突然碰壁。我曾經(jīng)舉辦過一場Kaggle競賽,全世界成千上萬的人競相為我的數(shù)據(jù)建模。在第一周,準(zhǔn)確率從35%上升到65%,但在接下來的幾個月里,準(zhǔn)確率從未超過68%。68%的準(zhǔn)確率顯然是數(shù)據(jù)對于最先進(jìn)的機器學(xué)習(xí)技術(shù)的限制。那些在Kaggle競賽中競爭的人非常努力地獲得了68%的正確率,我確信這是一個巨大的成就。但在大多數(shù)情況下,65%和68%是完全無法區(qū)分的。如果這是一個內(nèi)部項目,我肯定會對結(jié)果感到失望。

我的朋友Pete Skomoroch最近告訴我,作為一名研究機器學(xué)習(xí)的數(shù)據(jù)科學(xué)家,在工程部門工作是多么令人沮喪。工程項目通常會向前推進(jìn),但機器學(xué)習(xí)項目可能會完全停滯?;ㄒ恢軙r間對數(shù)據(jù)進(jìn)行建模,結(jié)果可能(甚至很常見)沒有任何改進(jìn)。

機器學(xué)習(xí)項目難管理的原因是什么

2. 機器學(xué)習(xí)很容易以意想不到的方式失敗.

機器學(xué)習(xí)通常工作得很好,只要你有大量的訓(xùn)練數(shù)據(jù)以及你在生產(chǎn)中運行的數(shù)據(jù)看起來很像你的訓(xùn)練數(shù)據(jù)。人類非常善于從訓(xùn)練數(shù)據(jù)中歸納歸納,因此我們對此有著可怕的直覺。我做了一個小機器人,帶著攝像機和一個視覺模型,這個模型是根據(jù)從網(wǎng)上獲取的成百萬的ImageNet圖像制作的。我對我的機器人相機上的圖像進(jìn)行了預(yù)處理,使其看起來像來自網(wǎng)絡(luò)的圖像,但準(zhǔn)確性比我預(yù)期的要差得多。為什么?網(wǎng)絡(luò)上的圖片往往會針對目標(biāo)物體進(jìn)行構(gòu)圖,但是我的機器人不一定會像人類攝影師那樣直視一個物體。人類甚至可能都沒有注意到這種差異,但使用現(xiàn)代深度學(xué)習(xí)網(wǎng)絡(luò)的時候就會非常痛苦。有很多方法可以處理這種現(xiàn)象,但我之所以注意到它,只是因為它的性能下降非常嚴(yán)重,我花了很多時間調(diào)試它。

更厲害的是,導(dǎo)致性能下降的細(xì)微差異很難被發(fā)現(xiàn)。接受《紐約時報》訓(xùn)練的語言模型不能很好地概括社交媒體文本。我們可以預(yù)料到。但很顯然,從2017年開始接受文本訓(xùn)練的模型,在2018年寫的文本中表現(xiàn)不佳。上游分布隨時間以多種方式變化。當(dāng)對手適應(yīng)了欺詐模型所做的事情時,欺詐模型就會完全崩潰。

3. 機器學(xué)習(xí)需要大量相關(guān)的訓(xùn)練數(shù)據(jù).

每個人都知道這一點,但這是一個巨大的障礙。如果你能夠收集并標(biāo)記大量的訓(xùn)練數(shù)據(jù),計算機視覺可以做很多驚人的事情。對于某些用例,數(shù)據(jù)是某些業(yè)務(wù)流程的副產(chǎn)品。這就是機器學(xué)習(xí)真正發(fā)揮作用的地方。對于許多其他用例來說,收集訓(xùn)練數(shù)據(jù)是非常昂貴和具有挑戰(zhàn)性的。許多醫(yī)療用例對于機器學(xué)習(xí)來說似乎是完美的 —— 使用許多微弱的信號和清晰的結(jié)果來做出關(guān)鍵的決策 —— 但是數(shù)據(jù)由于重要的隱私問題而被鎖定,或者一開始就沒有被統(tǒng)一的進(jìn)行收集。

許多公司不知道從哪里開始投資收集訓(xùn)練數(shù)據(jù)。這是一項重要的工作,很難預(yù)先預(yù)測該模型將如何工作。

解決這些問題的最佳實踐是什么?

1. 多注意你的訓(xùn)練數(shù)據(jù).

看看這個算法對它所訓(xùn)練的數(shù)據(jù)進(jìn)行錯誤分類的情況。這樣的錯誤幾乎總是標(biāo)注錯誤或者一些邊界樣本。不管怎樣,你都想了解他們。讓每個構(gòu)建模型的人都查看一下訓(xùn)練數(shù)據(jù)并自己標(biāo)注一些訓(xùn)練數(shù)據(jù)。對于許多用例來說,一個模型不太可能比兩個獨立的人達(dá)成一致的效果更好。

2. 先做端到端的工作,然后一次改進(jìn)一件事.

從可能有效的最簡單的事情開始,然后部署它。你會從中學(xué)到很多。過程中任何階段的額外復(fù)雜性都會改進(jìn)研究論文中的模型,但很少會改進(jìn)現(xiàn)實世界中的模型。每一個額外的復(fù)雜性都需要驗證。

將一些東西交到最終用戶手中,可以幫助你盡早了解模型可能工作得有多好,并且它可能會帶來一些關(guān)鍵問題,比如模型正在優(yōu)化的內(nèi)容與最終用戶想要的內(nèi)容之間的分歧。它還可能使你重新評估你正在收集的訓(xùn)練數(shù)據(jù)的類型。最好能盡快發(fā)現(xiàn)這些問題。

3. 尋找優(yōu)雅的方法來處理不可避免的算法失敗的情況.

幾乎所有的機器學(xué)習(xí)模型在相當(dāng)長的時間內(nèi)都會失敗,如何處理這一問題絕對是至關(guān)重要的。模型通常有一個可以使用的可靠的置信度評分。使用批處理過程,你可以構(gòu)建包含人在里面的循環(huán)系統(tǒng),將低可信度的預(yù)測發(fā)送給操作員,使系統(tǒng)能夠可靠地端到端工作,并收集高質(zhì)量的訓(xùn)練數(shù)據(jù)。對于其他用例,你可以使用一種標(biāo)記潛在錯誤的方式,或者對最終用戶來說不那么惱人的方式,來呈現(xiàn)低可信度的預(yù)測。

下面是一個沒有被妥善處理的失敗例子。微軟沒有預(yù)料到他們的Tay機器人能多快從推特上的噴子那里學(xué)會不良行為。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31134

    瀏覽量

    222501
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137036
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    PCM設(shè)備燈閃的原因是什么?廣州郵科工程師告訴你真相

    "PCM設(shè)備燈閃的原因是什么?"這是最近很多客戶咨詢我們的問題。別急,今天廣州郵科的技術(shù)小哥就來給大家好好嘮嘮這個話題。 PCM設(shè)備燈閃,到底是好是壞? 很多客戶一看到設(shè)備指示燈在閃,心里就發(fā)慌
    的頭像 發(fā)表于 03-11 10:17 ?44次閱讀
    PCM設(shè)備燈閃的<b class='flag-5'>原因是</b>什么?廣州郵科工程師告訴你真相

    園區(qū)用電難管理?不妨試下ADW300 遠(yuǎn)程全監(jiān)控

    安科瑞提供基于ADW300系列工業(yè)級WiFi智能電表的專業(yè)解決方案,其設(shè)計充分滿足現(xiàn)代工業(yè)場景對準(zhǔn)確計量、無線組網(wǎng)與數(shù)據(jù)安全的系統(tǒng)性要求。 35mm導(dǎo)軌安裝方式,支持磁鋼/穿刺取電方案,單表部署時間可控制在15分鐘以內(nèi)。內(nèi)置工業(yè)級WiFi通信模組,支持2.4GHz頻段與企業(yè)內(nèi)網(wǎng)無縫接入,無需額外布線,即可構(gòu)建覆蓋全廠區(qū)的分布式無線計量網(wǎng)絡(luò)。 在數(shù)據(jù)安全層面,電表支持加密認(rèn)證,可完全接入工廠現(xiàn)有有線或無線內(nèi)網(wǎng),實現(xiàn)能耗數(shù)據(jù)從采集、傳輸?shù)酱?/div>
    的頭像 發(fā)表于 03-10 10:28 ?76次閱讀

    機器人熱管理技術(shù)體系與方案

    機器人熱管理技術(shù)直接決定機器人的工作范圍、可靠性與使用壽命,是機器人向高功率、輕量化、極端環(huán)境適配方向發(fā)展的核心支撐……熱管理系統(tǒng)作為
    的頭像 發(fā)表于 03-07 08:32 ?323次閱讀
    <b class='flag-5'>機器</b>人熱<b class='flag-5'>管理</b>技術(shù)體系與方案

    ACN配電監(jiān)控模塊:4路/8路多回路管理,50A磁保持繼電器大功率適配

    、核心定位 ACN配電監(jiān)控模塊是智能配電系統(tǒng)的末端執(zhí)行與感知單元,一體化安裝控制,可直接負(fù)載5500W電機設(shè)備。相當(dāng)于配電回路的“神經(jīng)末梢”,可獨立監(jiān)測并控制多路(2/4/8路常見)交流負(fù)載,解決傳統(tǒng)配電“看不見、控不了、難管理
    的頭像 發(fā)表于 02-09 16:10 ?135次閱讀

    色差是什么?它產(chǎn)生的原因是什么?

    色像差(簡稱色差)。色差產(chǎn)生的原因色差產(chǎn)生的根本原因就是由于光的色散效應(yīng)。白光是由不同波長的可見光組成的,例如紅色的光波長為620-750納米,藍(lán)色的波長為450
    的頭像 發(fā)表于 01-27 17:19 ?777次閱讀
    色差是什么?它產(chǎn)生的<b class='flag-5'>原因是</b>什么?

    使用ads1292r,上電后,DOUT有持續(xù)波形,但是drdy始終為低,可能的原因是什么?

    上電后,按照手冊的上電時序,start置1,clksel在電路板連avdd。結(jié)果DOUT有持續(xù)波形,但是drdy始終為低,可能的原因是什么?
    發(fā)表于 01-25 15:38

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?223次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    鶴山它人機器項目正式投產(chǎn)

    12月15日上午,位于鶴山市沙坪街道的鶴山市城鄉(xiāng)融合發(fā)展產(chǎn)業(yè)園迎來重要時刻——鶴山它人機器項目正式投產(chǎn),這一總投資2億元的智能裝備制造項目,將助力鶴山在機器人產(chǎn)業(yè)賽道加速布局,為區(qū)域
    的頭像 發(fā)表于 12-23 17:20 ?960次閱讀

    東軟集團(tuán)榮獲2025年度PMI中國項目管理大獎

    近日,在2025PMI項目管理大會上,東軟集團(tuán)“海外車載導(dǎo)航系統(tǒng)開發(fā)項目”榮獲2025年度PMI(中國)項目管理大獎——杰出
    的頭像 發(fā)表于 11-14 10:06 ?494次閱讀

    如何解決開發(fā)機器學(xué)習(xí)程序時Keil項目只能在調(diào)試模式下運行,但無法正常執(zhí)行的問題?

    如何解決開發(fā)機器學(xué)習(xí)程序時Keil項目只能在調(diào)試模式下運行,但無法正常執(zhí)行的問題
    發(fā)表于 08-28 07:28

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2927次閱讀

    STM32+Android實現(xiàn)的智能家政機器人電路代碼論文及項目源碼

    STM32+Android實現(xiàn)的智能家政機器人電路代碼論文及項目部分截圖:
    發(fā)表于 05-28 21:22

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    的限制和調(diào)控) 本書還有很多前沿技術(shù)項目的擴展 比如神經(jīng)網(wǎng)絡(luò)識別例程,機器學(xué)習(xí)圖像識別的原理,yolo圖像追蹤的原理 機器學(xué)習(xí)訓(xùn)練三大點:
    發(fā)表于 04-30 01:05

    在線監(jiān)測管理系統(tǒng)的智能化功能詳解 多角色權(quán)限與多項目管理 多終端適配

    在線監(jiān)測管理系統(tǒng)的智能化功能詳解 多角色權(quán)限與多項目管理 多終端適配 在線監(jiān)測管理系統(tǒng)采用基于BS架構(gòu)設(shè)計,用戶可通過瀏覽器實現(xiàn)項目
    的頭像 發(fā)表于 03-19 17:18 ?819次閱讀