91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習在現實世界中的真相

汽車玩家 ? 來源:AI公園 ? 作者:Delip ? 2020-05-04 11:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

當你在現實世界中工作時,有幾個事實是你必須面對的,這也是本文的主要內容。

上個月,我在一個親密的朋友聚會上做了一個非正式的演講,我把這個題目記下來。這篇文章主要是寫給那些使用機器學習來構造東西的人,而不是那些研究機器學習的人,盡管后一組人會很好地傾聽這些真理并反省他們的工作。

0. 你不是一個科學家

是的,雖然你們的 title 是“科學家”,包括你們所有擁有博士學位的人,以及涉足這個行業(yè)的學者。但是,機器學習(以及其他人工智能應用領域,如 NLP、視覺、語音……)是一門工程研究學科(與科學研究相對)。

你會問,科學研究和工程研究有什么區(qū)別?George A. Hazelrigg 在他的“HONING YOUR PROPOSAL WRITING SKILLS”中寫道:

一些科學家會學習如何制定研究計劃。很少有工程師是博士級別的工程師。讓我們先試著理解科學研究和工程研究之間的區(qū)別。對我來說,區(qū)別很明顯??茖W家力圖了解大自然的本質,以了解其根本的本質。為了做到這一點,科學家通常剝離無關的影響,深入到一個非常狹窄的自然元素。這就是我們所說的自然法則:能量和質量是一樣的,每一個作用力都有一個大小相等、方向相反的反作用力,依此類推。有許多自然法則,它們隨時隨地都適用。工程師遵循自然法則。他們別無選擇。他們的目標是設計出在自然允許的范圍內工作的東西。要做到這一點,他們必須能夠預測系統(tǒng)的行為。所以工程師們面臨的一個大問題是,我們如何理解和預測一個系統(tǒng)的行為,在這個系統(tǒng)中,所有的自然法則在任何時候都適用于任何地方。這是一個整合的問題,它就像找到一開始的規(guī)律一樣困難。每時每刻把所有的自然規(guī)律都考慮進去是不可能的。因此,工程師必須找到方法來確定哪些定律是重要的,哪些可以忽略,以及如何近似那些在時間和空間上都很重要的定律。工程師不僅僅是預測未來。他們做出的決定部分是基于他們的預測,因為他們知道自己的預測不可能既準確又確定。理解和應用數學也很重要。這包括概率論、決策理論、博弈論、最優(yōu)化、控制理論和其他數學在工程決策環(huán)境中的應用。這也是一個合理的工程研究領域。

作為 ML 的研究人員和實踐者,你必須考慮你擁有的數據的正確模型,而不是你擁有的模型的正確數據集(就像許多研究論文一樣)。如果你曾經問過“這個模型的正確數據集是什么”,那么你并不是在現實世界中。到底什么是真實的世界?在現實世界中,你對要處理的數據是沒有選擇的。在這里,數據定義了問題,而不是相反。有時,在現實世界中,ML 實踐者創(chuàng)建了一個自己的世界作為他們的建模游樂場,從而假裝他們是“科學家”,例如“發(fā)明”一種用于做 NLP 的語言,或者通過簡化假設來創(chuàng)建封閉的環(huán)境來強化學習。這些研究得出了有趣的結果,但它們的范圍僅限于它們所來自的世界,即使研究人員喜歡在論文中把它們當作適用于現實世界的東西來兜售。在現實世界中,輸入的分布更有可能發(fā)生變化,長尾的“curve balls”不知從何而來,你并不總是有答案。

當你在現實世界中工作時,有幾個事實是你必須面對的,這也是本文的主要內容。但這個開場白是必不可少的。如果你在現實世界中做 ML 研究,你是工程師而不是科學家。

1. 需要可以工作

雖然這聽起來很簡單,但我很驚訝有多少人,不管是新手還是有經驗的人,都被一些聽起來很花哨的名字吸引住了,或者因為一些東西來自 DeepMind、OpenAI、斯坦福大學、麻省理工學院等等。如果你的模型確實只能夠在它們的環(huán)境和資源約束下處理他們的數據集和,那么現實世界將無情地拒絕它。arXiv 上的許多結果只能在少數數據集上工作,或者只能在只有谷歌基礎設施支持的百兆級 gpu 上工作。幫社區(qū)一個忙,不要再發(fā)布那些一般性的結果了。它必須能工作。這也是為什么我們今天不考慮在沒有卷積神經網絡計算機視覺中做任何事情,或者為什么我們很容易在序列模型中使用注意力的原因。它必須要能工作。

推測:這么多人,特別是 ML 的新手,被花哨的模型名稱沖昏了頭腦,迫不及待地想要嘗試它們,或者寫關于它們的博客帖子,等等。我覺得這就像一個初學寫作的人。他們認為使用華麗的詞語會使他們的寫作更好,但經驗會告訴他們其他的。

2. 無論你如何努力,無論你的優(yōu)先級是什么,你都不能提高光速

緩存層次結構已經是固定的,你必須在這個前提下工作,網絡開銷會讓分布式訓練變慢,在向量中只能塞入那么多內容,等等。

3. 只要有足夠的推力,豬就能飛得很高,然而,這并不一定是一個好主意

一個研究生或大型的超參數掃描器可以在一個巨大的數據中心中可以找到一組超參數,可以讓非常復雜的模型工作得很好,甚至產生優(yōu)秀的結果。但沒有人在現實世界中調試那么大的模型。我在幫助公司管理他們的 ML 團隊時發(fā)現了一個秘密 — 大多數人不知道/不關心超參數調優(yōu)。

4. 生活中的一些事情,除非親身經歷過,否則永遠不會被完全欣賞或理解

對于既不構建生產 ML 模型也不維護它們的人來說,機器學習中的某些東西是永遠無法完全理解的。再多的課件,再多的 mooc,再多的 Kaggling,都無法讓你為此做好準備。沒有什么可以替代部署模型、觀察用戶與模型的交互、處理代碼/模型分解等等。

5. 總是有可能將多個獨立的問題聚合成一個復雜的相互依賴的解決方案,在大多數情況下,這是一個壞主意

端到端學習在理論上聽起來是一個好主意,但是對于大多數部署場景,分段優(yōu)化的管道架構將繼續(xù)存在。這并不意味著我們將完全沒有端到端系統(tǒng)(語音識別和機器翻譯有很好的端到端生產價值解決方案),但在大多數情況下,具有可觀察的調試路徑將勝過其他選擇。

6. 把一個問題轉移到別處,甚至是忽略它,都比解決它要容易得多

例如,在語音方面,聲學建模是困難的,但是你可以讓網絡在解決不同問題(例如語音識別)的方法中找出這些細節(jié)。在 NLP 中,很難進行正確的解析。但值得慶幸的是,對于 99%的現實任務,我們可以不進行解析。

推論:除非迫不得已,否則不要解決問題。

7. 你總是要在一些事情上做權衡

速度 vs 內存,電池壽命 vs 準確性,公平性 vs 準確性,易于實現 vs 可維護性,……

8. 一切都比你想象的復雜

與購物時的價格沖擊類似,工作中也有“努力沖擊”。大多數經驗豐富的研究人員和工程師都經歷過“努力沖擊”,要么是因為他們低估了處理大型數據集的工程問題,要么是因為他們低估了正在與之搏斗的領域的復雜性,要么是因為他們低估了對手。大多數論文讓讀者讀起來覺得事情很簡單,而忽略了這背后是經過了幾百萬次失敗才有的成功。因此,論文不是研究,而是做研究的結果。因為這個原因,你永遠可能通過閱讀論文來體驗做研究的過程。

9. 你永遠都會是準備不足

這可以和第 8 點結合起來,事實上任何遠程調用的成功的模型如果沒有適當的計劃,都可能由于自身的成功而崩潰。

10. 一個尺碼不可能適合所有人,你的模型會一直犯令人尷尬的錯誤,盡管你的出發(fā)點是好的

角落案例和長尾失敗模式將困擾你。值得慶幸的是,對于許多非關鍵的 ML 部署來說,這并不是什么大問題。最壞的情況下,它會成為一條搞笑的推文。但是,如果你在醫(yī)療保健或其他高風險情況下工作,ML 部署將因此成為一場噩夢。

11. 每一個舊的想法都會以不同的名字和不同的形式被再次提出,不管它是否有效

Schimdhuber 可能提出了一個更大的觀點。沒有人聽他的,像他一樣,我們把舊酒重新裝進新瓶子,被迫重復錯誤的歷史。

12. 達到完美不是因為沒有什么可以補充的,而是因為沒有什么可以去掉的

生活中的每件事都是如此,現實世界中的機器學習也是如此。唉,我們的會議回顧了他們對“新穎性”的嗜好,產生了不想要的 arxi -spam,其中包含了大量本來就不需要存在的垃圾。除非做“科學”能夠鼓勵宣傳什么是有效的,而不是什么是新的,否則我不認為這種情況會改變。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136948
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Cosmos世界基礎模型如何塑造機器人未來

    在這一演進過程,世界模型逐漸成為連接高層智能與底層執(zhí)行的關鍵基礎設施。通過對環(huán)境狀態(tài)及其時間演化進行建模,世界模型使機器人系統(tǒng)能夠受控環(huán)
    的頭像 發(fā)表于 01-22 16:38 ?523次閱讀
    NVIDIA Cosmos<b class='flag-5'>世界</b>基礎模型如何塑造<b class='flag-5'>機器</b>人未來

    機器學習和深度學習需避免的 7 個常見錯誤與局限性

    ,并驗證輸出結果,就能不斷提升專業(yè)技能,養(yǎng)成優(yōu)秀數據科學家的工作習慣。需避免的機器學習和深度學習數據錯誤訓練數據驅動的人工智能模型時,我們會遇到一些常見錯誤和局
    的頭像 發(fā)表于 01-07 15:37 ?191次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b><b class='flag-5'>中</b>需避免的 7 個常見錯誤與局限性

    基于ETAS嵌入式AI工具鏈將機器學習模型部署到量產ECU

    AI汽車行業(yè)的應用日益深化,如何將機器學習領域的先進模型(如虛擬傳感器)集成到ECU軟件,已成為業(yè)界面臨的核心挑戰(zhàn)。
    的頭像 發(fā)表于 12-24 10:55 ?6106次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型部署到量產ECU

    半導體成核心變量:人形機器人成本占比將激增3倍!

    電子發(fā)燒友網報道(文/吳子鵬)AI技術與物理世界深度融合的浪潮,人形機器人正從科幻走向現實,成為新一輪科技革命的標志性產物。摩根士丹利最
    的頭像 發(fā)表于 12-05 09:48 ?1679次閱讀

    探索RISC-V機器人領域的潛力

    利用Gazebo仿真環(huán)境(x86主機上運行)和MUSE Pi Pro上的ROS 2節(jié)點進行了聯合仿真。 ? 場景: PC的Gazebo運行一個TurtleBot3機器人模型,M
    發(fā)表于 12-03 14:40

    NVIDIA神經網絡創(chuàng)新研究重塑機器人學習

    目前,機器人在受控的環(huán)境能夠有出色的表現,但在面對現實世界任務時,仍難以應對其中的不可預測性、操作靈活性和細微的交互需求,例如組裝精密組件或是以接近人類的精度操控日常物體。
    的頭像 發(fā)表于 10-21 11:07 ?1957次閱讀
    NVIDIA神經網絡創(chuàng)新研究重塑<b class='flag-5'>機器人學習</b>

    廣汽集團亮相2025世界機器人大會

    近日,2025世界機器人大會在北京盛大開幕。本屆大會以“讓機器人更智慧 讓具身體更智能”為主題,由中國電子學會、世界機器人合作組織聯合主辦。
    的頭像 發(fā)表于 08-14 16:23 ?1762次閱讀

    漢威科技亮相2025世界機器人大會

    近日,全球220+機器人企業(yè)齊聚北京北人亦創(chuàng)國際會展中心,2025世界機器人大會正式啟幕。這是今年機器人領域最盛大的世界級展會,由中國電子學
    的頭像 發(fā)表于 08-12 11:44 ?2488次閱讀

    看點:微軟CEO公開信透露的“殘酷真相” 蘋果首次中國關停直營店 世界智能網聯汽車大會10月在京召開

    給大家?guī)硪恍┬袠I(yè)資訊: 微軟CEO公開信透露的“殘酷真相” 微軟CEO納德拉(Satya Nadella)一封內部公開信中提及"忘卻舊知識"和"學習新技能",還透露出一個“殘酷真相
    的頭像 發(fā)表于 07-29 11:57 ?509次閱讀

    NVIDIA展示機器人領域的研究成果

    今年的機器人科學與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機器人學習的研究成果,展示了仿真、現實
    的頭像 發(fā)表于 07-23 10:43 ?1418次閱讀

    FPGA機器學習的具體應用

    ,越來越多地被應用于機器學習任務。本文將探討 FPGA 機器學習
    的頭像 發(fā)表于 07-16 15:34 ?2890次閱讀

    機器人測試:從虛擬到現實,機器人如何才能變成真正的打工牛馬?

    從虛擬世界的算法優(yōu)化,到現實的 “抗造” 考驗,再到細節(jié)處的容錯能力,機器人的每一輪測試,本質上都是模仿人類 “打工人” 的成長路徑:先
    的頭像 發(fā)表于 07-11 09:16 ?1741次閱讀
    <b class='flag-5'>機器</b>人測試:從虛擬到<b class='flag-5'>現實</b>,<b class='flag-5'>機器</b>人如何才能變成真正的打工牛馬?

    使用英偉達 NVIDIA Air 服務將仿真與現實世界連接

    優(yōu)勢之一是能夠將您的仿真與現實世界連接起來。通過啟用外部連接,可以您的環(huán)境顯著增強其功能、性能和靈活性。通過集成云資源、API、第三方數據、協作工具或高級
    的頭像 發(fā)表于 07-07 19:41 ?1220次閱讀
    使用英偉達 NVIDIA Air 服務將仿真與<b class='flag-5'>現實</b><b class='flag-5'>世界</b>連接

    樹莓派“復活”我的世界爬行者,現實版“噩夢”機器人誕生!

    樹莓派與《我的世界》淵源已久。無論你是用樹莓派運行服務器,還是玩《我的世界》樹莓派版,這兩者多年來一直保持著友好的關系。然而今天,我們有一個由創(chuàng)客兼開發(fā)者EfrenLopez打造的項目,為這段經典
    的頭像 發(fā)表于 05-07 17:31 ?672次閱讀
    樹莓派“復活”我的<b class='flag-5'>世界</b>爬行者,<b class='flag-5'>現實</b>版“噩夢”<b class='flag-5'>機器</b>人誕生!

    碳化硅何以英飛凌?—— SiC MOSFET性能評價的真相

    碳化硅(SiC)技術的應用,許多工程師對SiC的性能評價存在誤解,尤其是關于“單位面積導通電阻(Rsp)”和“高溫漂移”的問題。作為“碳化硅何以英飛凌”的系列文章,本文將繼續(xù)為您揭開這些誤區(qū)
    的頭像 發(fā)表于 04-30 18:21 ?945次閱讀
    碳化硅何以英飛凌?—— SiC MOSFET性能評價的<b class='flag-5'>真相</b>