91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)引發(fā)對科學(xué)見解的反思簡析

中科院半導(dǎo)體所 ? 來源:悅智網(wǎng) ? 2023-03-03 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)學(xué)和物理是一對老朋友。長期以來,它們見證了技術(shù)發(fā)展的起落,包括計(jì)算尺、計(jì)算器和Wolfram Alpha等輔助工具。如今,隨著機(jī)器學(xué)習(xí)的最新進(jìn)展應(yīng)用于解決數(shù)學(xué)和物理問題,這些進(jìn)展提出了一個(gè)根本性的問題:讓算法學(xué)會我們思考方式有何意義?

為什么要這么做?

“計(jì)算機(jī)非常擅長數(shù)學(xué),指的是它們很擅長解決非常具體的問題。”谷歌研究院的機(jī)器學(xué)習(xí)專家蓋伊?古爾阿里(Guy Gur-Ari)說。計(jì)算機(jī)擅長運(yùn)算,填入數(shù)字并計(jì)算是相對簡單的。但在形式結(jié)構(gòu)之外,計(jì)算機(jī)則舉步維艱。

解決數(shù)學(xué)文字問題或“定量推理”看起來比較棘手,因?yàn)樗枰鼮榉€(wěn)健和嚴(yán)密,而解決許多其他問題也許并不需要。雖然機(jī)器學(xué)習(xí)模型接受訓(xùn)練的數(shù)據(jù)越多,產(chǎn)生的錯(cuò)誤越少,但對于定量推理,改進(jìn)的程度卻很有限。研究人員開始意識到,對于機(jī)器學(xué)習(xí)生成模型在解決語言文字問題時(shí)產(chǎn)生的錯(cuò)誤,需要更有針對性的方法。

2021年,來自加州大學(xué)伯克利分校和OpenAI的兩個(gè)不同團(tuán)隊(duì)分別發(fā)布了MATH和GSM8K兩個(gè)數(shù)據(jù)集,這兩個(gè)數(shù)據(jù)集包含了涉及幾何、代數(shù)和微積分基礎(chǔ)等的數(shù)千個(gè)數(shù)學(xué)問題?!拔覀兙褪窍胍纯?,數(shù)據(jù)集是否有問題?!痹?a target="_blank">人工智能安全中心研究MATH的研究員史蒂文?巴薩特(Steven Basart)說。用格式更好的、更大的數(shù)據(jù)集進(jìn)行訓(xùn)練,是否能夠修復(fù)機(jī)器學(xué)習(xí)定量推理的錯(cuò)誤?MATH團(tuán)隊(duì)發(fā)現(xiàn),定量推理對最高級的機(jī)器學(xué)習(xí)語言模型也頗具挑戰(zhàn),其得分不到7%。(人類研究生的得分為40%,而國際數(shù)學(xué)奧林匹克競賽冠軍的得分為90%。)

GSM8K數(shù)據(jù)集則是更簡單的小學(xué)階段問題,受訓(xùn)模型的準(zhǔn)確率達(dá)到了約20%。為了實(shí)現(xiàn)這種準(zhǔn)確率,OpenAI的研究人員使用了兩種技術(shù):精調(diào)和驗(yàn)證。在精調(diào)中,研究人員采用一個(gè)包含不相關(guān)信息的預(yù)訓(xùn)練語言模型,在訓(xùn)練中僅展示相關(guān)信息(數(shù)學(xué)問題);驗(yàn)證則允許模型重新審視其錯(cuò)誤。

當(dāng)時(shí),OpenAI預(yù)測,需要使用100倍的數(shù)據(jù)對模型進(jìn)行訓(xùn)練,才能在GSM8K上達(dá)到80%的準(zhǔn)確率。但2022年6月,谷歌的Minerva宣布,小規(guī)模擴(kuò)大訓(xùn)練即可實(shí)現(xiàn)78%的準(zhǔn)確率。OpenAI的機(jī)器學(xué)習(xí)專家卡爾·科布(Karl Cobbe)說:“這超出我們所有的預(yù)期。”巴薩特表示同意,他說:“這太令人震驚了,我還以為要花很長的時(shí)間?!?br />
Minerva使用了谷歌自己的通路語言模型(PaLM),根據(jù)來自arXiv的科學(xué)論文和其他來源進(jìn)行格式化數(shù)學(xué)精調(diào)。此外,幫助Minerva的還有另外兩個(gè)策略。在“思維鏈提示”中,要求Minerva將較大的問題分解為更容易接受的小問題。該模型還使用多數(shù)投票,而不是僅要它提供一個(gè)答案或?qū)⒁粋€(gè)問題解算100次。在這些結(jié)果中,Minerva選出最常見的答案。

這些新策略帶來了巨大的好處。Minerva在MATH上實(shí)現(xiàn)了高達(dá)50%的準(zhǔn)確率,在GSM8K上的準(zhǔn)確率接近80%。在MMLU上也是這樣,MMLU是一個(gè)包含化學(xué)和生物的STEM普通問題集。對問題略微調(diào)整后隨機(jī)取樣,讓Minerva重新進(jìn)行計(jì)算,其表現(xiàn)也很好,這表明,這個(gè)能力不僅源自記憶。

關(guān)于數(shù)學(xué),Minerva了解哪些、不了解哪些,是很模糊的。這與數(shù)學(xué)家使用的帶有內(nèi)置結(jié)構(gòu)的“證明助手”不同,Minerva和其他語言模型沒有形式結(jié)構(gòu)。它們可能會產(chǎn)生奇怪、混亂的推理,但仍然可得出正確的答案。隨著數(shù)字的增大,語言模型的準(zhǔn)確度會下降,這對于可靠的老式TI-84 Plus計(jì)算器,是絕不會發(fā)生的。

“它到底是聰明?還是不聰明?”科布問。雖然像Minerva一樣的模型也許能夠得出與人類一樣的答案,但其遵循的實(shí)際過程可能完全不相同。另一方面,曾被要求“展示自己的作業(yè)”的學(xué)生都很熟悉“思維鏈提示”。

谷歌研究院的機(jī)器學(xué)習(xí)專家伊桑?戴爾(Ethan Dyer)說:“我認(rèn)為人們有這樣一個(gè)概念,做數(shù)學(xué)的人有某種嚴(yán)格的推理系統(tǒng),在已知和未知之間有明顯的區(qū)別。”但人也可能得出不一致的答案、會犯錯(cuò)誤和未能應(yīng)用核心概念。在機(jī)器學(xué)習(xí)的這一前沿,邊界是模糊的。

像物理學(xué)家一樣思考

粒子物理的數(shù)據(jù)與眾不同。雖然已經(jīng)證實(shí)卷積神經(jīng)網(wǎng)絡(luò)(CNN)對樹木、貓和食物等日常物體圖片的分類非常高效,但它并不適合粒子碰撞。加州大學(xué)圣地亞哥分校的粒子物理學(xué)家哈維爾?杜爾特(Javier Duarte)表示,問題在于來自大型強(qiáng)子對撞機(jī)(LHC)的碰撞數(shù)據(jù)無法作為圖像。

華而不實(shí)地描述LHC碰撞可誤導(dǎo)甚至堵塞整個(gè)探測器。實(shí)際上,在數(shù)百萬個(gè)輸入中只有少量幾個(gè)輸入在記錄信號,就像白屏中有幾個(gè)黑色像素。這導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)中的圖像質(zhì)量很差,但在一個(gè)被稱為圖形神經(jīng)網(wǎng)絡(luò)(GNN)的不同新框架中,效果則很好。

除了格式奇怪以外,還有大量的數(shù)據(jù),大約為每秒約1拍字節(jié),其中只有少量高質(zhì)量數(shù)據(jù)被保存下來。為了更好地篩選數(shù)據(jù),研究人員想要訓(xùn)練更敏銳的算法。杜爾特說,要想提高效率,這種算法要具備驚人的速度,在微秒內(nèi)執(zhí)行。剪裁和量化等機(jī)器學(xué)習(xí)技術(shù)能使算法達(dá)到目標(biāo)。

借助機(jī)器學(xué)習(xí),粒子物理學(xué)家可以從不同的角度觀察數(shù)據(jù)。他們不僅關(guān)注單個(gè)事件,還學(xué)習(xí)和思考碰撞期間發(fā)生的幾十個(gè)其他事件,例如希格斯玻色子衰變?yōu)閮蓚€(gè)光子。雖然任意兩個(gè)事件之間沒有因果關(guān)系,但研究人員現(xiàn)在接受一個(gè)更全面的數(shù)據(jù)視圖,而不僅是單個(gè)事件分析得出的零碎視圖。

更引人注目的是,機(jī)器學(xué)習(xí)還迫使物理學(xué)家重新審視基本概念。麻省理工學(xué)院的理論粒子物理學(xué)家杰西?泰勒(Jesse Thaler)說:“過去,我自己對對稱性的看法不嚴(yán)密,強(qiáng)迫自己教授計(jì)算機(jī)什么是對稱,也是幫助自己理解對稱到底是什么。”對稱需要參考系,換言之,鏡子中變形的球體圖像到底是否對稱?如果不知道鏡子本身是否變形,就無法知道答案。

粒子物理學(xué)中的機(jī)器學(xué)習(xí)仍然處于早期階段,實(shí)際上,研究人員現(xiàn)在對待相關(guān)技術(shù)就像對待廚房的洗碗池。杜爾特承認(rèn):“它也許不適合粒子物理學(xué)中的每一個(gè)問題。”

在一些粒子物理學(xué)家深入研究機(jī)器學(xué)習(xí)的同時(shí),腦中浮現(xiàn)出一個(gè)令人不安的問題:他們是在研究物理學(xué)還是在研究計(jì)算機(jī)科學(xué)?往往不被視為“真正的物理學(xué)”的編程已經(jīng)存在;類似的擔(dān)憂也在困擾機(jī)器學(xué)習(xí)。有的研究人員擔(dān)心機(jī)器學(xué)習(xí)會遮掩非常復(fù)雜的情況,他們正在構(gòu)建算法,使用人類能夠理解的語言來提供反饋。而算法也許不是唯一負(fù)責(zé)溝通的主體。

泰勒說:“另一方面,我們希望機(jī)器能夠?qū)W習(xí)如何像物理學(xué)家那樣思考。我們也要多學(xué)習(xí)如何像機(jī)器那樣思考。我們需要學(xué)會講對方的語言。”







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 探測器
    +關(guān)注

    關(guān)注

    15

    文章

    2763

    瀏覽量

    75919
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107834
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7809

    瀏覽量

    93225
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136980
  • GNN
    GNN
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    6789

原文標(biāo)題:機(jī)器學(xué)習(xí)引發(fā)對科學(xué)見解的反思

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?499次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對這些錯(cuò)誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?203次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    NST1002單總線型溫度傳感器,以“極”實(shí)現(xiàn)“極致”

    前言從醫(yī)療健康到人形機(jī)器人,從工業(yè)物聯(lián)到消費(fèi)電子,精準(zhǔn)感知環(huán)境溫度,是驅(qū)動設(shè)備智慧化、決策科學(xué)化的核心變量之一。傳統(tǒng)溫度感知方案,或因響應(yīng)遲緩而錯(cuò)失關(guān)鍵數(shù)據(jù),或因精度不足而引入系統(tǒng)誤差,已成為眾多
    的頭像 發(fā)表于 12-09 11:55 ?649次閱讀
    NST1002單總線型溫度傳感器,以“極<b class='flag-5'>簡</b>”實(shí)現(xiàn)“極致”

    儀科技開源測控技術(shù)走進(jìn)西安交通大學(xué)創(chuàng)新港校區(qū)

    10月26日上午,由西安交通大學(xué)儀器科學(xué)與技術(shù)學(xué)院主辦的“C# 開源測控技術(shù)培訓(xùn)交流會”在西安交大創(chuàng)新港校區(qū)順利舉行。儀科技資深工程師王孟美受曾翔君教授邀請,與20余名儀器科學(xué)與技術(shù)專業(yè)研究生圍繞AI與模擬采集展開深入交流。
    的頭像 發(fā)表于 11-04 10:20 ?646次閱讀

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護(hù)科學(xué)

    Cat M-1 用于遙測/連接。 用于邊緣處理和機(jī)器學(xué)習(xí)的 ARMSoM 計(jì)算模塊 (CM5)。 項(xiàng)目背景 []() 通過聆聽自然界的聲音,我們可以監(jiān)測動物之間的交流方式,并獲得基本的基線數(shù)據(jù),從而
    發(fā)表于 10-27 09:18

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    和量子計(jì)算的兩項(xiàng)新興的技術(shù),將在生產(chǎn)假說方面發(fā)揮重要作用,從而改變科學(xué)發(fā)現(xiàn)的范式。 生成式AI: 2、窮舉搜索 3、分析排錯(cuò)與組合優(yōu)化 分析排錯(cuò)是生成假說的重要手段。強(qiáng)化學(xué)習(xí)也在優(yōu)化假說組合、尋找科學(xué)發(fā)現(xiàn)
    發(fā)表于 09-17 11:45

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動化)帶來的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?909次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無法正常執(zhí)行的問題?

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無法正常執(zhí)行的問題
    發(fā)表于 08-28 07:28

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器科學(xué)與系統(tǒng)會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機(jī)器人學(xué)習(xí)的研究成果,展示了在仿真、現(xiàn)實(shí)世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1427次閱讀

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2902次閱讀

    Modbus和MQTT協(xié)議

    Modbus和MQTT協(xié)議在設(shè)計(jì)目標(biāo)、通信模式、應(yīng)用場景、網(wǎng)絡(luò)結(jié)構(gòu)、數(shù)據(jù)傳輸效率、設(shè)備兼容性及安全性等方面存在顯著差異,具體分析如下: 一、設(shè)計(jì)目標(biāo)與定位 Modbus :誕生于1979年,由施耐德公司開發(fā),最初為串行通信(RS232/RS485)設(shè)計(jì)。其目標(biāo)是解決工業(yè)設(shè)備(如PLC、傳感器、儀表)之間的短距離、點(diǎn)對點(diǎn)或小范圍組網(wǎng)通信,核心是設(shè)備間直接的數(shù)據(jù)讀寫控制。Modbus屬于工業(yè)現(xiàn)場總線協(xié)議,側(cè)重底層設(shè)備的高效數(shù)據(jù)交互。 MQTT :2013年由OASIS標(biāo)準(zhǔn)化,最初
    的頭像 發(fā)表于 07-10 14:25 ?796次閱讀

    Modbus與MQTT的區(qū)別

    Modbus和MQTT是工業(yè)領(lǐng)域中兩種不同的通信協(xié)議,在設(shè)計(jì)目標(biāo)、應(yīng)用場景、通信模式等方面存在顯著差異,以下從多個(gè)維度兩者的區(qū)別: 1.設(shè)計(jì)目標(biāo)與起源 Modbus 誕生于1979年,由施耐德
    的頭像 發(fā)表于 07-10 14:10 ?1004次閱讀

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    請問STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?

    STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?
    發(fā)表于 03-13 07:34