91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Nature高光論文被質(zhì)疑存在重大缺陷

DPVg_AI_era ? 來源:lq ? 2019-06-29 07:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一篇一年前的Nature論文近日在Reddit上引發(fā)熱議,一位數(shù)據(jù)科學家認為這篇預測地震余震的論文在數(shù)據(jù)處理方法上存在重大缺陷,導致實驗結(jié)果虛高,他向Nature去信反映意見,后者承認問題存在,但認為沒有必要修正,而論文作者則態(tài)度強硬,不承認論文有問題。有人整理了事件的來龍去脈,引發(fā)熱烈討論。

近日,一篇一年前發(fā)表在《Nature》上的一篇關于使用深度學習技術預測大地震余震的文章在Reddit上引發(fā)熱議。

事情的起源是,一位名叫Rajiv Shah數(shù)據(jù)科學家認為,這篇由哈佛大學和谷歌聯(lián)合發(fā)表的論文在訓練數(shù)據(jù)集和測試數(shù)據(jù)集劃分和選擇上存在重大缺陷,造成了“目標泄露”,導致預測性能結(jié)果偏高。這實際上使整個實驗結(jié)果不再有效。

于是他聯(lián)系了《Nature》表達了自己的對這篇文章的不同意見,然而Nature方面盡管承認他的意見有合理之處,論文在模型和算法設計上存在缺陷,但拒絕對此進行修正。兩位論文作者也給出回復意見,否認了Rajiv Shah的全部意見。

一年前舊賬重提:一篇Nature論文缺陷引發(fā)的爭議

于是,近日Rajiv Shah在Medium上發(fā)文,將此事的整個過程講述了一遍,并堅持自己的觀點。隨文附上了Nature論文、自己與Nature方面的通信往來,以及作者的回復意見等。熱心網(wǎng)友將此文轉(zhuǎn)到Reddit上,引發(fā)熱烈討論:

來看看當事人Rajiv Shah在Medium上的博客文章對于此事的梳理:(Medium原文編譯)

人工智能,機器學習,預測建模和數(shù)據(jù)科學的研究在過去幾年中發(fā)展迅速。隨著人工智能研究和相關產(chǎn)業(yè)的持續(xù)增長,新一代的機器學習增強、自動化和GUI工具的誕生讓越來越多的人構(gòu)建預測模型。

但這樣問題就來了:雖然使用預測建模工具變得更容易,但預測建模知識還不夠普及,如果不小心,就很容易導致錯誤的結(jié)論。

不良方法會導致不準確的結(jié)果

大概一年前,我在《自然》上讀到一篇文章,聲稱通過深度學習預測地震的余震達到了前所未有的準確性。但讀過之后,我對他們的聲稱的結(jié)果產(chǎn)生了深深的懷疑。他們的方法的建模過程完全不夠仔細,導致結(jié)果不再可信。

與此同時,這篇論文引發(fā)了廣泛關注和認可。甚至在Tensorflow的官方說明中也提到了這篇文章,作為深度學習應用的例子。我發(fā)現(xiàn)這篇論文存在重大缺陷。論文中出現(xiàn)的數(shù)據(jù)泄漏問題會導致文中得出的準確度得分偏高,而且預測方法在模型選擇上也不夠關注(如果更簡單的模型可以達到同樣的準確度,就不必構(gòu)建6層神經(jīng)網(wǎng)絡了)。

回到我之前的觀點:論文中使用的方法很精巧,但在基本預測建模上的錯誤可能會使實驗的整個結(jié)果無效。數(shù)據(jù)科學家應該在工作中及時發(fā)現(xiàn)并避免這些問題。我認為本文作者們完全忽略了這一點,所以我聯(lián)系了作者,希望能改進文中的分析流程。雖然我們之前溝通過,但關于這篇文章的疑問,她沒有回復我的郵件。

Nature回復:承認瑕疵,拒絕修正,論文作者表示沒毛病

那么,我該怎么辦?我的同事建議我發(fā)個Twitter就算了,但我認為應該大力提倡良好的建模習慣和理念。所以在接下來的6個月里,我一直在記錄自己的結(jié)果,并與Nature方面進行了分享。

今年1月,我收到了Nature的一份回復說明,認為盡管關于數(shù)據(jù)泄漏和模型選擇的嚴重問題使文中的實驗結(jié)果不夠可靠,但他們認為沒有必要糾正,因為Devries等人主要關注的是將機器學習作為一種工具來獲得對自然世界的洞察力,重點不是算法設計的細節(jié)。而此文的作者則做出了措辭更為嚴厲的回應。

我感到很失望。這是一篇重磅論文(畢竟發(fā)在Nature上啊),盡管文中的方法有缺陷,但它還是發(fā)表了,推動了對人工智能的又一波追捧。

本周,兩位從事地震分析的數(shù)據(jù)科學家Arnaud Mignan和Marco Broccardo也撰文指出了在Nature那篇余震預測文章中發(fā)現(xiàn)了缺陷。我也把我自己的分析和可重現(xiàn)的代碼放在了github上。

我想說清楚一點:我不是故意和Nature那篇論文的作者人品有問題。我不認為她們是有意為之,她們的目標只是展示如何將機器學習技術應用于余震預測。文章作者之一Devries是一位多才多藝的地震科學家,希望將最新的方法用于她的研究領域,并從中找到亮眼的結(jié)果。

但問題在于:這些觀點和結(jié)果是基于有根本缺陷的方法得出的。僅僅說“這不是機器學習論文,而是地震論文”是解釋不了的。一旦使用了預測模型,那么預測結(jié)果的質(zhì)量就取決于建模質(zhì)量,取得的成果就屬于數(shù)據(jù)科學的成果,數(shù)據(jù)科學的結(jié)果必須嚴謹。

期刊方面歷來對刊登對關于最新技術和方法的論文興趣極高,但是,如果我們允許有基本問題的論文或項目取得進展,就會傷害我們所有人,對預測建模領域造成破壞。

Nature論文介紹:深度學習預測余震效果拔群

實際上,新智元在此前的報道中曾對Nature這篇文章進行過簡要介紹:

谷歌和哈佛大學在Nature雜志發(fā)表的一篇論文中,研究人員展示了如何用深度學習預測余震位置,而且預測結(jié)果比現(xiàn)有模型更可靠。

他們訓練了一個神經(jīng)網(wǎng)絡,在一個包含131000多個“主震-余震”事件的數(shù)據(jù)庫中尋找模式,然后在一個包含30000對類似事件的數(shù)據(jù)庫中測試其預測。

“主震-余震”事件的一個樣本

深度學習網(wǎng)絡比最有用的現(xiàn)有模型(稱為“庫侖破裂應力變化”)更可靠。在從0到1的精度范圍內(nèi)——1是完全準確的模型,0.5是一半準確的模型——現(xiàn)有庫侖模型得分為0.583,而新的AI系統(tǒng)達到0.849。

“關于地震,你需要知道三件事情,”研究人員說:“它們什么時候發(fā)生、它們會有多強烈、它們會發(fā)生在哪里。在這項工作之前,我們有經(jīng)驗定律來解釋它們發(fā)生的時間和規(guī)模,現(xiàn)在我們正在研究它們可能發(fā)生在哪?!?/p>

人工智能在這一領域的成功歸功于該技術的核心優(yōu)勢之一:它能夠發(fā)現(xiàn)復雜數(shù)據(jù)集中以前被忽視的模式。這在地震學中尤為重要,因為在地震學中看到數(shù)據(jù)中的關聯(lián)性非常困難。地震事件涉及太多變量,從不同區(qū)域的地面構(gòu)成到地震板塊之間的相互作用類型,以及能量在地震波中穿過地球傳播的方式。理解這一切是非常困難的。

研究人員表示,他們的深度學習模型能夠通過考量一個被稱為“米塞斯屈服準則”(von Mises yield criterion)的因素來做出預測,這是一種用于預測材料何時開始在壓力下破裂的復雜計算。研究人員表示,這個因素常用于冶金等領域,“但在地震科學中從未流行過?!爆F(xiàn)在,隨著這一新模型的發(fā)現(xiàn),地質(zhì)學家可以研究其關聯(lián)性。

盡管這項研究取得了成功,但它還遠未準備好在現(xiàn)實世界中應用。首先,AI模型只關注由地面永久性變化引起的余震,稱為靜態(tài)應力。但后續(xù)地震也可能是由于后來發(fā)生的地面隆隆聲造成的,稱為動態(tài)壓力?,F(xiàn)有模型也太慢而無法實時工作。這很重要,因為大多數(shù)余震發(fā)生在地震發(fā)生后的第一天,然后每過一天頻率大致減半。

Rajiv的意見:訓練方法缺陷導致“目標泄露”,實驗結(jié)果虛高

在Rajiv致Nature的信中,指出這篇文章中存在“重大方法性錯誤”,使得文章結(jié)論不再嚴謹可靠。Rajiv主要提出了三點意見,以第一點為主。

第一,文中對模型訓練和測試數(shù)據(jù)運用存在缺陷,出現(xiàn)了“目標泄露”(Target Leakage),論文中公布的預測精度實際上是偏高的結(jié)果(AUC=0.849)。論文中使用地震中部分數(shù)據(jù)來訓練模型,然后再次使用這些數(shù)據(jù)來測試模型。這種目標泄露會導致機器學習中的結(jié)果偏高,而實際效果并沒有這么好。為了避免這一錯誤,需要使用“分組分區(qū)”的方法,保證地震數(shù)據(jù)只會出現(xiàn)在訓練部分或測試部分其中之一,而本文沒有這樣做。

第二個問題是沒有使用學習曲線。

第三是上來就使用深度學習模型,而沒有考慮邏輯回歸、隨機森林等基線方法。這可能會給讀者造成誤導,認為只有深度學習才能對余震預測任務取得良好效果,實際上并非如此,許多其他方法(如SVM、GAM)都可以獲得與文中模型基本相當?shù)男阅堋?/p>

在Nature的回復中,實際上在一定程度上承認了Rajiv意見的合理性,但拒絕對此進行糾正。

Nature方面的態(tài)度是:

盡管關于數(shù)據(jù)泄漏和模型選擇的問題使文中的實驗結(jié)果不夠可靠,但沒有必要糾正,因為本文作者Devries等人主要關注的是將機器學習作為一種工具來獲得對自然世界的洞察力,算法設計的細節(jié)不是重點。

而論文作者方面給出的回復意見對這三點均予以反駁,二位作者表示:

1、Rajiv關于“數(shù)據(jù)泄露”使得模型性能虛高的說法在科學背景下不具備合理性。對地震數(shù)據(jù)訓練集和測試集的分組符合機器學習的基本方法。

2、本文使用神經(jīng)網(wǎng)絡作為工具,為了獲得關于余震的一些模式信息,并沒有表示其他機器學習方法無用的意思。

3、整個文章的主旨就是神經(jīng)網(wǎng)絡能夠成功學習簡單的模式。

二位作者還在回復意見的最后部分表示,Rajiv的評論沒有任何科學背景。我們是地震科學家,我們的目標是利用機器學習獲得關于余震位置模式的信息,完成這個目標的是我們,而不是Rajiv的這些評論。如果Nature選擇公開這些評論,我們會感到很失望。

網(wǎng)友熱議:Nature承認有問題就該改,作者態(tài)度令人堪憂

Nature上的文章從來不缺少關注,尤其是出現(xiàn)重大爭議的文章。雖然是一筆一年前的老賬,但來龍去脈還很清楚,毫無懸念地成為Reddit上頭號熱帖。

從回復的熱門帖子看,很多網(wǎng)友認為Rajiv的批評意見值得充分討論,而Nature在承認論文中的算法存在一定問題的情況下仍然拒絕修改,沒有盡到應盡的責任。至于二位作者的回復,一方面缺乏面對反對意見時的風度,而且對某些重要概念(比如數(shù)據(jù)泄露)的理解存在問題。

下面簡單摘選幾個:

1、我覺得論文作者的回復比批評意見本身更為“居高臨下”啊。意見中提到使用更簡單的方法也能得到基本相同的結(jié)果,這說明進行一些模型簡化測試很有必要。尤其是作者回復的最后一段,簡直是在說:我們是地震科學家,敢問您是哪位?。咳缓筮€跟Nature講,如果你公布了這些評論意見,我們會“很失望”的。作者憑什么這么說?為什么這些評論意見不該公布?難倒公布了不正能引發(fā)更多良性的科學討論嗎?而且評論中的意見也不是孤例,其他文章中也有提到這個問題。如果我是這篇文章的會議審稿人,我也會有類似的疑問,至少我會要求作者作一些模型簡化測試。

2、我讀了論文作者(Phoebe DeVrias和Brendan Meade)對Nature編輯的回應。雖然我不知道這些評論的背景,但可以肯定地說,她們面對批評意見表現(xiàn)得非常不成熟。

3、“我們承認在訓練和測試集中都使用了來自同一地震的數(shù)據(jù),但這并不重要,因為我們是聰明的地震科學家?!编?,很好很強大。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265436
  • 論文
    +關注

    關注

    1

    文章

    103

    瀏覽量

    15415
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26201

原文標題:Reddit熱議:Nature預測余震論文被疑存重大缺陷,論文作者回懟

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國產(chǎn)芯片大突破,算力超百倍,繞開EUV

    已經(jīng)發(fā)表于國際頂級學術期刊《科學》(Science),并被選為論文重點報道。 ? 這是國際上首次實現(xiàn)大規(guī)模全生成式AI芯片,標志著
    的頭像 發(fā)表于 12-23 09:35 ?5284次閱讀

    Nature Sensors》創(chuàng)刊第三篇論文,中國青年學者發(fā)表,遠程測心率更準了!

    不怕變!這項“鎖相”成像技術,讓遠程測心率和血氧更準了 遠程、非接觸式生命體征監(jiān)測,認為是未來智慧醫(yī)療、居家健康管理和車載安全系統(tǒng)的重要技術基礎。相比傳統(tǒng)可穿戴設備,基于光學成像的生理信號檢測
    的頭像 發(fā)表于 01-16 18:11 ?588次閱讀
    《<b class='flag-5'>Nature</b> Sensors》創(chuàng)刊第三篇<b class='flag-5'>論文</b>,中國青年學者發(fā)表,遠程測心率更準了!

    華中科大在超快場診斷研究取得新進展

    三維時空場矢量特性的診斷裝置。 近日,華中科技大學電氣學院博士生胡耀丹以第一作者在國際期刊Nature Communications上發(fā)表論文“結(jié)構(gòu)場的
    的頭像 發(fā)表于 01-06 17:10 ?130次閱讀
    華中科大在超快<b class='flag-5'>光</b>場診斷研究取得新進展

    Nature Sensors第2篇,院士團隊突破可穿戴傳感器技術限制

    近日,在Nature旗下傳感器子刊《Nature Sensors》發(fā)表了其創(chuàng)刊第二篇論文,該論文設計可穿戴傳感器技術突破,作者為斯坦福大學鮑哲南院士團隊。 ? 在可穿戴傳感器領域,設計
    的頭像 發(fā)表于 12-17 18:26 ?4765次閱讀
    <b class='flag-5'>Nature</b> Sensors第2篇,院士團隊突破可穿戴傳感器技術限制

    晶臺耦KL3H4:耦技術在智能電表中的革新應用

    智能電表作為智能電網(wǎng)的核心設備,對信號傳輸?shù)目煽啃院涂垢蓴_能力要求極高。傳統(tǒng)電表多采用繼電器或機械隔離方式,存在易受電磁干擾、壽命短、體積大等缺陷。而光耦技術通過信號實現(xiàn)電--電的
    的頭像 發(fā)表于 12-17 15:47 ?396次閱讀
    晶臺<b class='flag-5'>光</b>耦KL3H4:<b class='flag-5'>光</b>耦技術在智能電表中的革新應用

    Nature傳感器新子刊第一篇論文出爐,中國青年學者聯(lián)手撰寫

    ? ? 近期,知名學術期刊《Nature》(《自然》)旗下專注于傳感器研究領域的子刊《Nature Sensors》,刊發(fā)了創(chuàng)刊以來的第一篇論文。 ? ? 《Nature Sensor
    的頭像 發(fā)表于 11-27 15:04 ?791次閱讀
    <b class='flag-5'>Nature</b>傳感器新子刊第一篇<b class='flag-5'>論文</b>出爐,中國青年學者聯(lián)手撰寫

    便攜式EL檢測儀:伏組件缺陷檢測的移動“透視眼”

    便攜式EL檢測儀:伏組件缺陷檢測的移動“透視眼”柏峰【BF-EL】在伏電站運維與組件質(zhì)量管控中,組件內(nèi)部缺陷(如隱裂、斷柵、虛焊、黑心片等)是影響發(fā)電效率與使用壽命的關鍵隱患。
    的頭像 發(fā)表于 10-15 10:20 ?721次閱讀
    便攜式EL檢測儀:<b class='flag-5'>光</b>伏組件<b class='flag-5'>缺陷</b>檢測的移動“透視眼”

    立案調(diào)查 美國芯片巨頭中方立案調(diào)查

    據(jù)央視新聞報道美國芯片巨頭中方立案調(diào)查,原因是通在收購以色列芯片企業(yè)Autotalks時未依法申報經(jīng)營者集中,這涉嫌違反了《中華人民共和國反壟斷法》,市場監(jiān)管總局依法對通公司
    的頭像 發(fā)表于 10-10 17:49 ?881次閱讀

    硅片濕法清洗工藝存在哪些缺陷

    硅片濕法清洗工藝雖然在半導體制造中廣泛應用,但其存在一些固有缺陷和局限性,具體如下:顆粒殘留與再沉積風險來源復雜多樣:清洗液本身可能含有雜質(zhì)或微生物污染;過濾系統(tǒng)的濾芯失效導致大顆粒物質(zhì)未被有效攔截
    的頭像 發(fā)表于 09-22 11:09 ?772次閱讀
    硅片濕法清洗工藝<b class='flag-5'>存在</b>哪些<b class='flag-5'>缺陷</b>

    便攜式EL檢測儀:伏組件缺陷檢測的 “便攜顯微鏡”

    便攜式EL檢測儀:伏組件缺陷檢測的 “便攜顯微鏡”柏峰【BF-EL】便攜式 EL(Electroluminescence,電致發(fā)光)檢測儀,是基于伏組件電致發(fā)光原理設計的便攜式檢測設備。其核心
    的頭像 發(fā)表于 09-10 17:35 ?1288次閱讀
    便攜式EL檢測儀:<b class='flag-5'>光</b>伏組件<b class='flag-5'>缺陷</b>檢測的 “便攜顯微鏡”

    智芯公司榮獲ICEPT 2025優(yōu)秀論文

    Conductivity Design Optimization and Interconnect Process Exploration”(引線鍵合平面柵格陣列系統(tǒng)級封裝可靠與導熱設計優(yōu)化及互連工藝探索)憑借導熱高可靠
    的頭像 發(fā)表于 08-26 11:22 ?1257次閱讀

    采用效 LED 燈管的電費節(jié)約量分析

    采用效LED燈管的電費節(jié)約量分析效LED燈管作為節(jié)能照明的核心產(chǎn)品,其電費節(jié)約能力與傳統(tǒng)光源相比優(yōu)勢顯著,具體節(jié)約量需結(jié)合功率差異、使用時長、電價等因素綜合計算,以下從實際場景
    的頭像 發(fā)表于 08-04 21:19 ?2401次閱讀
    采用<b class='flag-5'>高</b><b class='flag-5'>光</b>效 LED 燈管的電費節(jié)約量分析

    “結(jié)印”操作成真?Meta神經(jīng)運動接口手環(huán)登上Nature

    Nature期刊上,并詳細介紹了這種技術的實現(xiàn)方式。(https://www.nature.com/articles/s41586-025-09255-w) ? 研究團隊指出,當前的人機交互存在明顯的局限性,現(xiàn)有計算機輸入方式
    發(fā)表于 07-29 07:30 ?2162次閱讀
    “結(jié)印”操作成真?Meta神經(jīng)運動接口手環(huán)登上<b class='flag-5'>Nature</b>

    密封 CMR/高速耦合器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()密封 CMR/高速耦合器相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有密封 CMR/高速耦合器的引腳圖、接線圖、封裝手冊、中文資料、英文資料,密封
    發(fā)表于 07-08 18:33
    密封<b class='flag-5'>高</b> CMR/高速<b class='flag-5'>光</b>耦合器 skyworksinc

    鴻利智匯推出效陶瓷3535薄膜產(chǎn)品

    在追求高效節(jié)能與極致效的今天,傳統(tǒng)照明技術的局限,存在陰陽色斑、能耗過高、適配復雜等問題。為解決這些問題,鴻利智匯全新推出效陶瓷3535薄膜產(chǎn)品,以熒光薄膜黑科技顛覆傳統(tǒng)噴粉工藝
    的頭像 發(fā)表于 03-26 16:04 ?1222次閱讀
    鴻利智匯推出<b class='flag-5'>高</b><b class='flag-5'>光</b>效陶瓷3535薄膜產(chǎn)品