91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中賦予了什么數(shù)學(xué)意義

姚小熊27 ? 來(lái)源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-10-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)中的用于聲稱(chēng)性能的指標(biāo)標(biāo)準(zhǔn)很少被討論。由于在這個(gè)問(wèn)題上似乎沒(méi)有一個(gè)明確的、廣泛的共識(shí),因此我認(rèn)為提供我一直在倡導(dǎo)并盡可能遵循的標(biāo)準(zhǔn)可能會(huì)很有趣。它源于這個(gè)簡(jiǎn)單的前提,這是我的科學(xué)老師從中學(xué)開(kāi)始就灌輸給我的:

科學(xué)報(bào)告的一般規(guī)則是,您寫(xiě)下的每個(gè)數(shù)字都應(yīng)為“真”的,因?yàn)椤罢妗钡亩x是什么。

讓我們來(lái)研究一下這對(duì)測(cè)試性能等統(tǒng)計(jì)量意味著什么。當(dāng)你在科學(xué)出版物中寫(xiě)下以下陳述時(shí):

測(cè)試準(zhǔn)確率為52.34%。你所表達(dá)的是,據(jù)你所知,你的模型在從測(cè)試分布中提取的未見(jiàn)數(shù)據(jù)上成功的概率在0.52335和0.52345之間。

這是一個(gè)非常強(qiáng)有力的聲明。

考慮你的測(cè)試集是從正確的測(cè)試分布中抽取的N個(gè)樣本IID組成的。成功率可以表示為一個(gè)二項(xiàng)式變量,其平均概率p由樣本平均值估計(jì):p?s/N

其標(biāo)準(zhǔn)差為:σ=√p(1-p)。

其中當(dāng)p=0.5時(shí),其上限為0.5。

在正態(tài)近似下,估計(jì)量的標(biāo)準(zhǔn)差為:δ=σ/√N(yùn)。

這個(gè)精度估計(jì)上的誤差δ是這樣的,在最壞的情況下,有約50%的精度:

換句話說(shuō),為了保證上述報(bào)告中例子52.34%的準(zhǔn)確率,你的測(cè)試集的大小至少應(yīng)該在30M樣本的數(shù)量級(jí)上!這種粗略的分析很容易轉(zhuǎn)化為除了準(zhǔn)確率以外的任何可計(jì)算的數(shù)量,盡管不能轉(zhuǎn)化為像似然率或困惑度這樣的連續(xù)數(shù)字。

下面是一些常見(jiàn)的機(jī)器學(xué)習(xí)數(shù)據(jù)集的說(shuō)明。

在ImageNet上可以合理地報(bào)告多少位數(shù)的精度?準(zhǔn)確率在80%左右,測(cè)試集是15萬(wàn)張圖片:

√(0.8*0.2/150000)=0.103%

這意味著你幾乎可以報(bào)告XX.X%的數(shù)字,而實(shí)際上每個(gè)人都是這樣做的。

MNIST呢,準(zhǔn)確率在99%:

√(0.99*0.01/10000)=0.099%

噗,也報(bào)個(gè)XX.X%就OK了!

然而,最值得注意的是,在大多數(shù)情況下,性能數(shù)據(jù)并不是單獨(dú)呈現(xiàn)的,而是用來(lái)比較同一測(cè)試集上的多種方法。在這種情況下,實(shí)驗(yàn)之間的抽樣方差會(huì)被抵消,即使在樣本量較小的情況下,它們之間的準(zhǔn)確度差異也可能在統(tǒng)計(jì)學(xué)上很顯著。估計(jì)圖方差的一個(gè)簡(jiǎn)單方法是執(zhí)行bootstrap重采樣。更嚴(yán)格、通常更嚴(yán)格的檢驗(yàn)包括進(jìn)行配對(duì)差異檢驗(yàn)或更普遍的方差分析。

報(bào)告超出其內(nèi)在精度的數(shù)字可能很具有極大的吸引力,因?yàn)樵谂c基線進(jìn)行比較的情況下,或者當(dāng)人們認(rèn)為測(cè)試集是一成不變的情況下,同時(shí)也不是從測(cè)試分布中抽取的樣本時(shí),性能數(shù)字往往更加重要。當(dāng)在生產(chǎn)中部署模型時(shí),這種做法會(huì)讓人感到驚訝,并且固定的測(cè)試集假設(shè)突然消失了,還有一些無(wú)關(guān)緊要的改進(jìn)。更普遍的是,這種做法會(huì)直接導(dǎo)致對(duì)測(cè)試集進(jìn)行過(guò)擬合。

那么,在我們的領(lǐng)域中數(shù)字為“真”意味著什么?好吧,這確實(shí)很復(fù)雜。對(duì)于工程師而言,很容易辯稱(chēng)不應(yīng)該報(bào)告的尺寸超出公差?;蛘邔?duì)于物理學(xué)家來(lái)說(shuō),物理量不應(yīng)超過(guò)測(cè)量誤差。對(duì)于機(jī)器學(xué)習(xí)從業(yè)者,我們不僅要應(yīng)對(duì)測(cè)試集的采樣不確定性,而且還要應(yīng)對(duì)獨(dú)立訓(xùn)練運(yùn)行,訓(xùn)練數(shù)據(jù)的不同初始化和改組下的模型不確定性。

按照這個(gè)標(biāo)準(zhǔn),在機(jī)器學(xué)習(xí)中很難確定哪些數(shù)字是“真”的。解決辦法當(dāng)然是盡可能地報(bào)告其置信區(qū)間。置信區(qū)間是一種更精細(xì)的報(bào)告不確定性的方式,可以考慮到所有隨機(jī)性的來(lái)源,以及除簡(jiǎn)單方差之外的顯著性檢驗(yàn)。它們的存在也向你的讀者發(fā)出信號(hào),表明你已經(jīng)考慮過(guò)你所報(bào)告的內(nèi)容的意義,而不僅僅是你的代碼所得到的數(shù)字。用置信區(qū)間表示的數(shù)字可能會(huì)被報(bào)告得超出其名義上的精度,不過(guò)要注意的是,你現(xiàn)在必須考慮用多少位數(shù)來(lái)報(bào)告不確定性,正如這篇博文所解釋的那樣。一路走來(lái)都是烏龜。

數(shù)字少了,雜亂無(wú)章的東西就少了,科學(xué)性就強(qiáng)了。

避免報(bào)告超出統(tǒng)計(jì)學(xué)意義的數(shù)字結(jié)果,除非你為它們提供一個(gè)明確的置信區(qū)間。這理所當(dāng)然地被認(rèn)為是科學(xué)上的不良行為,尤其是在沒(méi)有進(jìn)行配對(duì)顯著性測(cè)試的情況下,用來(lái)論證一個(gè)數(shù)字比另一個(gè)數(shù)字好的時(shí)候。僅憑這一點(diǎn)就經(jīng)常有論文被拒絕。一個(gè)良好的習(xí)慣是對(duì)報(bào)告中帶有大量數(shù)字的準(zhǔn)確率數(shù)字始終持懷疑態(tài)度。還記得3000萬(wàn)、30萬(wàn)和30萬(wàn)的經(jīng)驗(yàn)法則對(duì)最壞情況下作為“嗅覺(jué)測(cè)試”的統(tǒng)計(jì)顯著性所需樣本數(shù)量的限制嗎?它會(huì)讓你避免追逐統(tǒng)計(jì)上的“幽靈”。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與
    的頭像 發(fā)表于 02-04 14:44 ?525次閱讀

    賦予機(jī)器人靈動(dòng)雙眸:匠芯創(chuàng)D13x系列芯片在AI陪伴機(jī)器人中的創(chuàng)新應(yīng)用

    在人工智能浪潮席卷全球的今天,AI陪伴機(jī)器人正從科幻概念加速走入現(xiàn)實(shí)生活。無(wú)論是家庭的智能玩伴、養(yǎng)老機(jī)構(gòu)的情感陪護(hù)助手,還是教育場(chǎng)景的智能導(dǎo)師,機(jī)器人不再僅僅是執(zhí)行指令的工具,而是被賦予
    的頭像 發(fā)表于 02-02 19:30 ?839次閱讀
    <b class='flag-5'>賦予</b><b class='flag-5'>機(jī)器</b>人靈動(dòng)雙眸:匠芯創(chuàng)D13x系列芯片在AI陪伴<b class='flag-5'>機(jī)器</b>人中的創(chuàng)新應(yīng)用

    避繁就簡(jiǎn)!商湯日日新大模型靈性巧解數(shù)學(xué)難題,獲贊“機(jī)器的審美”

    、字節(jié)跳動(dòng),讓數(shù)學(xué)與AI同臺(tái)碰撞,開(kāi)展一場(chǎng)真刀真槍的“圖靈測(cè)試”。 現(xiàn)場(chǎng),面對(duì)數(shù)學(xué)家拋出的難題,商湯科技“日日新”大模型在解答復(fù)分析計(jì)算積分、微分幾何證明等問(wèn)題中,展示驚人的進(jìn)化力
    的頭像 發(fā)表于 01-12 11:41 ?307次閱讀
    避繁就簡(jiǎn)!商湯日日新大模型靈性巧解<b class='flag-5'>數(shù)學(xué)</b>難題,獲贊“<b class='flag-5'>機(jī)器</b>的審美”

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?223次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>中</b>需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    學(xué)習(xí)RTOS的意義

    對(duì)于嵌入式軟件工程師,學(xué)習(xí)RTOS非常有必要。 1. 項(xiàng)目需要 隨著產(chǎn)品要實(shí)現(xiàn)的功能越來(lái)越多,單純的裸機(jī)系統(tǒng)已經(jīng)不能完美地解決問(wèn)題,反而會(huì)使編程變得更加復(fù)雜,如果想降低編程的難度,就必須引入
    發(fā)表于 11-27 08:16

    CRC校驗(yàn)的本質(zhì)和物理意義

    工業(yè)控制系統(tǒng),Modbus RTU協(xié)議的CRC校驗(yàn)如同通信網(wǎng)絡(luò)的\"免疫系統(tǒng)\",某石化廠DCS系統(tǒng)曾因CRC計(jì)算錯(cuò)誤導(dǎo)致0.3%的數(shù)據(jù)包丟失,引發(fā)連鎖控制故障。 一、CRC
    發(fā)表于 11-13 07:58

    奧比光助力開(kāi)源人形機(jī)器人Reachy 2能力升級(jí)

    在法國(guó)Pollen Robotics的實(shí)驗(yàn)室里,今年4月發(fā)布的人形機(jī)器人Reachy 2正在完成一項(xiàng)頗具挑戰(zhàn)的任務(wù):根據(jù)食譜精準(zhǔn)分揀水果和蔬菜。Reachy 2能區(qū)分新鮮蘋(píng)果和枯萎生菜,靠的不是編程,而是奧比光Gemini 336雙目3D相機(jī)所
    的頭像 發(fā)表于 11-05 15:53 ?576次閱讀

    量子機(jī)器學(xué)習(xí)入門(mén):三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類(lèi)別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過(guò)程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機(jī)器
    的頭像 發(fā)表于 09-15 10:27 ?793次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    綠葉學(xué)子北京昱櫟研學(xué)行:以交流為翼,讓學(xué)習(xí)領(lǐng)航未來(lái)

    近日,新鄉(xiāng)市綠葉學(xué)子們?cè)诒本╆艡导夹g(shù)有限公司(以下簡(jiǎn)稱(chēng)“昱櫟技術(shù)”)開(kāi)啟一場(chǎng)意義深遠(yuǎn)的研學(xué)之旅。這場(chǎng)旅程不僅是一次企業(yè)探訪,更是一場(chǎng)思想的盛宴,讓學(xué)子們?cè)诮涣?b class='flag-5'>中收獲滿滿,對(duì)學(xué)習(xí)、成長(zhǎng)
    的頭像 發(fā)表于 08-06 16:17 ?867次閱讀
    綠葉學(xué)子北京昱櫟研學(xué)行:以交流為翼,讓<b class='flag-5'>學(xué)習(xí)</b>領(lǐng)航未來(lái)

    FPGA在機(jī)器學(xué)習(xí)的具體應(yīng)用

    ,越來(lái)越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)。本文將探討 FPGA 在機(jī)器學(xué)習(xí)的應(yīng)用,特別是在加速神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-16 15:34 ?2927次閱讀

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    人部署,詳細(xì)介紹基于顏色閾值和深度學(xué)習(xí)的巡線方法。 二維碼識(shí)別則廣泛應(yīng)用于機(jī)器人定位與任務(wù)觸發(fā),例如AGV(自動(dòng)導(dǎo)引車(chē))的路徑規(guī)劃。 深度學(xué)習(xí)
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    這一部分內(nèi)容,我掌握了如何在ROS 2實(shí)現(xiàn)SLAM,這對(duì)于提高機(jī)器人的自主導(dǎo)航能力具有重要意義。 其他內(nèi)容概述 除了二維碼識(shí)別和SLAM技術(shù),書(shū)中還介紹其他視覺(jué)應(yīng)用和地圖構(gòu)建的內(nèi)
    發(fā)表于 04-27 11:42

    LD Gen2 Lite激光雷達(dá):賦予機(jī)器人 “感知力” 的關(guān)鍵

    機(jī)器人的感知世界里,激光雷達(dá)宛如一雙敏銳的“慧眼”,賦予機(jī)器人“看”清周?chē)h(huán)境、自主決策的能力。亮道智能最新推出的純固態(tài)Flash短距激光雷達(dá)LD Gen2 Lite,憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),在
    的頭像 發(fā)表于 04-25 10:42 ?756次閱讀

    嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過(guò)程中使用合適的特征變換對(duì)深度學(xué)習(xí)意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用深度學(xué)習(xí)
    的頭像 發(fā)表于 04-02 18:21 ?1536次閱讀

    工業(yè)機(jī)器人工作站的建設(shè)意義

    生產(chǎn)流程,減少生產(chǎn)環(huán)節(jié)的浪費(fèi)和延誤,進(jìn)一步提升生產(chǎn)效率。上海桐爾提供的解決方案能夠幫助企業(yè)實(shí)現(xiàn)高效、穩(wěn)定的生產(chǎn)模式,提升市場(chǎng)競(jìng)爭(zhēng)力。 其次,工業(yè)機(jī)器人工作站的建設(shè)有助于改善作業(yè)環(huán)境,降低操作難度。通過(guò)
    發(fā)表于 03-17 14:49