91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能數(shù)據(jù):物聯(lián)網(wǎng)的下一個(gè)前沿

劉勇 ? 來(lái)源:阿兵888824 ? 作者:阿兵888824 ? 2022-07-21 08:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

收集數(shù)據(jù)從未像現(xiàn)在這樣容易。只需單擊幾下,您就可以啟動(dòng)并運(yùn)行,配備云必須提供的所有最佳數(shù)據(jù)技術(shù),準(zhǔn)備好囤積所有可能的數(shù)據(jù)。很難相信就在十年前,情況發(fā)生了巨大的不同。事實(shí)上,大規(guī)模收集數(shù)據(jù)只是最大的公司的一種選擇,這些組織既能負(fù)擔(dān)得起昂貴的服務(wù)器(這是存儲(chǔ)所有數(shù)據(jù)的唯一可行選擇),又能負(fù)擔(dān)得起少數(shù)能夠做到最好的工程師其中,在數(shù)據(jù)科學(xué)只是一個(gè)新興領(lǐng)域的時(shí)代。

如今,幸運(yùn)的是,生成數(shù)據(jù)不再只是一項(xiàng)企業(yè)運(yùn)動(dòng)。事實(shí)上,多虧了物聯(lián)網(wǎng) (IoT),無(wú)論好壞,我們現(xiàn)在都變成了小型大數(shù)據(jù)工廠。到 2020 年,一個(gè)人將負(fù)責(zé)每秒生成 1.7 MB 的數(shù)據(jù)。即使是現(xiàn)在,僅一輛自動(dòng)駕駛汽車每天就會(huì)產(chǎn)生 11TB 的數(shù)據(jù)。而且這種趨勢(shì)沒(méi)有減弱的跡象。相反:它只會(huì)增長(zhǎng)。

對(duì)于所有數(shù)據(jù)愛(ài)好者來(lái)說(shuō),這顯然是個(gè)好消息。不久前,收集高質(zhì)量的數(shù)據(jù)集是一項(xiàng)繁重而艱巨的任務(wù)。盡管如此,我們總是想要更多。如果您的全新深度學(xué)習(xí)模型似乎“僅”達(dá)到 92% 的準(zhǔn)確率,那么最簡(jiǎn)單、最容易找到的借口就是指責(zé)數(shù)據(jù)?!拔业臄?shù)據(jù)集不夠大”,我們漫不經(jīng)心地告訴我們的老板?!暗绻覀?cè)俚葞讉€(gè)星期,這個(gè)模型將是你見(jiàn)過(guò)的最好的模型!”

這似乎提出了一個(gè)重要問(wèn)題:實(shí)際上有多少數(shù)據(jù)才足夠?但它實(shí)際上提出了一個(gè)更重要的問(wèn)題:多少數(shù)據(jù)太多了?

有趣的是,我們?cè)?a href="http://m.makelele.cn/v/tag/557/" target="_blank">機(jī)器學(xué)習(xí)圈中并不經(jīng)常聽(tīng)到這個(gè)問(wèn)題,即使我們真的應(yīng)該聽(tīng)到。雖然大數(shù)據(jù)是一個(gè)巨大的機(jī)會(huì),但它也是一個(gè)巨大的 40 zettabyte 責(zé)任。如果數(shù)據(jù)確實(shí)是新的石油,我們需要把類比推到極限:數(shù)據(jù)是一種極其有利可圖的資源,但也像石油一樣,需要提煉。未能克制自己不受控制的使用使我們處于危險(xiǎn)之中。簡(jiǎn)而言之,我們今天使用和考慮數(shù)據(jù)的方式是非常不可持續(xù)的,這一事實(shí)仍然幾乎沒(méi)有達(dá)到集體意識(shí)。

也許,只是也許,這是錯(cuò)誤的對(duì)話。也許大數(shù)據(jù)畢竟不是人工智能的真正答案。

讓我們退后一步,想想我們真正收集的是什么。回到數(shù)字化的早期,數(shù)據(jù)收集確實(shí)成本更高,所以我們選擇了我們的位置。我們更負(fù)責(zé)任,更認(rèn)真。隨著生成和收集數(shù)據(jù)變得越來(lái)越容易,對(duì)質(zhì)量的關(guān)注越來(lái)越少,而數(shù)量成為云存儲(chǔ)、云計(jì)算、GPU 機(jī)器、大規(guī)模數(shù)據(jù)管理和傳輸系統(tǒng)等新技術(shù)的自然副產(chǎn)品。很快,數(shù)據(jù)變成了一種商品,但隨著數(shù)據(jù)和數(shù)據(jù)存儲(chǔ)的不斷升級(jí),沒(méi)有人提出一個(gè)簡(jiǎn)單的問(wèn)題:我們?yōu)槭裁匆占@些?它甚至有意義嗎?

隨著模型構(gòu)建的商品化,數(shù)據(jù)護(hù)城河似乎是人工智能差異化的明顯答案,但我們都錯(cuò)過(guò)了大局嗎?數(shù)據(jù)時(shí)代。它變得陳舊。最終,即使我們被誘使相信數(shù)據(jù)和信息是兩個(gè)截然不同的事物,但并非所有數(shù)據(jù)都是 平等的。畢竟,一個(gè)十幾歲的少年在發(fā)到 Instagram 之前自拍了 20 張自己的照片,這肯定與可搜索的醫(yī)學(xué)文獻(xiàn)目錄不同。

只要我們堅(jiān)信硬件的進(jìn)步將使我們免受數(shù)據(jù)災(zāi)難的影響,這一切似乎都不是問(wèn)題。數(shù)據(jù)存儲(chǔ)越來(lái)越便宜,計(jì)算能力也越來(lái)越容易獲得。只有當(dāng)數(shù)據(jù)的生成被工程師跟上摩爾定律的能力所抵消時(shí),這才是真的。即使他們可以無(wú)限期地做到這一點(diǎn),請(qǐng)考慮以下問(wèn)題:如果并非所有數(shù)據(jù)都具有同等的信息性,那么處理子數(shù)據(jù)或冗余數(shù)據(jù)有什么意義?

我可以通過(guò)我的電腦屏幕聽(tīng)到數(shù)百名數(shù)據(jù)科學(xué)家的聲音,他們抗議說(shuō),更大的訓(xùn)練集是他們痛苦的答案。畢竟,難道幾代專家沒(méi)有一次又一次地告訴我們,數(shù)據(jù)越多越好嗎?

事實(shí)并非如此簡(jiǎn)單。顯然,獲得高質(zhì)量、足夠大的數(shù)據(jù)集是機(jī)器學(xué)習(xí)取得進(jìn)展的關(guān)鍵。然而,如果醫(yī)生告訴你生病了,急需大量攝入維生素C,你難道不想認(rèn)真地確定哪些食物確實(shí)含有上述維生素,而不是沖到你的廚房,吃掉你能在那里找到的每一種食物嗎?毫無(wú)疑問(wèn),吃下冰箱或食品儲(chǔ)藏室里的所有食物最終會(huì)讓你獲得一些急需的維生素C,但在這個(gè)過(guò)程中,你也會(huì)消耗很多空熱量。不幸的是,今天我們處理機(jī)器學(xué)習(xí)的方式似乎需要相當(dāng)于營(yíng)養(yǎng)師的干預(yù)。

這似乎是一個(gè)愚蠢的類比,但這里有一些分量。例如,認(rèn)為功能更強(qiáng)大的GPU機(jī)器最終會(huì)讓我們擺脫困境的觀點(diǎn)是有嚴(yán)重缺陷的,就像認(rèn)為暴飲暴食會(huì)幫助我們攝入維生素一樣。實(shí)際上,我們收集的很多數(shù)據(jù)不僅與我們?cè)噲D使用它訓(xùn)練的模型冗余或無(wú)關(guān),而且往往對(duì)這些模型有害。例如,過(guò)度增長(zhǎng)的訓(xùn)練集通常是不平衡的,可能會(huì)導(dǎo)致過(guò)度擬合。一些極端的異常值實(shí)際上可能會(huì)導(dǎo)致模型“忘卻”數(shù)據(jù)可能被錯(cuò)誤標(biāo)記、錯(cuò)誤收集或錯(cuò)誤。

這就提出了一個(gè)重要的問(wèn)題:如果數(shù)據(jù)科學(xué)家最適合就哪些數(shù)據(jù)可能對(duì)模型學(xué)習(xí)更有用提供反饋,那么為什么他們?nèi)匀粠缀醪粎⑴c旨在收集數(shù)據(jù)的硬件設(shè)備的設(shè)計(jì),而且很少有機(jī)會(huì)提供數(shù)據(jù)收集過(guò)程本身的反饋?

答案實(shí)際上比最初看起來(lái)更簡(jiǎn)單:正如營(yíng)養(yǎng)學(xué)家根據(jù)不同客戶的獨(dú)特營(yíng)養(yǎng)需求向他們提供不同的建議一樣,數(shù)據(jù)科學(xué)家也只能建議針對(duì)特定用例收集哪些數(shù)據(jù)。簡(jiǎn)而言之,在訓(xùn)練給定模型的背景下,信息量最大的數(shù)據(jù)實(shí)際上可能與另一個(gè)模型完全無(wú)關(guān),這使得在源位置對(duì)數(shù)據(jù)進(jìn)行不可知分類具有挑戰(zhàn)性。

硬件顯然無(wú)法解決所有這些問(wèn)題。它無(wú)法確定哪些數(shù)據(jù)行正在降低模型的準(zhǔn)確性。它無(wú)法弄清楚哪些是多余的。它不能重新標(biāo)記錯(cuò)誤的數(shù)據(jù)點(diǎn)。換句話說(shuō),存儲(chǔ)太多數(shù)據(jù)并不能解決存儲(chǔ)太多數(shù)據(jù)帶來(lái)的問(wèn)題。我們需要專注于創(chuàng)建一個(gè)額外的智能層,能夠從渣滓中分類有意義的數(shù)據(jù)。我們需要開始關(guān)注那些從較小的、經(jīng)過(guò)整理的數(shù)據(jù)集構(gòu)建出色模型的數(shù)據(jù)科學(xué)家。我們需要明白,是的,您可以過(guò)度喂食您的模型。

數(shù)據(jù)的未來(lái)并不存在于容納每個(gè)數(shù)據(jù)點(diǎn)的巨大服務(wù)器場(chǎng)中,而不管哪些數(shù)據(jù)點(diǎn)實(shí)際上是有用的。它存在于小型智能數(shù)據(jù)中。它是基于數(shù)據(jù)質(zhì)量及其與用例相關(guān)性的深思熟慮的方法,而不是主要基于數(shù)量的草率方法。對(duì)于我們這些沒(méi)有無(wú)休止的標(biāo)簽和服務(wù)器預(yù)算的人來(lái)說(shuō),它更容易獲得。換句話說(shuō),它既更智能,也更民主。

這是我們都可以落后的。

pYYBAGLXVWCAGvibAAAc7H8Ypd8467.jpg

Jennifer Prendki是 Alectio 的創(chuàng)始人兼首席執(zhí)行官。這家公司是她相信好的模型只能用好的數(shù)據(jù)建立的直接產(chǎn)物,而盲目地使用越來(lái)越大的訓(xùn)練集的蠻力方法是進(jìn)入人工智能的障礙如此之高的原因。在創(chuàng)立 Alectio 之前,Jennifer 是 Figure 8 的機(jī)器學(xué)習(xí)副總裁、數(shù)據(jù)標(biāo)簽的先驅(qū)、Atlassian 的首席數(shù)據(jù)科學(xué)家和沃爾瑪實(shí)驗(yàn)室搜索團(tuán)隊(duì)的數(shù)據(jù)科學(xué)高級(jí)經(jīng)理。她擁有索邦大學(xué)粒子物理學(xué)博士學(xué)位。她最喜歡的口號(hào)是:“并非所有數(shù)據(jù)生來(lái)都是平等的”、“數(shù)據(jù)是新塑料”和“智能數(shù)據(jù) > 大數(shù)據(jù)”。


審核編輯 黃昊宇


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7342

    瀏覽量

    94920
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2948

    文章

    47954

    瀏覽量

    416573
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    嵌入式開發(fā)是否會(huì)成為下一個(gè)被看好的領(lǐng)域?

    聊嵌入式開發(fā)會(huì)不會(huì)成為下一個(gè)風(fēng)口,現(xiàn)在確實(shí)是個(gè)挺熱門的話題。各種論壇、投資報(bào)告都在講聯(lián)網(wǎng)智能硬件、AIoT的萬(wàn)億市場(chǎng),仿佛只要跟嵌入式沾
    的頭像 發(fā)表于 02-26 09:56 ?538次閱讀
    嵌入式開發(fā)是否會(huì)成為<b class='flag-5'>下一個(gè)</b>被看好的領(lǐng)域?

    篇文章帶你了解什么是聯(lián)網(wǎng)技術(shù)?

    聯(lián)網(wǎng)技術(shù)(Internet of Things, IoT)是種通過(guò)信息傳感設(shè)備,按約定的協(xié)議,將任何物體與網(wǎng)絡(luò)相連接,實(shí)現(xiàn)智能化識(shí)別、定位、跟蹤、監(jiān)管等功能的技術(shù)。
    發(fā)表于 02-09 16:58

    半導(dǎo)體測(cè)試,是“下一個(gè)前沿

    ,但半導(dǎo)體測(cè)試是“下一個(gè)前沿”,它是設(shè)計(jì)與制造之間的橋梁,解決了傳統(tǒng)分離領(lǐng)域之間模糊的界限。更具體地說(shuō),通過(guò)連接設(shè)計(jì)和制造,測(cè)試可以幫助產(chǎn)品和芯片公司更快地生產(chǎn)出
    的頭像 發(fā)表于 12-26 10:02 ?596次閱讀
    半導(dǎo)體測(cè)試,是“<b class='flag-5'>下一個(gè)</b><b class='flag-5'>前沿</b>”

    為啥現(xiàn)在這么多人學(xué)聯(lián)網(wǎng)?

    智能家電、醫(yī)院的遠(yuǎn)程監(jiān)測(cè)、馬路上的智能交通,都要用到聯(lián)網(wǎng)技術(shù),需求大到用不完。 3. 人才缺口大,薪資有競(jìng)爭(zhēng)力 行業(yè)發(fā)展快,但專業(yè)人才跟不上,據(jù)人社部相關(guān)
    發(fā)表于 11-18 15:39

    學(xué)習(xí)聯(lián)網(wǎng)怎么入門?

    隨著聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,越來(lái)越多的人開始關(guān)注學(xué)習(xí)這領(lǐng)域。但是對(duì)于初學(xué)者來(lái)說(shuō),聯(lián)網(wǎng)似乎是
    發(fā)表于 10-14 10:34

    學(xué)習(xí)聯(lián)網(wǎng)可以做什么工作?

    學(xué)習(xí)聯(lián)網(wǎng)專業(yè)后,你可以從事多種與聯(lián)網(wǎng)相關(guān)的工作。聯(lián)網(wǎng)
    發(fā)表于 10-11 16:40

    聯(lián)網(wǎng)智能電表平臺(tái):所有電表數(shù)據(jù),集中到個(gè)系統(tǒng)管

    聯(lián)網(wǎng)智能電表平臺(tái),不是簡(jiǎn)單的“抄表軟件”,而是套集數(shù)據(jù)采集、遠(yuǎn)程控制、計(jì)費(fèi)管理、異常預(yù)警、財(cái)務(wù)結(jié)算于
    的頭像 發(fā)表于 09-18 17:13 ?953次閱讀
    <b class='flag-5'>物</b><b class='flag-5'>聯(lián)網(wǎng)</b><b class='flag-5'>智能</b>電表平臺(tái):所有電表<b class='flag-5'>數(shù)據(jù)</b>,集中到<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>系統(tǒng)管

    科技云報(bào)到:西湖大學(xué)、智元機(jī)器人都選它,存儲(chǔ)成為AI下一個(gè)風(fēng)口

    科技云報(bào)到:西湖大學(xué)、智元機(jī)器人都選它,存儲(chǔ)成為AI下一個(gè)風(fēng)口
    的頭像 發(fā)表于 09-03 11:24 ?741次閱讀

    【原創(chuàng)】TDMS設(shè)置下一個(gè)寫入位置函數(shù)的摸索

    labview在20版本前,tdms都有高級(jí)函數(shù),寫入文件位置set file positon,但是在20版本后被取消了。取而代之是個(gè)‘tdms設(shè)置下一個(gè)寫入位置函數(shù)’ 本意是想利用tdms設(shè)置
    發(fā)表于 08-11 20:54

    AI玩具或成為下一個(gè)萬(wàn)億新賽道

    如果你將擁有個(gè)家庭新成員,你首先會(huì)想到什么?是孩子還是寵物?如果我說(shuō)你下一個(gè)家庭成員,或許是個(gè)會(huì)“察言觀色”的AI玩具,這件事是不是聽(tīng)上
    的頭像 發(fā)表于 07-29 10:15 ?1170次閱讀

    智能工廠為什么需要數(shù)據(jù)采集聯(lián)網(wǎng)系統(tǒng)

    工廠實(shí)現(xiàn)數(shù)字化、網(wǎng)絡(luò)化和智能化的關(guān)鍵基礎(chǔ)設(shè)施。以下是智能工廠需要數(shù)據(jù)采集聯(lián)網(wǎng)系統(tǒng)的核心原因:
    的頭像 發(fā)表于 07-18 14:52 ?1093次閱讀

    聯(lián)網(wǎng)藍(lán)牙模塊有哪些優(yōu)勢(shì)?

    更加廣泛地覆蓋范圍,從而提高了設(shè)備的可用性。安全性高:藍(lán)牙模塊采用了加密技術(shù),可以有效地保障通信數(shù)據(jù)的安全性,防止數(shù)據(jù)被非法獲取。這對(duì)于些對(duì)安全性要求較高的
    發(fā)表于 06-28 21:49

    聯(lián)網(wǎng)的應(yīng)用范圍有哪些?

    在生活中的個(gè)小小體現(xiàn)。 從技術(shù)層面看,聯(lián)網(wǎng)融合了多種技術(shù),包括傳感器技術(shù)、網(wǎng)絡(luò)通信技術(shù)、大數(shù)據(jù)與云計(jì)算技術(shù)等。傳感器負(fù)責(zé)采集各種物理量、
    發(fā)表于 06-16 16:01

    聯(lián)網(wǎng)未來(lái)發(fā)展趨勢(shì)如何?

    ,人們才會(huì)更加信任和接受聯(lián)網(wǎng)技術(shù)。 綜上所述,聯(lián)網(wǎng)行業(yè)的未來(lái)發(fā)展趨勢(shì)非常廣闊。智能家居、工業(yè)互聯(lián)網(wǎng)
    發(fā)表于 06-09 15:25

    ad7616 burst模式讀取數(shù)據(jù)時(shí),是否可以在下一個(gè)convst啟動(dòng)轉(zhuǎn)換?

    ad7616 burst模式讀取數(shù)據(jù)時(shí),是否可以在下一個(gè)convst啟動(dòng)轉(zhuǎn)換,但busy還沒(méi)有拉低的情況下繼續(xù)讀取上次轉(zhuǎn)換的數(shù)據(jù)嗎?主要是串行讀取時(shí),有可能出現(xiàn)convst臨界的情
    發(fā)表于 04-15 07:50