91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)標(biāo)注是人類與AI合作最完美的途徑之一

lhl545545 ? 來源:自動(dòng)駕駛說 ? 作者:自動(dòng)駕駛說 ? 2020-06-18 14:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,機(jī)器學(xué)習(xí)主要分為兩類:監(jiān)督學(xué)習(xí)(supervised learning)與無監(jiān)督學(xué)習(xí)(unsupervised learning)。而監(jiān)督學(xué)習(xí)離不開數(shù)據(jù)標(biāo)注(data labeling),也就是依靠人工找到groundtruth。燒錢速度有多快?近年來,我們注意到,數(shù)據(jù)標(biāo)注創(chuàng)業(yè)公司層出不窮。只要在圖片中標(biāo)注一輛汽車,只需一秒鐘,就能輕輕松松一美元進(jìn)賬。標(biāo)注一段幾十秒視頻中的汽車,就能幾百美元進(jìn)賬。數(shù)據(jù)標(biāo)注的成本與需求都在節(jié)節(jié)攀升。據(jù)市場研究預(yù)測,到2023年,數(shù)據(jù)標(biāo)注市場將達(dá)到10億美元的規(guī)模。這些數(shù)據(jù)標(biāo)注公司一般會(huì)開發(fā)出基本的物體識(shí)別算法,然后在人工成本較低的地區(qū)招人,培訓(xùn)他們,讓他們找到機(jī)器識(shí)別中的錯(cuò)誤,改正之后提交。比如,一些總部在硅谷的公司會(huì)在比較偏遠(yuǎn)的州建立分部,進(jìn)行數(shù)據(jù)標(biāo)注。也有很多公司將業(yè)務(wù)外包給數(shù)據(jù)標(biāo)注公司,這些公司的員工一般在非洲國家、印度或者其他人工成本較低的國家。對數(shù)據(jù)需求量大的公司,每個(gè)月支付給外包公司上百萬美元,才能滿足開發(fā)需求。數(shù)據(jù)標(biāo)注不僅消耗資金,也是訓(xùn)練模型中最耗時(shí)的環(huán)節(jié)。從數(shù)據(jù)采集到最終標(biāo)識(shí),很可能要等待一個(gè)月的時(shí)間。嚴(yán)重影響了開發(fā)進(jìn)度。因此,很多無人駕駛公司開始研究數(shù)據(jù)標(biāo)識(shí),希望不再依賴人力與第三方公司。

印度數(shù)據(jù)標(biāo)注公司iMerit數(shù)據(jù)標(biāo)注無處不在訓(xùn)練無人駕駛的模型就需要理解各種障礙物的含義,就離不開數(shù)據(jù)標(biāo)識(shí)。無人駕駛的數(shù)據(jù)標(biāo)識(shí)主要可以用兩個(gè)維度來看。第一個(gè)維度是2D和3D的分別。2D一般指通過攝像頭捕捉到的數(shù)據(jù),3D指激光雷達(dá)捕捉到的數(shù)據(jù)。第二個(gè)維度是語義分割(semantic segmentation)與畫框(bounding box)的分別。

3D語義分割的例子魚和熊掌不可兼得數(shù)據(jù)標(biāo)注的難點(diǎn)主要來源于兩個(gè)方面:速度與質(zhì)量。速度慢了就滿足不了模型訓(xùn)練的需求,而太快就會(huì)影響質(zhì)量,質(zhì)量低了就會(huì)影響模型的準(zhǔn)確性。在資源有限的情況下,速度與質(zhì)量往往魚和熊掌不可兼得。我們可以通過兩種手段來解決這一矛盾:合理的流程和更自動(dòng)化的機(jī)器學(xué)習(xí)技術(shù)。首先來看流程。數(shù)據(jù)標(biāo)識(shí)速度慢,或是質(zhì)量低,其實(shí)很多時(shí)候不是技術(shù)的問題,而是流程的問題。數(shù)據(jù)從采集到產(chǎn)出,首先要被“篩選”,分發(fā)到數(shù)據(jù)標(biāo)識(shí)人員的手上,然后被標(biāo)識(shí),標(biāo)識(shí)的結(jié)果再被傳回來,最后需要抽檢,保證質(zhì)量。這些步驟中很多地方需要改進(jìn)。比如,哪類數(shù)據(jù)應(yīng)該被篩選?質(zhì)量不合格的標(biāo)識(shí)該怎么辦?是否要退回重做?重做又需要時(shí)間,不重做就意味著需要更多的數(shù)據(jù)。對于資金不夠充足的公司,改進(jìn)流程往往是最合適的手段。從技術(shù)方面來看,近年來,AutoML(Automated Machine Learning)的概念越來越火,即端到端的全自動(dòng)機(jī)器學(xué)習(xí)技術(shù),可以自主調(diào)參,自主評估模型,從而縮短模型訓(xùn)練的周期。但是,AutoML不是萬能的。至少在未來幾年里,我們都無法擺脫對人工數(shù)據(jù)標(biāo)識(shí)的依賴。我們需要找到一種人機(jī)共生的方式,將人類對機(jī)器的幫助最大化。

歐洲數(shù)據(jù)標(biāo)識(shí)市場中,人工標(biāo)識(shí)的占比始終占大多數(shù)人機(jī)共生(Human-in-the-Loop)2020-2030這十年,將是人類探索與AI合作機(jī)會(huì)的十年。數(shù)據(jù)標(biāo)注就是人類與AI合作最完美的途徑之一。利用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行視覺探測,雖然成本低、速度快,但是往往有一定的錯(cuò)誤率。這時(shí),就需要人類介入,告訴機(jī)器錯(cuò)在了哪里。機(jī)器會(huì)記住這些人類提供的回饋信息,進(jìn)一步訓(xùn)練自己的模型,避免下次在類似場景中犯同樣的錯(cuò)誤,從而形成了一個(gè)循環(huán)。比如,AI探測結(jié)果是,某個(gè)交通信號燈的顏色是紅色,而人類檢查后發(fā)現(xiàn)應(yīng)該是綠色,就通過某個(gè)前端工具點(diǎn)擊“錯(cuò)誤”。開發(fā)團(tuán)隊(duì)要盡快找到模型最需要的反饋信息,為人類標(biāo)注員提供一個(gè)工具,將人類的反饋快速分享給機(jī)器。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7340

    瀏覽量

    94856
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40065

    瀏覽量

    301707
  • 無人駕駛
    +關(guān)注

    關(guān)注

    100

    文章

    4301

    瀏覽量

    126904
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    論馬斯克的預(yù)言:AI使人類邊緣化

    當(dāng)?shù)貢r(shí)間3月11日,在“Abundance Summit”科技峰會(huì)上,馬斯克談及AI進(jìn)展時(shí)表示,AI已經(jīng)進(jìn)入自我改進(jìn)階段,在超高量級AI面前,人類終將走向邊緣化。以下是對這
    發(fā)表于 03-14 05:27

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    [首發(fā)于智駕最前沿微信公眾號]數(shù)據(jù)標(biāo)注對于自動(dòng)駕駛來說,就像是老師教小朋友知識(shí),數(shù)據(jù)標(biāo)注可以讓車輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達(dá)、激光雷達(dá)(LiDAR)拍下來的只是
    的頭像 發(fā)表于 12-04 09:05 ?914次閱讀
    自動(dòng)駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>是所有信息都要<b class='flag-5'>標(biāo)注</b>嗎?

    算法工程師不愿做標(biāo)注工作,怎么辦?

    對于算法而言,圖像標(biāo)注項(xiàng)關(guān)鍵性工作,越是大量的新數(shù)據(jù)標(biāo)注,對于算法的性能提升越有幫助。但是圖像標(biāo)注
    的頭像 發(fā)表于 12-02 17:56 ?570次閱讀
    算法工程師不愿做<b class='flag-5'>標(biāo)注</b>工作,怎么辦?

    庫拉崗日雪山:讀懂美的AI版圖

    “科技月”三十年,美的AI筑起庫拉崗日雪山
    的頭像 發(fā)表于 11-03 19:52 ?9563次閱讀
    庫拉崗日雪山:讀懂<b class='flag-5'>美的</b><b class='flag-5'>AI</b>版圖

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、
    發(fā)表于 09-17 11:45

    AI Cube如何導(dǎo)入數(shù)據(jù)集?

    我從在線平臺(tái)標(biāo)注完并且下載了數(shù)據(jù)集,也按照ai cube的要求修改了文件夾名稱,但是導(dǎo)入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發(fā)表于 08-11 08:12

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號]在自動(dòng)駕駛系統(tǒng)的研發(fā)過程中,數(shù)據(jù)標(biāo)注是實(shí)現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點(diǎn)云、視頻序列等)轉(zhuǎn)化為具有語義信息
    的頭像 發(fā)表于 07-30 11:54 ?1383次閱讀
    自動(dòng)駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號]在自動(dòng)駕駛系統(tǒng)的開發(fā)過程中,數(shù)據(jù)標(biāo)注項(xiàng)至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的
    的頭像 發(fā)表于 07-09 09:19 ?1420次閱讀
    什么是自動(dòng)駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?如何好做<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?

    GitHub等平臺(tái)上尋找感興趣的AI開源項(xiàng)目。例如,可以參與些小型的深度學(xué)習(xí)框架改進(jìn)項(xiàng)目,或者數(shù)據(jù)標(biāo)注工具的開發(fā)項(xiàng)目。通過參與這些項(xiàng)目,可以學(xué)習(xí)到實(shí)際的代碼開發(fā)規(guī)范,與其他開發(fā)者交流
    發(fā)表于 07-08 17:44

    AI時(shí)代 圖像標(biāo)注不要沒苦硬吃

    識(shí)別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對同類型數(shù)據(jù)集進(jìn)行步步手動(dòng)拉框,這個(gè)過程的痛苦只有做過的人才知道。越多素材的數(shù)據(jù)集對于算法的提升越有幫助,常規(guī)情況下,
    的頭像 發(fā)表于 05-20 17:54 ?573次閱讀
    <b class='flag-5'>AI</b>時(shí)代   圖像<b class='flag-5'>標(biāo)注</b>不要沒苦硬吃

    東軟集團(tuán)入選國家數(shù)據(jù)數(shù)據(jù)標(biāo)注優(yōu)秀案例

    近日,東軟飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺(tái)在國家數(shù)據(jù)局發(fā)布數(shù)據(jù)標(biāo)注優(yōu)秀案例集名單中排名第(案例名稱“多模態(tài)醫(yī)學(xué)影像智能
    的頭像 發(fā)表于 05-09 14:37 ?1284次閱讀

    海信集團(tuán)與美的集團(tuán)簽訂戰(zhàn)略合作協(xié)議

    近日,海信集團(tuán)與美的集團(tuán)簽訂戰(zhàn)略合作協(xié)議,雙方將圍繞AI應(yīng)用、全球先進(jìn)制造、智慧物流等多領(lǐng)域開展全面戰(zhàn)略合作,以資源共享、互惠互利與協(xié)同創(chuàng)新為基礎(chǔ),開啟
    的頭像 發(fā)表于 05-08 15:59 ?982次閱讀

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問題與解答,帶你快速掌握如何在nRF54上部署
    發(fā)表于 04-01 00:00

    數(shù)據(jù)標(biāo)注服務(wù)—奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:30 ?3457次閱讀

    標(biāo)貝數(shù)據(jù)標(biāo)注服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:27 ?1144次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>服務(wù):奠定大模型訓(xùn)練的<b class='flag-5'>數(shù)據(jù)</b>基石