91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出一款基于AI和深度學(xué)習(xí)的圖像標(biāo)注方式“流體標(biāo)注”

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-10-24 09:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌在其AI博客上介紹了一款基于AI和深度學(xué)習(xí)的圖像標(biāo)注方式“流體標(biāo)注”,可作為人工標(biāo)注者的有力輔助工具,將標(biāo)記數(shù)據(jù)集的生成速度提升至現(xiàn)在的3倍,有望緩解目前機(jī)器學(xué)習(xí)研究中,高質(zhì)量的訓(xùn)練數(shù)據(jù)獲取難的瓶頸。

基于深度學(xué)習(xí)的現(xiàn)代計(jì)算機(jī)視覺(jué)模型(比如由TensorFlow對(duì)象檢測(cè)API實(shí)現(xiàn)的模型)的性能取決于是否可以使用規(guī)模越來(lái)越大的標(biāo)記訓(xùn)練數(shù)據(jù)集(如公開(kāi)的圖像)進(jìn)行訓(xùn)練。

然而,如何獲得高質(zhì)量的訓(xùn)練數(shù)據(jù),正迅速成為計(jì)算機(jī)視覺(jué)領(lǐng)域的主要瓶頸。這對(duì)于自動(dòng)駕駛機(jī)器人和圖像搜索等應(yīng)用中使用的語(yǔ)義分段的像素預(yù)測(cè)任務(wù)而言尤其如此。

實(shí)際上,傳統(tǒng)的手動(dòng)數(shù)據(jù)標(biāo)記工具,需要標(biāo)記者仔細(xì)點(diǎn)擊圖象邊界,來(lái)劃定圖像中的每個(gè)對(duì)象,這很乏味:在COCO + Stuff數(shù)據(jù)集中,標(biāo)記一個(gè)圖像需要19分鐘,而標(biāo)記整個(gè)數(shù)據(jù)集需要53000小時(shí)!

COCO數(shù)據(jù)集中的圖像示例(左)及其逐像素語(yǔ)義標(biāo)記(右)。圖片來(lái)源:Florida Memory

本文中的內(nèi)容將在2018年ACM多媒體會(huì)議“勇敢新理念”環(huán)節(jié)中展示,谷歌的研究人員研究了一種機(jī)器學(xué)習(xí)驅(qū)動(dòng)的界面,可用于標(biāo)注分類數(shù)據(jù),劃定圖像中每個(gè)目標(biāo)的輪廓和背景,讓標(biāo)記數(shù)據(jù)集的生成速度提高至原來(lái)的3倍。

該工具名為流體標(biāo)注(Fluid Annotation),從強(qiáng)語(yǔ)義分割模型的輸出開(kāi)始,人工標(biāo)記者可以使用自然用戶界面,通過(guò)機(jī)器輔助編輯操作進(jìn)行修改。谷歌此次開(kāi)發(fā)的界面可以讓標(biāo)記者選擇要修改的內(nèi)容和順序,使他們能夠高效地將精力集中在機(jī)器尚不了解的內(nèi)容上。

對(duì)COCO數(shù)據(jù)集中圖像使用流體標(biāo)注界面的可視化。圖片來(lái)源:gamene

更確切地說(shuō),為了對(duì)圖像進(jìn)行標(biāo)記,我們首先通過(guò)預(yù)訓(xùn)練的語(yǔ)義分割模型(Mask-RCNN)來(lái)處理圖像。這會(huì)生成約1000個(gè)圖像片段及其分類標(biāo)簽和置信度分?jǐn)?shù)。置信度分?jǐn)?shù)最高的片段用于對(duì)標(biāo)簽的初始化,呈現(xiàn)給標(biāo)記者。

然后,標(biāo)記者就可以:(1)從機(jī)器生成的候選標(biāo)簽中為當(dāng)前片段選擇標(biāo)簽。(2)對(duì)機(jī)器未覆蓋到的對(duì)象添加分割段。機(jī)器會(huì)識(shí)別出最可能的預(yù)生成段,標(biāo)記者可以從中選擇質(zhì)量最高的一個(gè)。(3)刪除現(xiàn)有段。(4)改變重疊段的深度順序。(Demo鏈接在此:https://fluidann.appspot.com/,僅限桌面平臺(tái))

使用傳統(tǒng)手動(dòng)標(biāo)記(中列)和流體標(biāo)注(右)在COCO數(shù)據(jù)集的三張圖像上進(jìn)行標(biāo)記的比較。雖然使用手動(dòng)標(biāo)記工具時(shí),目標(biāo)的邊界一般更準(zhǔn)確,但標(biāo)記差異的最大原因是人類標(biāo)記者通常對(duì)某一確切的對(duì)象分類有不同意見(jiàn)。來(lái)源:sneaka(上),Dan Hurt(中),Melodie Mesiano(下)。

流體標(biāo)注是讓圖像標(biāo)注變得更快、更容易的第一步探索。未來(lái)的目標(biāo)是改進(jìn)對(duì)目標(biāo)邊界的標(biāo)記,進(jìn)一步利用機(jī)器智能提升界面的速度,最終實(shí)現(xiàn)對(duì)界面的擴(kuò)展,能夠處理以前無(wú)法識(shí)別的分類,實(shí)現(xiàn)最高效、需求最大的數(shù)據(jù)收集。

而實(shí)際上,關(guān)于這款工具的論文的預(yù)印本早在近一個(gè)月前就發(fā)在了arxiv上。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111406
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301428
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124398

原文標(biāo)題:谷歌推出“流體標(biāo)注”AI輔助工具,圖像標(biāo)注速度提升3倍?。ǜ秸撐模?/p>

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    大模型時(shí)代自動(dòng)駕駛標(biāo)注有什么特殊要求?

    的端到端架構(gòu)和占用網(wǎng)絡(luò),標(biāo)注工作已經(jīng)從平面的像素點(diǎn)位,跨越到了四維時(shí)空的深度重建。 空間的立體化與時(shí)間的連貫性挑戰(zhàn) 自動(dòng)駕駛標(biāo)注的難點(diǎn)在于從二維圖像向三維向量空間的躍遷。早期的算法
    的頭像 發(fā)表于 03-01 09:09 ?2436次閱讀
    大模型時(shí)代自動(dòng)駕駛<b class='flag-5'>標(biāo)注</b>有什么特殊要求?

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]數(shù)據(jù)標(biāo)注對(duì)于自動(dòng)駕駛來(lái)說(shuō),就像是老師教小朋友知識(shí),數(shù)據(jù)標(biāo)注可以讓車輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達(dá)、激光雷達(dá)(LiDAR)拍下來(lái)的只是堆原始信
    的頭像 發(fā)表于 12-04 09:05 ?871次閱讀
    自動(dòng)駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>是所有信息都要<b class='flag-5'>標(biāo)注</b>嗎?

    算法工程師不愿做標(biāo)注工作,怎么辦?

    對(duì)于算法而言,圖像標(biāo)注項(xiàng)關(guān)鍵性工作,越是大量的新數(shù)據(jù)集標(biāo)注,對(duì)于算法的性能提升越有幫助。但是圖像標(biāo)注
    的頭像 發(fā)表于 12-02 17:56 ?538次閱讀
    算法工程師不愿做<b class='flag-5'>標(biāo)注</b>工作,怎么辦?

    淺析多模態(tài)標(biāo)注對(duì)大模型應(yīng)用落地的重要性與標(biāo)注實(shí)例

    ”的關(guān)鍵工序——多模態(tài)標(biāo)注重要性日益凸顯。 、什么是多模態(tài)標(biāo)注? 多模態(tài)標(biāo)注是指對(duì)文本、圖像、語(yǔ)音、視頻、點(diǎn)云等異構(gòu)數(shù)據(jù)進(jìn)行跨模態(tài)語(yǔ)義關(guān)聯(lián)
    的頭像 發(fā)表于 09-05 13:49 ?2277次閱讀

    小語(yǔ)種OCR標(biāo)注效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)標(biāo)注實(shí)戰(zhàn)解析

    摘要 :小語(yǔ)種OCR研發(fā)的核心瓶頸在于高質(zhì)量標(biāo)注數(shù)據(jù)的稀缺與高昂成本。本文介紹種創(chuàng)新的自動(dòng)化標(biāo)注方案,利用 PaddleOCR 進(jìn)行文本檢測(cè)與裁剪,并調(diào)用 ERNIE 4.5 大模型進(jìn)行雙重預(yù)測(cè)
    的頭像 發(fā)表于 08-29 11:26 ?3640次閱讀
    小語(yǔ)種OCR<b class='flag-5'>標(biāo)注</b>效率提升10+倍:PaddleOCR+ERNIE 4.5自動(dòng)<b class='flag-5'>標(biāo)注</b>實(shí)戰(zhàn)解析

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的研發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注是實(shí)現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點(diǎn)云、視頻序列等)轉(zhuǎn)化為具有語(yǔ)義信息
    的頭像 發(fā)表于 07-30 11:54 ?1342次閱讀
    自動(dòng)駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    什么是自動(dòng)駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在自動(dòng)駕駛系統(tǒng)的開(kāi)發(fā)過(guò)程中,數(shù)據(jù)標(biāo)注項(xiàng)至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的劇增,有效
    的頭像 發(fā)表于 07-09 09:19 ?1376次閱讀
    什么是自動(dòng)駕駛數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?如何好做數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>?

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時(shí)代,大模型憑借其強(qiáng)大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動(dòng)力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動(dòng)力,是模型不可或缺的“養(yǎng)料。大模型則憑借
    的頭像 發(fā)表于 06-04 17:15 ?1986次閱讀
    數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>與大模型的雙向賦能:效率與性能的躍升

    AI時(shí)代 圖像標(biāo)注不要沒(méi)苦硬吃

    識(shí)別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對(duì)同類型數(shù)據(jù)集進(jìn)行步步手動(dòng)拉框,這個(gè)過(guò)程的痛苦只有做過(guò)的人才知道。越多素材的數(shù)據(jù)集對(duì)于算法的提升越有幫助,常規(guī)情況下,個(gè)2
    的頭像 發(fā)表于 05-20 17:54 ?551次閱讀
    <b class='flag-5'>AI</b>時(shí)代   <b class='flag-5'>圖像</b><b class='flag-5'>標(biāo)注</b>不要沒(méi)苦硬吃

    東軟集團(tuán)入選國(guó)家數(shù)據(jù)局?jǐn)?shù)據(jù)標(biāo)注優(yōu)秀案例

    近日,東軟飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺(tái)在國(guó)家數(shù)據(jù)局發(fā)布數(shù)據(jù)標(biāo)注優(yōu)秀案例集名單中排名第(案例名稱“多模態(tài)醫(yī)學(xué)影像智能數(shù)據(jù)標(biāo)注平臺(tái)”)。評(píng)選專家認(rèn)為東軟案例取得了顯著成效,
    的頭像 發(fā)表于 05-09 14:37 ?1220次閱讀

    大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注在OCR標(biāo)注場(chǎng)景的應(yīng)用

    OCR,即光學(xué)字符識(shí)別,簡(jiǎn)單來(lái)說(shuō)就是利用光學(xué)設(shè)備去捕獲圖像并識(shí)別文字,最終將圖片中的文字轉(zhuǎn)換為可編輯和可搜索的文本。在數(shù)字化時(shí)代,OCR(光學(xué)字符識(shí)別)技術(shù)作為處理圖像中文字信息的關(guān)鍵手段,其標(biāo)注
    的頭像 發(fā)表于 04-15 15:18 ?943次閱讀

    數(shù)據(jù)標(biāo)注服務(wù)—奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過(guò)程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)習(xí)的信息的關(guān)鍵任務(wù)。這過(guò)程不僅決定了模型
    的頭像 發(fā)表于 03-21 10:30 ?3297次閱讀

    標(biāo)貝數(shù)據(jù)標(biāo)注服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過(guò)程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解、可學(xué)習(xí)的信息的關(guān)鍵任務(wù)。這過(guò)程不僅決定了模型
    的頭像 發(fā)表于 03-21 10:27 ?1111次閱讀
    標(biāo)貝數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石

    自動(dòng)化標(biāo)注技術(shù)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)在全棧數(shù)據(jù)標(biāo)注場(chǎng)景式中搭載了大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注能力,并應(yīng)用于3D點(diǎn)云、2D圖像、音頻、文本等數(shù)據(jù)場(chǎng)景的大規(guī)模、復(fù)
    的頭像 發(fā)表于 03-14 16:46 ?1359次閱讀

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)推動(dòng)AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動(dòng)化數(shù)據(jù)標(biāo)注平臺(tái)在全棧數(shù)據(jù)標(biāo)注場(chǎng)景式中搭載了大模型預(yù)標(biāo)注和自動(dòng)化標(biāo)注能力,并應(yīng)用于3D點(diǎn)云、2D圖像、音頻、文本等數(shù)據(jù)場(chǎng)景的大規(guī)模、復(fù)
    的頭像 發(fā)表于 03-14 16:42 ?1649次閱讀
    標(biāo)貝自動(dòng)化數(shù)據(jù)<b class='flag-5'>標(biāo)注</b>平臺(tái)推動(dòng)<b class='flag-5'>AI</b>數(shù)據(jù)訓(xùn)練革新