91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是數(shù)據(jù)標(biāo)注?數(shù)據(jù)如何標(biāo)注?

倩倩 ? 來源:今日頭條 ? 2020-07-17 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)標(biāo)注是大多數(shù)人工智能的基礎(chǔ),它決定了機器學(xué)習(xí)深度學(xué)習(xí)模型的質(zhì)量。今天的數(shù)據(jù)呈現(xiàn)指數(shù)級的爆發(fā),比如僅在2018年,就產(chǎn)生了超過30 ZB的數(shù)據(jù)。而在在任何人工智能項目中,對于數(shù)據(jù)科學(xué)家而言,數(shù)據(jù)問題都是其中的癥結(jié)所在。

什么是數(shù)據(jù)標(biāo)注?

訓(xùn)練機器學(xué)習(xí)和深度學(xué)習(xí)模型,需要豐富的數(shù)據(jù),以便將其用于部署,訓(xùn)練和調(diào)整模型。訓(xùn)練機器學(xué)習(xí)和深度學(xué)習(xí)模型需要大量經(jīng)過仔細(xì)標(biāo)注的數(shù)據(jù)。標(biāo)注原始數(shù)據(jù)并準(zhǔn)備將其應(yīng)用于機器學(xué)習(xí)模型和其他AI工作流,被稱為數(shù)據(jù)標(biāo)注。根據(jù)相關(guān)統(tǒng)計,數(shù)據(jù)整理在AI項目中消耗了80%以上的時間。

數(shù)據(jù)如何標(biāo)注?

如今,大多數(shù)數(shù)據(jù)都沒有標(biāo)注。帶標(biāo)簽的數(shù)據(jù),意味著標(biāo)注或注釋目標(biāo)模型的數(shù)據(jù),以便可以預(yù)測。通常,數(shù)據(jù)標(biāo)注包括數(shù)據(jù)標(biāo)注,注釋,審核,分類,轉(zhuǎn)錄和處理。

標(biāo)注的數(shù)據(jù)突出顯示某些特征,并根據(jù)這些特征對其進行分類,可以通過模型分析其模式以預(yù)測新的目標(biāo)。例如,對于自動駕駛汽車中的計算機視覺,AI專業(yè)人員或數(shù)據(jù)標(biāo)注者可以使用視頻標(biāo)注工具來指示路牌的位置,并通過行人和其他車輛的位置來訓(xùn)練模型。

數(shù)據(jù)標(biāo)注中包含的一系列任務(wù):

豐富數(shù)據(jù)的工具

質(zhì)量保證

流程迭代

管理數(shù)據(jù)標(biāo)簽

培訓(xùn)新的數(shù)據(jù)標(biāo)簽

項目計劃

成功指標(biāo)

流程運作

AI專業(yè)人員的數(shù)據(jù)標(biāo)簽挑戰(zhàn)?

在典型的AI項目中,專業(yè)人員在進行數(shù)據(jù)標(biāo)注時會遇到以下幾個方面的挑戰(zhàn)。

數(shù)據(jù)標(biāo)簽質(zhì)量低下。數(shù)據(jù)標(biāo)簽質(zhì)量低可能有很多原因。其中最突出的原因之一是任何企業(yè)或工作流程確實三個決定因素:人員,流程和技術(shù)。

無法擴展數(shù)據(jù)標(biāo)注操作。當(dāng)數(shù)據(jù)量不斷增長并且業(yè)務(wù)或項目需要擴展其容量時,由于大多數(shù)企業(yè)都在內(nèi)部標(biāo)記數(shù)據(jù),因此它們通常也難以擴展其數(shù)據(jù)標(biāo)注任務(wù)。

難以承受的成本和不存在的結(jié)果。企業(yè)和AI項目經(jīng)理通常雇用高薪數(shù)據(jù)科學(xué)家和AI專業(yè)人士或一組業(yè)余人員來處理數(shù)據(jù)標(biāo)簽,而企業(yè)需要承擔(dān)高昂的人工成本,當(dāng)然企業(yè)也會面臨數(shù)據(jù)標(biāo)簽不確定所帶來的問題,所以合適的專業(yè)人員至關(guān)重要。

質(zhì)量保證。進行質(zhì)量檢查可以為數(shù)據(jù)標(biāo)注過程提供重要價值,尤其是在機器學(xué)習(xí)模型測試和驗證的迭代階段。

誰來標(biāo)注數(shù)據(jù)?

相關(guān)調(diào)查顯示,2019年,企業(yè)在數(shù)據(jù)標(biāo)簽上的支出超過17億美元。到2024年,這一數(shù)字將達到41億美元。進行數(shù)據(jù)標(biāo)注工作,除了雇傭?qū)I(yè)的數(shù)據(jù)科學(xué)家和AI專家之外,還可以考慮通過其他方式。

雇員。這包括雇用包括AI專業(yè)人員在內(nèi)的全職或兼職員工,參與AI項目的各個方面,其中之一是數(shù)據(jù)標(biāo)注。

托管團隊。他們是經(jīng)驗豐富,且訓(xùn)練有素的數(shù)據(jù)標(biāo)簽團隊。

承包商。他們包括自由職業(yè)者和臨時工。

眾包。企業(yè)可以使用第三方平臺一次性尋找數(shù)據(jù)標(biāo)注團隊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50091

    瀏覽量

    265210
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47622
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124382
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    [首發(fā)于智駕最前沿微信公眾號]數(shù)據(jù)標(biāo)注對于自動駕駛來說,就像是老師教小朋友知識,數(shù)據(jù)標(biāo)注可以讓車輛學(xué)習(xí)辨別道路交通信息的能力。攝像頭、雷達、激光雷達(LiDAR)拍下來的只是一堆原始信
    的頭像 發(fā)表于 12-04 09:05 ?856次閱讀
    自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>是所有信息都要<b class='flag-5'>標(biāo)注</b>嗎?

    算法工程師不愿做標(biāo)注工作,怎么辦?

    對于算法而言,圖像標(biāo)注是一項關(guān)鍵性工作,越是大量的新數(shù)據(jù)標(biāo)注,對于算法的性能提升越有幫助。但是圖像標(biāo)注是一項極其費時費力的工作,特別是遇到稍微復(fù)雜的場景時,長時間的重復(fù)工作,會讓
    的頭像 發(fā)表于 12-02 17:56 ?535次閱讀
    算法工程師不愿做<b class='flag-5'>標(biāo)注</b>工作,怎么辦?

    淺析多模態(tài)標(biāo)注對大模型應(yīng)用落地的重要性與標(biāo)注實例

    ”的關(guān)鍵工序——多模態(tài)標(biāo)注重要性日益凸顯。 一、什么是多模態(tài)標(biāo)注? 多模態(tài)標(biāo)注是指對文本、圖像、語音、視頻、點云等異構(gòu)數(shù)據(jù)進行跨模態(tài)語義關(guān)聯(lián)的標(biāo)注
    的頭像 發(fā)表于 09-05 13:49 ?2208次閱讀

    請問AICube所需的目標(biāo)檢測數(shù)據(jù)標(biāo)注可以使用什么工具?

    請問AICube所需的目標(biāo)檢測數(shù)據(jù)標(biāo)注可以使用什么工具? 我使用labelimg進行標(biāo)注標(biāo)注后的數(shù)據(jù)集改好文件名后導(dǎo)入不進去。一直卡在
    發(fā)表于 08-11 08:07

    自動駕駛數(shù)據(jù)標(biāo)注主要是標(biāo)注什么?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛系統(tǒng)的研發(fā)過程中,數(shù)據(jù)標(biāo)注是實現(xiàn)高性能感知模型的基礎(chǔ)環(huán)節(jié),其核心目標(biāo)是將車輛從環(huán)境中采集到的原始感知數(shù)據(jù)(主要包括圖像、點云、視頻序列等)轉(zhuǎn)化為具有語義信息
    的頭像 發(fā)表于 07-30 11:54 ?1331次閱讀
    自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>主要是<b class='flag-5'>標(biāo)注</b>什么?

    什么是自動駕駛數(shù)據(jù)標(biāo)注?如何好做數(shù)據(jù)標(biāo)注

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛系統(tǒng)的開發(fā)過程中,數(shù)據(jù)標(biāo)注是一項至關(guān)重要的工作。它不僅決定了模型訓(xùn)練的質(zhì)量,也直接影響了車輛感知、決策與控制的性能表現(xiàn)。隨著傳感器種類和數(shù)據(jù)量的劇增,有效
    的頭像 發(fā)表于 07-09 09:19 ?1366次閱讀
    什么是自動駕駛<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?如何好做<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>?

    端到端數(shù)據(jù)標(biāo)注方案在自動駕駛領(lǐng)域的應(yīng)用優(yōu)勢

    隨著自動駕駛技術(shù)向L3及以上級別快速發(fā)展,高質(zhì)量訓(xùn)練數(shù)據(jù)的需求呈現(xiàn)指數(shù)級增長。傳統(tǒng)的數(shù)據(jù)標(biāo)注方式面臨著效率低下、成本高昂、一致性差等痛點。據(jù)統(tǒng)計,一輛L4級自動駕駛汽車每天產(chǎn)生的數(shù)據(jù)
    的頭像 發(fā)表于 06-23 17:27 ?996次閱讀

    數(shù)據(jù)標(biāo)注與大模型的雙向賦能:效率與性能的躍升

    ??在人工智能蓬勃發(fā)展的時代,大模型憑借其強大的學(xué)習(xí)與泛化能力,已成為眾多領(lǐng)域創(chuàng)新變革的核心驅(qū)動力。而數(shù)據(jù)標(biāo)注作為大模型訓(xùn)練的基石,為大模型性能提升注入關(guān)鍵動力,是模型不可或缺的“養(yǎng)料。大模型則憑借
    的頭像 發(fā)表于 06-04 17:15 ?1970次閱讀
    <b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>與大模型的雙向賦能:效率與性能的躍升

    AI時代 圖像標(biāo)注不要沒苦硬吃

    識別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對同類型數(shù)據(jù)集進行一步步手動拉框,這個過程的痛苦只有做過的人才知道。越多素材的數(shù)據(jù)集對于算法的提升越有幫助,常規(guī)情況下,一個20秒時長30幀
    的頭像 發(fā)表于 05-20 17:54 ?549次閱讀
    AI時代   圖像<b class='flag-5'>標(biāo)注</b>不要沒苦硬吃

    東軟集團入選國家數(shù)據(jù)數(shù)據(jù)標(biāo)注優(yōu)秀案例

    近日,東軟飛標(biāo)醫(yī)學(xué)影像標(biāo)注平臺在國家數(shù)據(jù)局發(fā)布數(shù)據(jù)標(biāo)注優(yōu)秀案例集名單中排名第一(案例名稱“多模態(tài)醫(yī)學(xué)影像智能數(shù)據(jù)
    的頭像 發(fā)表于 05-09 14:37 ?1218次閱讀

    標(biāo)貝科技“4D-BEV上億點云標(biāo)注系統(tǒng)”入選國家數(shù)據(jù)局首批數(shù)據(jù)標(biāo)注優(yōu)秀案例

    4月29日,作為第八屆數(shù)字中國建設(shè)峰會的重要組成部分,由國家數(shù)據(jù)局主辦的高質(zhì)量數(shù)據(jù)集和數(shù)據(jù)標(biāo)注主題交流活動在福州市數(shù)字中國會展中心舉行。會議交流活動聚焦“推動高質(zhì)量
    的頭像 發(fā)表于 04-30 14:38 ?722次閱讀
    標(biāo)貝科技“4D-BEV上億點云<b class='flag-5'>標(biāo)注</b>系統(tǒng)”入選國家<b class='flag-5'>數(shù)據(jù)</b>局首批<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>優(yōu)秀案例

    數(shù)據(jù)標(biāo)注服務(wù)—奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:30 ?3262次閱讀

    標(biāo)貝數(shù)據(jù)標(biāo)注服務(wù):奠定大模型訓(xùn)練的數(shù)據(jù)基石

    數(shù)據(jù)標(biāo)注是大模型訓(xùn)練過程中不可或缺的基礎(chǔ)環(huán)節(jié),其質(zhì)量直接影響著模型的性能表現(xiàn)。在大模型訓(xùn)練中,數(shù)據(jù)標(biāo)注承擔(dān)著將原始數(shù)據(jù)轉(zhuǎn)化為機器可理解、可學(xué)
    的頭像 發(fā)表于 03-21 10:27 ?1104次閱讀
    標(biāo)貝<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>服務(wù):奠定大模型訓(xùn)練的<b class='flag-5'>數(shù)據(jù)</b>基石

    自動化標(biāo)注技術(shù)推動AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動化數(shù)據(jù)標(biāo)注平臺在全棧數(shù)據(jù)標(biāo)注場景式中搭載了大模型預(yù)標(biāo)注和自動化標(biāo)注能力,并應(yīng)用于3D點云
    的頭像 發(fā)表于 03-14 16:46 ?1356次閱讀

    標(biāo)貝自動化數(shù)據(jù)標(biāo)注平臺推動AI數(shù)據(jù)訓(xùn)練革新

    標(biāo)貝自動化數(shù)據(jù)標(biāo)注平臺在全棧數(shù)據(jù)標(biāo)注場景式中搭載了大模型預(yù)標(biāo)注和自動化標(biāo)注能力,并應(yīng)用于3D點云
    的頭像 發(fā)表于 03-14 16:42 ?1639次閱讀
    標(biāo)貝自動化<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>標(biāo)注</b>平臺推動AI<b class='flag-5'>數(shù)據(jù)</b>訓(xùn)練革新