91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基本圖像處理技術(shù)的數(shù)據(jù)增強方法介紹

新機器視覺 ? 來源:計算機視覺研究院 ? 作者:Edison_G ? 2022-11-23 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)增強(DA)是訓練先進的AI算法模型的必要技術(shù),不過并不是所有的數(shù)據(jù)增強都能提升模型精度,在今天的分享中,從數(shù)據(jù)增強的角度,對于多種增強方式的效果進行了驗證測試,希望對大家有幫助!

一、前言&簡要

為了緩解上述問題,有研究者提出了一種簡單而高效的方法,稱為保持增強(KeepAugment),以提高增強圖像的保真度。其主要思想是首先使用顯著性map來檢測原始圖像上的重要區(qū)域,然后在增強過程中保留這些信息區(qū)域。這種信息保護策略使我們能夠生成更忠實的訓練示例。

在實驗上,也證明了該方法在一些現(xiàn)有的技術(shù)數(shù)據(jù)增強方案上有了顯著的改進,例如:自動增強、裁剪、隨機擦除,在圖像分類、半監(jiān)督圖像分類、多視點多攝像機跟蹤和目標檢測等方面取得了很好的效果。

二、知識回顧

首先我們回一下什么叫“數(shù)據(jù)增強”?數(shù)據(jù)增強(Data Augmentation)是一種通過讓有限的數(shù)據(jù)產(chǎn)生更多的等價數(shù)據(jù)來人工擴展訓練數(shù)據(jù)集的技術(shù)。它是克服訓練數(shù)據(jù)不足的有效手段,目前在深度學習的各個領(lǐng)域中應用廣泛。但是由于生成的數(shù)據(jù)與真實數(shù)據(jù)之間的差異,也不可避免地帶來了噪聲問題。

為什么需要數(shù)據(jù)增強?

深度神經(jīng)網(wǎng)絡在許多任務中表現(xiàn)良好,但這些網(wǎng)絡通常需要大量數(shù)據(jù)才能避免過度擬合。遺憾的是,許多場景無法獲得大量數(shù)據(jù),例如醫(yī)學圖像分析。數(shù)據(jù)增強技術(shù)的存在是為了解決這個問題,這是針對有限數(shù)據(jù)問題的解決方案。數(shù)據(jù)增強一套技術(shù),可提高訓練數(shù)據(jù)集的大小和質(zhì)量,以便您可以使用它們來構(gòu)建更好的深度學習模型。在計算視覺領(lǐng)域,生成增強圖像相對容易。即使引入噪聲或裁剪圖像的一部分,模型仍可以對圖像進行分類,數(shù)據(jù)增強有一系列簡單有效的方法可供選擇,有一些機器學習庫來進行計算視覺領(lǐng)域的數(shù)據(jù)增強,比如:imgaug (https://github.com/aleju/imgaug)它封裝了很多數(shù)據(jù)增強算法,給開發(fā)者提供了方便。

計算視覺數(shù)據(jù)增強

計算視覺領(lǐng)域的數(shù)據(jù)增強算法大致可以分為兩類:第一類是基于基本圖像處理技術(shù)技術(shù)的數(shù)據(jù)增強,第二個類別是基于深度學習的數(shù)據(jù)增強算法。下面先介紹基于基本圖像處理技術(shù)的數(shù)據(jù)增強方法:

1、flipping翻轉(zhuǎn) 一般都是水平方向翻轉(zhuǎn)而少用垂直方向,即鏡像變換。圖像數(shù)據(jù)集上證實有用(CIFAR-10,ImageNet等),但無法應用在文本識別數(shù)據(jù)集(MNIST,SVHN等)

2、color space色彩空間 簡單做法是隔離單個色彩通道,例如R,G或B,此外可以通過簡單的矩陣運算以增加或減少圖像的亮度。更高級的做法從顏色直方圖著手,更改這些直方圖中的強度值(想到了圖像處理中的直方圖均衡)。

3、cropping裁剪 分統(tǒng)一裁剪和隨機裁剪。統(tǒng)一裁剪將不同尺寸的圖像裁剪至設定大小,隨機裁剪類似translation,不同之處在于translation保留原圖尺寸而裁剪會降低尺寸。裁剪要注意不要丟失重要信息以至于改變圖像標簽。

4、rotation旋轉(zhuǎn) 要注意旋轉(zhuǎn)度數(shù)。以MNIST為例,輕微旋轉(zhuǎn)(例如1°-20°)可能有用,再往后增加時數(shù)據(jù)標簽可能不再保留。

5、translation位置變換 向左,向右,向上或向下移動圖像可能是非常有用的轉(zhuǎn)換,以避免數(shù)據(jù)中的位置偏差。例如人臉識別數(shù)據(jù)集中人臉基本位于圖像正中,位置變換可以增強模型泛化能力。

6、noise injection添加噪聲 添加高斯分布的隨機矩陣 7、color space transformations色彩空間增強 照明偏差是圖像識別問題中最常見的挑戰(zhàn)之一,因此色彩空間轉(zhuǎn)換(也稱為光度轉(zhuǎn)換)的比較直觀有效。 ①遍歷圖像以恒定值減少或增加像素值(過亮或過暗) ②拼接出(splice out)各個RGB顏色矩陣 ③將像素值限制為某個最小值或最大值 ④操作色彩直方圖以改變圖像色彩空間特征 注意將彩色圖轉(zhuǎn)換黑白雖然簡化了這些操作,但精度會降低 geometric versus photometric transformations幾何與光度轉(zhuǎn)換

1、kernel flters內(nèi)核過濾器 平滑和銳化,即圖像處理中用卷積核滑過整幅圖像的操作。這一點尚未開發(fā),它和CNN中卷積機制非常相似(就一樣啊),因此可以通過調(diào)整網(wǎng)絡參數(shù)更好地改善網(wǎng)絡,而不需要額外進行這樣的數(shù)據(jù)增強操作。

2、mixing images圖像混合 做法是通過平均圖像像素值將圖像混合在一起:

51130fb6-6a45-11ed-8abf-dac502259ad0.jpg

mixing images 研究發(fā)現(xiàn)是當混合來自整個訓練集的圖像而不是僅來自同一類別的實例的圖像時,可以獲得更好的結(jié)果。其它一些做法: ①一種非線性方法將圖像組合成新的訓練實例:

512a9492-6a45-11ed-8abf-dac502259ad0.jpg

非線性方法 ②另一方法是隨機裁剪圖像并將裁剪后的圖像連接在一起以形成新圖像:

514b3274-6a45-11ed-8abf-dac502259ad0.jpg

隨機裁剪再拼接 這類方法從人的視角看毫無意義,但確實提升了精度。可能解釋是數(shù)據(jù)集大小的增加導致了諸如線和邊之類的低級特征的更可靠表示。 3、random erasing隨機擦除 這一點受到dropout正規(guī)化的啟發(fā),隨機擦除迫使模型學習有關(guān)圖像的更多描述性特征,從而防止過擬合某個特定視覺特征。隨機擦除的好處在于可以確保網(wǎng)絡關(guān)注整個圖像,而不只是其中的一部分。最后隨機擦除的一個缺點是不一定會保留標簽(例如文本8->6)。

516a1504-6a45-11ed-8abf-dac502259ad0.jpg

三、新方法

新方法控制數(shù)據(jù)增強的保真度,從而減少有害的錯誤信息。研究者的想法是通過顯著性映射測量圖像中矩形區(qū)域的重要性,并確保數(shù)據(jù)增強后始終呈現(xiàn)得分最高的區(qū)域:對于裁剪,通過避免切割重要區(qū)域(見下圖a5和b5);對于圖像級轉(zhuǎn)換,通過將重要區(qū)域粘貼到轉(zhuǎn)換圖像頂部(參見下圖a6和b6)。

517e008c-6a45-11ed-8abf-dac502259ad0.png

51a5b636-6a45-11ed-8abf-dac502259ad0.png

Eq2:

51b99070-6a45-11ed-8abf-dac502259ad0.png

Eq3:

51ca5f5e-6a45-11ed-8abf-dac502259ad0.png

51d8f6ae-6a45-11ed-8abf-dac502259ad0.png

51ec5e42-6a45-11ed-8abf-dac502259ad0.png

四、實驗

521c0688-6a45-11ed-8abf-dac502259ad0.png

522987f4-6a45-11ed-8abf-dac502259ad0.png

523a09bc-6a45-11ed-8abf-dac502259ad0.png

52594250-6a45-11ed-8abf-dac502259ad0.png

526a106c-6a45-11ed-8abf-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107756
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39769

    瀏覽量

    301372

原文標題:檢測&分類訓練技巧,不是所有的數(shù)據(jù)增強,都可以提升算法精度!

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    圖像采集卡:連接設備與數(shù)據(jù)圖像樞紐

    在機器視覺與圖像傳輸體系中,圖像采集卡是無可替代的重要樞紐——它一端承接相機、內(nèi)窺鏡、攝像機等前端圖像設備的信號輸出,另一端對接后端數(shù)據(jù)處理、存儲、展示系統(tǒng),通過信號轉(zhuǎn)換、同步協(xié)調(diào)、高
    的頭像 發(fā)表于 01-22 13:51 ?228次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設備與<b class='flag-5'>數(shù)據(jù)</b>的<b class='flag-5'>圖像</b>樞紐

    EspeedGrab圖像采集軟件介紹(Cameralink轉(zhuǎn)USB采集)

    自動白平衡處理 7 Bayer還原 Bayer圖像還原彩色處理 8 紅外偽彩 可白熱、黑熱、多種偽彩模式可配置 9 圖像降噪 可設定檔位多幀降噪濾波 10
    發(fā)表于 12-23 17:26

    用于高速成像,科學和太陽蛋白紫外線應用的圖像增強器解決方案

    圖像增強器用于增強低照度圖像,直至單光子的檢測和成像。Photonis 是 Exosens 的一部分,為科學應用 (IIT) 提供各種圖像
    的頭像 發(fā)表于 11-19 07:36 ?196次閱讀
    用于高速成像,科學和太陽蛋白紫外線應用的<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器解決方案

    AI眼鏡視覺處理芯片:從圖像感知到智能增強技術(shù)躍遷

    ,而到2028年,隨著AR功能普及與視覺交互成為標配,出貨量有望逼近4億臺。在這一爆發(fā)性增長背后,視覺處理能力已成為AI眼鏡的核心競爭力,而支撐這一能力的關(guān)鍵,正是日益復雜的視覺處理芯片架構(gòu)。 ? AI眼鏡的視覺處理需求升級:從
    的頭像 發(fā)表于 11-16 01:23 ?1.3w次閱讀
    AI眼鏡視覺<b class='flag-5'>處理</b>芯片:從<b class='flag-5'>圖像</b>感知到智能<b class='flag-5'>增強</b>的<b class='flag-5'>技術(shù)</b>躍遷

    圖像采集卡:機器視覺時代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號到數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機器視覺系統(tǒng)的核心硬件組件,本質(zhì)是通過專用芯片(如FPGA、ASIC)實
    的頭像 發(fā)表于 11-12 15:15 ?623次閱讀
    <b class='flag-5'>圖像</b>采集卡:機器視覺時代的<b class='flag-5'>圖像</b><b class='flag-5'>數(shù)據(jù)</b>核心樞紐

    數(shù)據(jù)處理軟核加速模塊設計

    ,如果用ARM處理器或上位機來實現(xiàn)這個過程會十分耗時,利用FPGA的并行處理技術(shù)可以輕易實現(xiàn)這個功能,整理后的數(shù)據(jù)傳輸形式會為之后的設計產(chǎn)生便利。模塊用了20塊片內(nèi)雙口RAM來實現(xiàn)
    發(fā)表于 10-29 08:09

    基于FPGA的CLAHE圖像增強算法設計

    CLAHE圖像增強算法又稱為對比度有限的自適應直方圖均衡算法,其算法原理是通過有限的調(diào)整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發(fā)表于 10-15 10:14 ?649次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>算法設計

    Photonis圖像增強器:技術(shù)原理、核心優(yōu)勢與應用領(lǐng)域

    Photonis是一家全球領(lǐng)先的光電傳感器與夜視技術(shù)制造商,總部位于荷蘭,專注于高性能圖像增強器、光電倍增管(PMT)和微通道板(MCP)的研發(fā)與生產(chǎn)。其產(chǎn)品廣泛應用于科研、醫(yī)療和工業(yè)領(lǐng)域,尤其在低
    的頭像 發(fā)表于 10-10 09:28 ?565次閱讀
    Photonis<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器:<b class='flag-5'>技術(shù)</b>原理、核心優(yōu)勢與應用領(lǐng)域

    Photonis 科學圖像增強介紹

    對于尋求先進圖像增強技術(shù)增強相機制造商,Photonis 提供具有無與倫比規(guī)格的科學級圖像增強
    的頭像 發(fā)表于 09-19 09:20 ?377次閱讀
    Photonis 科學<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器<b class='flag-5'>介紹</b>

    FPGA 加持,友思特圖像采集卡高速預處理助力視覺系統(tǒng)運行提速增效

    圖像處理圖像處理關(guān)鍵環(huán)節(jié),可優(yōu)化數(shù)據(jù)傳輸、減輕主機負擔,其算法可在FPGA等硬件上執(zhí)行。友思特FPGA
    的頭像 發(fā)表于 08-13 17:41 ?1115次閱讀
    FPGA 加持,友思特<b class='flag-5'>圖像</b>采集卡高速預<b class='flag-5'>處理</b>助力視覺系統(tǒng)運行提速增效

    工業(yè)相機圖像采集卡:技術(shù)剖析、應用場景與未來發(fā)展

    CameraLink、CoaXPress、GigEVision等,高效、穩(wěn)定地將數(shù)據(jù)傳輸?shù)接嬎銠C進行后續(xù)的圖像處理、分析和應用。本文將深入剖析工業(yè)相機圖像采集卡的
    的頭像 發(fā)表于 05-28 13:49 ?782次閱讀
    工業(yè)相機<b class='flag-5'>圖像</b>采集卡:<b class='flag-5'>技術(shù)</b>剖析、應用場景與未來發(fā)展

    基于LockAI視覺識別模塊:C++圖像的基本運算

    圖像處理中,理解圖像的基本操作是掌握計算機視覺技術(shù)的關(guān)鍵。本文章將介紹基于LockAI視覺識別模塊下OpenCV中
    的頭像 發(fā)表于 05-06 16:20 ?708次閱讀
    基于LockAI視覺識別模塊:C++<b class='flag-5'>圖像</b>的基本運算

    龍門吊箱號識別系統(tǒng)的圖像處理技術(shù)解析

    識別系統(tǒng)應運而生,成為提升龍門吊作業(yè)自動化水平的重要解決方案。 核心技術(shù)圖像處理與深度學習的融合 1. 高精度圖像采集 系統(tǒng)采用工業(yè)級高清攝像機,具備寬動態(tài)范圍(HDR)和低照度
    的頭像 發(fā)表于 03-25 10:25 ?724次閱讀

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數(shù)據(jù)手冊

    RZ/A2M MPU設計用于需要高速e-AI圖像處理的智能電器,網(wǎng)絡攝像機,服務機器人,掃描儀產(chǎn)品和工業(yè)機械。它采用獨特的圖像識別和機器視覺混合方法,結(jié)合了專有的DRP
    的頭像 發(fā)表于 03-11 15:54 ?1020次閱讀
    基于嵌入式人工智能的高速<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的微<b class='flag-5'>處理</b>器RZ/A2M<b class='flag-5'>數(shù)據(jù)</b>手冊