91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

12個(gè)常用的圖像數(shù)據(jù)增強(qiáng)技術(shù)總結(jié)

Dbwd_Imgtec ? 來源:DeepHub IMBA ? 作者:Prabowo Yoga Wicaksan ? 2022-10-26 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí)的優(yōu)化首先是對(duì)模型的當(dāng)前狀態(tài)進(jìn)行誤差估計(jì),然后為了減 機(jī)器學(xué)習(xí)深度學(xué)習(xí)模型的訓(xùn)練的目標(biāo)是成為“通用”模型。這就需要模型沒有過度擬合訓(xùn)練數(shù)據(jù)集,或者換句話說,我們的模型對(duì)看不見的數(shù)據(jù)有很好的了解。數(shù)據(jù)增強(qiáng)也是避免過度擬合的眾多方法之一。 擴(kuò)展用于訓(xùn)練模型的數(shù)據(jù)量的過程稱為數(shù)據(jù)增強(qiáng)。通過訓(xùn)練具有多種數(shù)據(jù)類型的模型,我們可以獲得更“泛化”的模型?!岸喾N數(shù)據(jù)類型”是什么意思呢?本篇文章只討論“圖像”數(shù)據(jù)增強(qiáng)技術(shù),只詳細(xì)地介紹各種圖片數(shù)據(jù)增強(qiáng)策略。我們還將使用 PyTorch 動(dòng)手實(shí)踐并實(shí)現(xiàn)圖像數(shù)據(jù)或計(jì)算機(jī)視覺中主要使用的數(shù)據(jù)增強(qiáng)技術(shù)。

f4a51538-54de-11ed-a3b6-dac502259ad0.jpg

因?yàn)榻榻B的是數(shù)據(jù)增強(qiáng)技術(shù)。所以只使用一張圖片就可以了,我們先看看可視話的代碼

import PIL.Image as Image import torch from torchvision import transforms import matplotlib.pyplot as plt import numpy as np import warnings def imshow(img_path, transform): """ Function to show data augmentation Param img_path: path of the image Param transform: data augmentation technique to apply """ img = Image.open(img_path) fig, ax = plt.subplots(1, 2, figsize=(15, 4)) ax[0].set_title(f'Original image {img.size}') ax[0].imshow(img) img = transform(img) ax[1].set_title(f'Transformed image {img.size}') ax[1].imshow(img)Resize/Rescale

此函數(shù)用于將圖像的高度和寬度調(diào)整為我們想要的特定大小。下面的代碼演示了我們想要將圖像從其原始大小調(diào)整為 224 x 224。

path = './kitten.jpeg' transform = transforms.Resize((224, 224)) imshow(path, transform)

f4b74280-54de-11ed-a3b6-dac502259ad0.png

Cropping

該技術(shù)將要選擇的圖像的一部分應(yīng)用于新圖像。例如,使用 CenterCrop 來返回一個(gè)中心裁剪的圖像。

transform = transforms.CenterCrop((224, 224)) imshow(path, transform)

f4cf83fe-54de-11ed-a3b6-dac502259ad0.png

RandomResizedCrop

這種方法同時(shí)結(jié)合了裁剪和調(diào)整大小。

transform = transforms.RandomResizedCrop((100, 300)) imshow(path, transform)

Flipping

水平或垂直翻轉(zhuǎn)圖像,下面代碼將嘗試應(yīng)用水平翻轉(zhuǎn)到我們的圖像。

transform = transforms.RandomHorizontalFlip() imshow(path, transform)

Padding

填充包括在圖像的所有邊緣上按指定的數(shù)量填充。我們將每條邊填充50像素。

transform = transforms.Pad((50,50,50,50)) imshow(path, transform)

f4f65376-54de-11ed-a3b6-dac502259ad0.png

Rotation

對(duì)圖像隨機(jī)施加旋轉(zhuǎn)角度。我們將這個(gè)角設(shè)為15度。

transform = transforms.RandomRotation(15) imshow(path, transform)

f5112598-54de-11ed-a3b6-dac502259ad0.png

Random Affine

這種技術(shù)是一種保持中心不變的變換。這種技術(shù)有一些參數(shù):

degrees:旋轉(zhuǎn)角度

translate:水平和垂直轉(zhuǎn)換

scale:縮放參數(shù)

share:圖片裁剪參數(shù)

fillcolor:圖像外部填充的顏色

transform = transforms.RandomAffine(1, translate=(0.5, 0.5), scale=(1, 1), shear=(1,1), fillcolor=(256,256,256)) imshow(path, transform)

Gaussian Blur

圖像將使用高斯模糊進(jìn)行模糊處理。

transform = transforms.GaussianBlur(7, 3) imshow(path, transform)

f527cd48-54de-11ed-a3b6-dac502259ad0.png

Grayscale

將彩色圖像轉(zhuǎn)換為灰度。

transform = transforms.Grayscale(num_output_channels=3) imshow(path, transform)

f567f7f6-54de-11ed-a3b6-dac502259ad0.png

顏色增強(qiáng),也稱為顏色抖動(dòng),是通過改變圖像的像素值來修改圖像的顏色屬性的過程。下面的方法都是顏色相關(guān)的操作。

Brightness

改變圖像的亮度當(dāng)與原始圖像對(duì)比時(shí),生成的圖像變暗或變亮。

transform = transforms.ColorJitter(brightness=2) imshow(path, transform)

Contrast

圖像最暗和最亮部分之間的區(qū)別程度被稱為對(duì)比度。圖像的對(duì)比度也可以作為增強(qiáng)進(jìn)行調(diào)整。

transform = transforms.ColorJitter(contrast=2) imshow(path, transform)

f58dc1c0-54de-11ed-a3b6-dac502259ad0.png

Saturation

圖片中顏色的分離被定義為飽和度。

transform = transforms.ColorJitter(saturation=20) imshow(path, transform)

f5ad3a00-54de-11ed-a3b6-dac502259ad0.png

Hue

色調(diào)被定義為圖片中顏色的深淺。

transform = transforms.ColorJitter(hue=2) imshow(path, transform)

f5cd9ffc-54de-11ed-a3b6-dac502259ad0.png

總結(jié)

圖像本身的變化將有助于模型對(duì)未見數(shù)據(jù)的泛化,從而不會(huì)對(duì)數(shù)據(jù)進(jìn)行過擬合。以上整理的都是我們常見的數(shù)據(jù)增強(qiáng)技術(shù),torchvision中還包含了很多方法,可以在他的文檔中找到:https://pytorch.org/vision/stable/transforms.html

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:12個(gè)常用的圖像數(shù)據(jù)增強(qiáng)技術(shù)總結(jié)

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像采集卡:連接設(shè)備與數(shù)據(jù)圖像樞紐

    在機(jī)器視覺與圖像傳輸體系中,圖像采集卡是無可替代的重要樞紐——它一端承接相機(jī)、內(nèi)窺鏡、攝像機(jī)等前端圖像設(shè)備的信號(hào)輸出,另一端對(duì)接后端數(shù)據(jù)處理、存儲(chǔ)、展示系統(tǒng),通過信號(hào)轉(zhuǎn)換、同步協(xié)調(diào)、高
    的頭像 發(fā)表于 01-22 13:51 ?245次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設(shè)備與<b class='flag-5'>數(shù)據(jù)</b>的<b class='flag-5'>圖像</b>樞紐

    數(shù)字圖像采集的核心載體——圖像采集卡技術(shù)白皮書

    在工業(yè)自動(dòng)化、醫(yī)療影像、廣電直播、科研成像等領(lǐng)域,圖像采集卡作為連接前端圖像設(shè)備與后端計(jì)算系統(tǒng)的核心硬件,是實(shí)現(xiàn)物理圖像向數(shù)字信號(hào)轉(zhuǎn)化并高效傳輸?shù)年P(guān)鍵樞紐。它解決了原始圖像信號(hào)與計(jì)算機(jī)
    的頭像 發(fā)表于 01-21 16:18 ?227次閱讀
    數(shù)字<b class='flag-5'>圖像</b>采集的核心載體——<b class='flag-5'>圖像</b>采集卡<b class='flag-5'>技術(shù)</b>白皮書

    EspeedGrab圖像采集軟件介紹(Cameralink轉(zhuǎn)USB采集)

    圖像增強(qiáng) 可手動(dòng)、自動(dòng)圖像對(duì)比度增強(qiáng) 12 Gamma曲線 可設(shè)置Gamma映射,增加對(duì)比度或者動(dòng)態(tài)范圍 13
    發(fā)表于 12-23 17:26

    ADC12D1000 12 位超高速模數(shù)轉(zhuǎn)換器(ADC)產(chǎn)品手冊(cè)總結(jié)

    的 LVDS 接口,支持多個(gè)可編程 SPI 這些選項(xiàng)用于促進(jìn)板設(shè)計(jì)和FPGA/ASIC數(shù)據(jù)采集。LVDS輸出兼容以下 IEEE 1596.3-1996,并支持可編程共模電壓。 ADC12D1x00采用帶鉛或無鉛的292針熱增強(qiáng)
    的頭像 發(fā)表于 11-21 15:42 ?779次閱讀
    ADC<b class='flag-5'>12</b>D1000 <b class='flag-5'>12</b> 位超高速模數(shù)轉(zhuǎn)換器(ADC)產(chǎn)品手冊(cè)<b class='flag-5'>總結(jié)</b>

    用于高速成像,科學(xué)和太陽蛋白紫外線應(yīng)用的圖像增強(qiáng)器解決方案

    圖像增強(qiáng)器用于增強(qiáng)低照度圖像,直至單光子的檢測(cè)和成像。Photonis 是 Exosens 的一部分,為科學(xué)應(yīng)用 (IIT) 提供各種圖像
    的頭像 發(fā)表于 11-19 07:36 ?205次閱讀
    用于高速成像,科學(xué)和太陽蛋白紫外線應(yīng)用的<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>器解決方案

    ADC12D500RF 12 位中高速 RF 采樣 ADC 技術(shù)文檔總結(jié)

    12位1.6/1.0 GSPS ADC12D800/500RF是一種射頻采樣GSPS的ADC,可以直接實(shí)現(xiàn) 采樣輸入頻率最高可達(dá)2.7 GHz及以上。ADC12D800/500RF增強(qiáng)
    的頭像 發(fā)表于 11-18 15:15 ?686次閱讀
    ADC<b class='flag-5'>12</b>D500RF <b class='flag-5'>12</b> 位中高速 RF 采樣 ADC <b class='flag-5'>技術(shù)</b>文檔<b class='flag-5'>總結(jié)</b>

    ADC12D1000RF 12 位高采樣率 RF 采樣 ADC 技術(shù)文檔總結(jié)

    12位3.2和2GSPS ADC12D1x00RF是一款射頻采樣GSPS數(shù)字計(jì)算機(jī),可以直接采樣輸入頻率,最高可達(dá)2.7 GHz及以上。ADC12D1x00RF增強(qiáng)了非常大的奈奎斯特區(qū)
    的頭像 發(fā)表于 11-18 15:05 ?747次閱讀
    ADC<b class='flag-5'>12</b>D1000RF <b class='flag-5'>12</b> 位高采樣率 RF 采樣 ADC <b class='flag-5'>技術(shù)</b>文檔<b class='flag-5'>總結(jié)</b>

    圖像采集卡:機(jī)器視覺時(shí)代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號(hào)到數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機(jī)器視覺系統(tǒng)的核心硬件組件,本質(zhì)是通過專用芯片(如FPGA、ASIC)實(shí)
    的頭像 發(fā)表于 11-12 15:15 ?646次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器視覺時(shí)代的<b class='flag-5'>圖像</b><b class='flag-5'>數(shù)據(jù)</b>核心樞紐

    基于FPGA的CLAHE圖像增強(qiáng)算法設(shè)計(jì)

    CLAHE圖像增強(qiáng)算法又稱為對(duì)比度有限的自適應(yīng)直方圖均衡算法,其算法原理是通過有限的調(diào)整圖像局部對(duì)比度來增強(qiáng)有效信號(hào)和抑制噪聲信號(hào)。
    的頭像 發(fā)表于 10-15 10:14 ?663次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>算法設(shè)計(jì)

    Photonis圖像增強(qiáng)器:技術(shù)原理、核心優(yōu)勢(shì)與應(yīng)用領(lǐng)域

    Photonis是一家全球領(lǐng)先的光電傳感器與夜視技術(shù)制造商,總部位于荷蘭,專注于高性能圖像增強(qiáng)器、光電倍增管(PMT)和微通道板(MCP)的研發(fā)與生產(chǎn)。其產(chǎn)品廣泛應(yīng)用于科研、醫(yī)療和工業(yè)領(lǐng)域,尤其在低
    的頭像 發(fā)表于 10-10 09:28 ?592次閱讀
    Photonis<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>器:<b class='flag-5'>技術(shù)</b>原理、核心優(yōu)勢(shì)與應(yīng)用領(lǐng)域

    Photonis 科學(xué)圖像增強(qiáng)器介紹

    對(duì)于尋求先進(jìn)圖像增強(qiáng)技術(shù)增強(qiáng)相機(jī)制造商,Photonis 提供具有無與倫比規(guī)格的科學(xué)級(jí)圖像增強(qiáng)
    的頭像 發(fā)表于 09-19 09:20 ?386次閱讀
    Photonis 科學(xué)<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>器介紹

    常用PromQL查詢案例總結(jié)

    在云原生時(shí)代,Prometheus已經(jīng)成為監(jiān)控領(lǐng)域的事實(shí)標(biāo)準(zhǔn)。作為一名資深運(yùn)維工程師,我見過太多團(tuán)隊(duì)在PromQL查詢上踩坑,也見過太多因?yàn)楸O(jiān)控不到位導(dǎo)致的生產(chǎn)事故。今天分享10個(gè)實(shí)戰(zhàn)中最常用的PromQL查詢案例,每一個(gè)都是血
    的頭像 發(fā)表于 09-18 14:54 ?731次閱讀

    ?TLC59711 12通道16位增強(qiáng)型PWM RGB LED驅(qū)動(dòng)器技術(shù)文檔總結(jié)

    TLC59711是一個(gè) 12 通道恒流灌電流驅(qū)動(dòng)器。每個(gè)輸出通道都有 可單獨(dú)調(diào)節(jié)的電流,具有 65536 PWM 灰度 (GS) 步長(zhǎng)。此外,每個(gè)顏色組可以是 由 128 個(gè)恒流灌電流步長(zhǎng)控制,具有
    的頭像 發(fā)表于 08-29 14:20 ?823次閱讀
    ?TLC59711 <b class='flag-5'>12</b>通道16位<b class='flag-5'>增強(qiáng)</b>型PWM RGB LED驅(qū)動(dòng)器<b class='flag-5'>技術(shù)</b>文檔<b class='flag-5'>總結(jié)</b>

    UCD90124 12軌電源序列器和系統(tǒng)健康監(jiān)測(cè)器技術(shù)總結(jié)

    UCD90124是 12 軌 PMBus/I^2^C 可尋址電源定序器和系統(tǒng)健康監(jiān)視器。該器件集成了一個(gè) 12 位 ADC,用于監(jiān)控多達(dá) 13 個(gè)電源電壓、電流或溫度輸入。26
    的頭像 發(fā)表于 08-19 11:17 ?912次閱讀
    UCD90124 <b class='flag-5'>12</b>軌電源序列器和系統(tǒng)健康監(jiān)測(cè)器<b class='flag-5'>技術(shù)</b><b class='flag-5'>總結(jié)</b>

    CX3顯示RAW12圖像錯(cuò)誤的原因?

    我想通過CX3065從FPGA捕獲MIPI圖像,我可以切換4種分辨率并通過開始捕獲顯示圖像,但片刻之后,我的UVC_App顯示的圖像是錯(cuò)誤的。 我測(cè)試了cx3的Frame Valid和Line
    發(fā)表于 05-16 07:49