91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

12個常用的圖像數(shù)據(jù)增強技術總結

穎脈Imgtec ? 2022-11-02 17:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Prabowo Yoga Wicaksana來源:DeepHub IMBA


神經網絡在訓練時的優(yōu)化首先是對模型的當前狀態(tài)進行誤差估計,然后為了減機器學習深度學習模型的訓練的目標是成為“通用”模型。這就需要模型沒有過度擬合訓練數(shù)據(jù)集,或者換句話說,我們的模型對看不見的數(shù)據(jù)有很好的了解。數(shù)據(jù)增強也是避免過度擬合的眾多方法之一。擴展用于訓練模型的數(shù)據(jù)量的過程稱為數(shù)據(jù)增強。通過訓練具有多種數(shù)據(jù)類型的模型,我們可以獲得更“泛化”的模型?!岸喾N數(shù)據(jù)類型”是什么意思呢?本篇文章只討論“圖像”數(shù)據(jù)增強技術,只詳細地介紹各種圖片數(shù)據(jù)增強策略。我們還將使用 PyTorch 動手實踐并實現(xiàn)圖像數(shù)據(jù)或計算機視覺中主要使用的數(shù)據(jù)增強技術。c2491b80-57a8-11ed-b116-dac502259ad0.jpg因為介紹的是數(shù)據(jù)增強技術。所以只使用一張圖片就可以了,我們先看看可視話的代碼?import PIL.Image as Image
import torch
from torchvision import transforms
import matplotlib.pyplot as plt
import numpy as np
import warnings

def imshow(img_path, transform):
"""
Function to show data augmentation
Param img_path: path of the image
Param transform: data augmentation technique to apply
"""
img = Image.open(img_path)
fig, ax = plt.subplots(1, 2, figsize=(15, 4))
ax[0].set_title(f'Original image {img.size}')
ax[0].imshow(img)
img = transform(img)
ax[1].set_title(f'Transformed image {img.size}')
ax[1].imshow(img)Resize/Rescale

此函數(shù)用于將圖像的高度和寬度調整為我們想要的特定大小。下面的代碼演示了我們想要將圖像從其原始大小調整為 224 x 224。

path = './kitten.jpeg'
transform = transforms.Resize((224, 224))
imshow(path, transform)c26e31ae-57a8-11ed-b116-dac502259ad0.png

Cropping

該技術將要選擇的圖像的一部分應用于新圖像。例如,使用 CenterCrop 來返回一個中心裁剪的圖像。transform = transforms.CenterCrop((224, 224))
imshow(path, transform)c27524aa-57a8-11ed-b116-dac502259ad0.png

RandomResizedCrop

這種方法同時結合了裁剪和調整大小。transform = transforms.RandomResizedCrop((100, 300))
imshow(path, transform)

Flipping

水平或垂直翻轉圖像,下面代碼將嘗試應用水平翻轉到我們的圖像。transform = transforms.RandomHorizontalFlip()
imshow(path, transform)

Padding

填充包括在圖像的所有邊緣上按指定的數(shù)量填充。我們將每條邊填充50像素。transform = transforms.Pad((50,50,50,50))
imshow(path, transform)c28a0eb0-57a8-11ed-b116-dac502259ad0.png

Rotation

對圖像隨機施加旋轉角度。我們將這個角設為15度。transform = transforms.RandomRotation(15)
imshow(path, transform)c2a9c552-57a8-11ed-b116-dac502259ad0.png

Random Affine

這種技術是一種保持中心不變的變換。這種技術有一些參數(shù):

degrees:旋轉角度

translate:水平和垂直轉換

scale:縮放參數(shù)

share:圖片裁剪參數(shù)

fillcolor:圖像外部填充的顏色

transform = transforms.RandomAffine(1, translate=(0.5, 0.5), scale=(1, 1), shear=(1,1), fillcolor=(256,256,256))
imshow(path, transform)

Gaussian Blur

圖像將使用高斯模糊進行模糊處理。transform = transforms.GaussianBlur(7, 3)
imshow(path, transform)c2cf7cf2-57a8-11ed-b116-dac502259ad0.png

Grayscale

將彩色圖像轉換為灰度。transform = transforms.Grayscale(num_output_channels=3)
imshow(path, transform)c2ff673c-57a8-11ed-b116-dac502259ad0.png顏色增強,也稱為顏色抖動,是通過改變圖像的像素值來修改圖像的顏色屬性的過程。下面的方法都是顏色相關的操作。

Brightness

改變圖像的亮度當與原始圖像對比時,生成的圖像變暗或變亮。transform = transforms.ColorJitter(brightness=2)
imshow(path, transform)

Contrast

圖像最暗和最亮部分之間的區(qū)別程度被稱為對比度。圖像的對比度也可以作為增強進行調整。transform = transforms.ColorJitter(contrast=2)
imshow(path, transform)c3250776-57a8-11ed-b116-dac502259ad0.png

Saturation

圖片中顏色的分離被定義為飽和度。transform = transforms.ColorJitter(saturation=20)
imshow(path, transform)c3322550-57a8-11ed-b116-dac502259ad0.png

Hue

色調被定義為圖片中顏色的深淺。transform = transforms.ColorJitter(hue=2)
imshow(path, transform)c363152a-57a8-11ed-b116-dac502259ad0.png

總結

圖像本身的變化將有助于模型對未見數(shù)據(jù)的泛化,從而不會對數(shù)據(jù)進行過擬合。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    圖像采集卡:連接設備與數(shù)據(jù)圖像樞紐

    在機器視覺與圖像傳輸體系中,圖像采集卡是無可替代的重要樞紐——它一端承接相機、內窺鏡、攝像機等前端圖像設備的信號輸出,另一端對接后端數(shù)據(jù)處理、存儲、展示系統(tǒng),通過信號轉換、同步協(xié)調、高
    的頭像 發(fā)表于 01-22 13:51 ?252次閱讀
    <b class='flag-5'>圖像</b>采集卡:連接設備與<b class='flag-5'>數(shù)據(jù)</b>的<b class='flag-5'>圖像</b>樞紐

    數(shù)字圖像采集的核心載體——圖像采集卡技術白皮書

    在工業(yè)自動化、醫(yī)療影像、廣電直播、科研成像等領域,圖像采集卡作為連接前端圖像設備與后端計算系統(tǒng)的核心硬件,是實現(xiàn)物理圖像向數(shù)字信號轉化并高效傳輸?shù)年P鍵樞紐。它解決了原始圖像信號與計算機
    的頭像 發(fā)表于 01-21 16:18 ?238次閱讀
    數(shù)字<b class='flag-5'>圖像</b>采集的核心載體——<b class='flag-5'>圖像</b>采集卡<b class='flag-5'>技術</b>白皮書

    EspeedGrab圖像采集軟件介紹(Cameralink轉USB采集)

    圖像增強 可手動、自動圖像對比度增強 12 Gamma曲線 可設置Gamma映射,增加對比度或者動態(tài)范圍 13
    發(fā)表于 12-23 17:26

    ADC12D1000 12 位超高速模數(shù)轉換器(ADC)產品手冊總結

    的 LVDS 接口,支持多個可編程 SPI 這些選項用于促進板設計和FPGA/ASIC數(shù)據(jù)采集。LVDS輸出兼容以下 IEEE 1596.3-1996,并支持可編程共模電壓。 ADC12D1x00采用帶鉛或無鉛的292針熱增強
    的頭像 發(fā)表于 11-21 15:42 ?782次閱讀
    ADC<b class='flag-5'>12</b>D1000 <b class='flag-5'>12</b> 位超高速模數(shù)轉換器(ADC)產品手冊<b class='flag-5'>總結</b>

    用于高速成像,科學和太陽蛋白紫外線應用的圖像增強器解決方案

    圖像增強器用于增強低照度圖像,直至單光子的檢測和成像。Photonis 是 Exosens 的一部分,為科學應用 (IIT) 提供各種圖像
    的頭像 發(fā)表于 11-19 07:36 ?213次閱讀
    用于高速成像,科學和太陽蛋白紫外線應用的<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器解決方案

    ADC12D500RF 12 位中高速 RF 采樣 ADC 技術文檔總結

    12位1.6/1.0 GSPS ADC12D800/500RF是一種射頻采樣GSPS的ADC,可以直接實現(xiàn) 采樣輸入頻率最高可達2.7 GHz及以上。ADC12D800/500RF增強
    的頭像 發(fā)表于 11-18 15:15 ?693次閱讀
    ADC<b class='flag-5'>12</b>D500RF <b class='flag-5'>12</b> 位中高速 RF 采樣 ADC <b class='flag-5'>技術</b>文檔<b class='flag-5'>總結</b>

    ADC12D1000RF 12 位高采樣率 RF 采樣 ADC 技術文檔總結

    12位3.2和2GSPS ADC12D1x00RF是一款射頻采樣GSPS數(shù)字計算機,可以直接采樣輸入頻率,最高可達2.7 GHz及以上。ADC12D1x00RF增強了非常大的奈奎斯特區(qū)
    的頭像 發(fā)表于 11-18 15:05 ?749次閱讀
    ADC<b class='flag-5'>12</b>D1000RF <b class='flag-5'>12</b> 位高采樣率 RF 采樣 ADC <b class='flag-5'>技術</b>文檔<b class='flag-5'>總結</b>

    圖像采集卡:機器視覺時代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術本質:從信號到數(shù)據(jù)的“轉換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機器視覺系統(tǒng)的核心硬件組件,本質是通過專用芯片(如FPGA、ASIC)實
    的頭像 發(fā)表于 11-12 15:15 ?652次閱讀
    <b class='flag-5'>圖像</b>采集卡:機器視覺時代的<b class='flag-5'>圖像</b><b class='flag-5'>數(shù)據(jù)</b>核心樞紐

    基于FPGA的CLAHE圖像增強算法設計

    CLAHE圖像增強算法又稱為對比度有限的自適應直方圖均衡算法,其算法原理是通過有限的調整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發(fā)表于 10-15 10:14 ?666次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>算法設計

    Photonis圖像增強器:技術原理、核心優(yōu)勢與應用領域

    Photonis是一家全球領先的光電傳感器與夜視技術制造商,總部位于荷蘭,專注于高性能圖像增強器、光電倍增管(PMT)和微通道板(MCP)的研發(fā)與生產。其產品廣泛應用于科研、醫(yī)療和工業(yè)領域,尤其在低
    的頭像 發(fā)表于 10-10 09:28 ?611次閱讀
    Photonis<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器:<b class='flag-5'>技術</b>原理、核心優(yōu)勢與應用領域

    Photonis 科學圖像增強器介紹

    對于尋求先進圖像增強技術增強相機制造商,Photonis 提供具有無與倫比規(guī)格的科學級圖像增強
    的頭像 發(fā)表于 09-19 09:20 ?391次閱讀
    Photonis 科學<b class='flag-5'>圖像</b><b class='flag-5'>增強</b>器介紹

    常用PromQL查詢案例總結

    在云原生時代,Prometheus已經成為監(jiān)控領域的事實標準。作為一名資深運維工程師,我見過太多團隊在PromQL查詢上踩坑,也見過太多因為監(jiān)控不到位導致的生產事故。今天分享10實戰(zhàn)中最常用的PromQL查詢案例,每一都是血
    的頭像 發(fā)表于 09-18 14:54 ?733次閱讀

    ?TLC59711 12通道16位增強型PWM RGB LED驅動器技術文檔總結

    TLC59711是一 12 通道恒流灌電流驅動器。每個輸出通道都有 可單獨調節(jié)的電流,具有 65536 PWM 灰度 (GS) 步長。此外,每個顏色組可以是 由 128 恒流灌電流步長控制,具有
    的頭像 發(fā)表于 08-29 14:20 ?830次閱讀
    ?TLC59711 <b class='flag-5'>12</b>通道16位<b class='flag-5'>增強</b>型PWM RGB LED驅動器<b class='flag-5'>技術</b>文檔<b class='flag-5'>總結</b>

    UCD90124 12軌電源序列器和系統(tǒng)健康監(jiān)測器技術總結

    UCD90124是 12 軌 PMBus/I^2^C 可尋址電源定序器和系統(tǒng)健康監(jiān)視器。該器件集成了一 12 位 ADC,用于監(jiān)控多達 13 電源電壓、電流或溫度輸入。26
    的頭像 發(fā)表于 08-19 11:17 ?920次閱讀
    UCD90124 <b class='flag-5'>12</b>軌電源序列器和系統(tǒng)健康監(jiān)測器<b class='flag-5'>技術</b><b class='flag-5'>總結</b>

    CX3顯示RAW12圖像錯誤的原因?

    我想通過CX3065從FPGA捕獲MIPI圖像,我可以切換4種分辨率并通過開始捕獲顯示圖像,但片刻之后,我的UVC_App顯示的圖像是錯誤的。 我測試了cx3的Frame Valid和Line
    發(fā)表于 05-16 07:49