91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

細(xì)粒度圖像識別深度學(xué)習(xí)開源工具庫Hawkeye解析

新機(jī)器視覺 ? 來源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2022-11-06 20:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

細(xì)粒度圖像識別是視覺感知學(xué)習(xí)的重要研究課題,在智能新經(jīng)濟(jì)和工業(yè)互聯(lián)網(wǎng)等方面具有巨大應(yīng)用價(jià)值,且在諸多現(xiàn)實(shí)場景已有廣泛應(yīng)用…… 鑒于當(dāng)前領(lǐng)域內(nèi)尚缺乏該方面的深度學(xué)習(xí)開源工具庫,南京理工大學(xué)魏秀參教授團(tuán)隊(duì)用時(shí)近一年時(shí)間,開發(fā)、打磨、完成了 Hawkeye——細(xì)粒度圖像識別深度學(xué)習(xí)開源工具庫,供相關(guān)領(lǐng)域研究人員和工程師參考使用。本文是對 Hawkeye 的詳細(xì)介紹。

目錄

1. 什么是 Hawkeye 庫

2. Hawkeye 支持的模型及方法

3. 安裝 Hawkeye

4. 使用 Hawkeye 訓(xùn)練模型

1. 什么是 Hawkeye 庫

Hawkeye 是一個(gè)基于 PyTorch 的細(xì)粒度圖像識別深度學(xué)習(xí)工具庫,專為相關(guān)領(lǐng)域研究人員和工程師設(shè)計(jì)。目前,Hawkeye 包含多種代表性范式的細(xì)粒度識別方法,包括 “基于深度濾波器”、“基于注意力機(jī)制”、“基于高階特征交互”、“基于特殊損失函數(shù)”、“基于網(wǎng)絡(luò)數(shù)據(jù)” 以及其他方法。

Hawkeye 項(xiàng)目代碼風(fēng)格良好,結(jié)構(gòu)清晰易讀,可拓展性較強(qiáng)。對于剛接觸細(xì)粒度圖像識別領(lǐng)域的相關(guān)人員而言,Hawkeye 較易上手,便于其理解細(xì)粒度圖像識別的主要流程和代表性方法,同時(shí)也方便在本工具庫上快速實(shí)現(xiàn)自己的算法。此外,我們還給出了庫中各模型的訓(xùn)練示例代碼,自研方法也可按照示例快速適配并添加至 Hawkeye 中。

Hawkeye 開源庫鏈接:https://github.com/Hawkeye-FineGrained/Hawkeye

2. Hawkeye 支持的模型及方法

Hawkeye 目前支持細(xì)粒度圖像識別中主要學(xué)習(xí)范式的共 16 個(gè)模型與方法,具體如下:

基于深度濾波器

S3N (ICCV 2019)

Interp-Parts (CVPR 2020)

ProtoTree (CVPR 2021)

基于注意力機(jī)制

OSME+MAMC (ECCV 2018)

MGE-CNN (ICCV 2019)

APCNN (IEEE TIP 2021)

基于高階特征交互

BCNN (ICCV 2015)

CBCNN (CVPR 2016)

Fast MPN-COV (CVPR 2018)

基于特殊損失函數(shù)

Pairwise Confusion (ECCV 2018)

API-Net (AAAI 2020)

CIN (AAAI 2020)

基于網(wǎng)絡(luò)數(shù)據(jù)

Peer-Learning (ICCV 2021)

其他方法

NTS-Net (ECCV 2018)

CrossX (ICCV 2019)

DCL (CVPR 2019)

3. 安裝 Hawkeye

安裝依賴

使用 conda 或者 pip 安裝相關(guān)依賴:

Python 3.8

PyTorch 1.11.0 or higher

torchvison 0.12.0 or higher

numpy

yacs

tqdm

克隆倉庫:

git clone https://github.com/Hawkeye-FineGrained/Hawkeye.git

cd Hawkeye

準(zhǔn)備數(shù)據(jù)集

首先,下載一個(gè)數(shù)據(jù)集(以 CUB200 為例):

cd Hawkeye/data

wget https://data.caltech.edu/records/65de6-vp158/files/CUB_200_2011.tgz

mkdir bird && tar -xvf CUB_200_2011.tgz -C bird/

我們提供了上述 8 個(gè)數(shù)據(jù)集的 meta-data 文件,能夠匹配庫中的 FGDataset 方便地加載訓(xùn)練集和測試集,訓(xùn)練集和測試集為各個(gè)數(shù)據(jù)集官方提供的劃分。使用不同數(shù)據(jù)集時(shí),只需在實(shí)驗(yàn)的 config 文件中修改 dataset 配置即可,方便切換。

在實(shí)驗(yàn)的 config 文件中修改 dataset 配置,示例如下:

dataset:

name: cub

root_dir: data/bird/CUB_200_2011/images

meta_dir: metadata/cub

4. 使用 Hawkeye 訓(xùn)練模型

對于 Hawkeye 支持的每個(gè)方法,我們均提供了單獨(dú)的訓(xùn)練模板和配置文件。例如訓(xùn)練 APINet 只需一條命令:

python Examples/APINet.py --config configs/APINet.yaml

實(shí)驗(yàn)的參數(shù)都在相應(yīng)的 yaml 文件中,可讀性高、便于修改,如:

experiment:
name: API_res101 2        # 實(shí)驗(yàn)名稱
  log_dir: results/APINet   # 實(shí)驗(yàn)日志、結(jié)果等的輸出目錄
  seed: 42                  # 可以選擇固定的隨機(jī)數(shù)種子
#  resume: results/APINet/API_res101 2/checkpoint_epoch_19.pth    # 可以從訓(xùn)練中斷的 checkpoint 中恢復(fù)訓(xùn)練
dataset:
  name: cub          # 使用 CUB200 數(shù)據(jù)集
  root_dir: data/bird/CUB_200_2011/images   # 數(shù)據(jù)集中圖像放置的路徑
  meta_dir: metadata/cub                  # CUB200 的 metadata 路徑
  n_classes: 10         # 類別數(shù),APINet 需要的數(shù)據(jù)集
  n_samples: 4          # 每個(gè)類別的樣本數(shù)
  batch_size: 24        # 測試時(shí)的批樣本數(shù)
  num_workers: 4      # Dataloader 加載數(shù)據(jù)集的線程數(shù)
  transformer:        # 數(shù)據(jù)增強(qiáng)的參數(shù)配置
    image_size: 224      # 圖像輸入模型的尺寸 224x224
    resize_size: 256    # 圖像增強(qiáng)前縮放的尺寸 256x256
model:
  name: APINet        # 使用 APINet 模型,見 `model/methods/APINet.py`
  num_classes: 200      # 類別數(shù)目
#  load: results/APINet/API_res101 1/best_model.pth     # 可以加載訓(xùn)練過的模型參數(shù)
train:
  cuda: [4]          # 使用的 GPU 設(shè)備 ID 列表,[] 時(shí)使用 CPU
  epoch: 100        # 訓(xùn)練的 epoch 數(shù)量
  save_frequence: 10    # 自動(dòng)保存模型的頻率
#  val_first: False      # 可選是否在訓(xùn)練前進(jìn)行一次模型精度的測試
  optimizer:
    name: Adam        # 使用 Adam 優(yōu)化器
    lr: 0.0001        # 學(xué)習(xí)率為 0.0001
    weight_decay: 0.00000002
  scheduler:
    # 本例使用自定義組合的 scheduler,由 warmup 和余弦退火學(xué)習(xí)率組合而成,見 `Examples/APINet.py`
    name: ''
    T_max: 100        # scheduler 的總迭代次數(shù)
    warmup_epochs: 8    # warmup 的 epoch 數(shù)
    lr_warmup_decay: 0.01  # warmup 衰減的比例
  criterion:
    name: APINetLoss    # APINet 使用的損失函數(shù),見 `model/loss/APINet_loss.py`

實(shí)驗(yàn)的主程序 Examples/APINet.py 中的訓(xùn)練器 APINetTrainer 繼承自 Trainer,不需要再寫復(fù)雜的訓(xùn)練流程、logger、模型保存、配置加載等代碼,只用按需修改部分模塊即可。我們也提供了訓(xùn)練階段的多個(gè) hook 鉤子,可以滿足一些方法特別的實(shí)現(xiàn)方式。

日志文件、模型權(quán)重文件、訓(xùn)練使用的訓(xùn)練代碼以及當(dāng)時(shí)的配置文件都會保存在實(shí)驗(yàn)輸出目錄 log_dir 中,備份配置和訓(xùn)練代碼便于日后對不同實(shí)驗(yàn)進(jìn)行對比。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4968

    瀏覽量

    73960
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5598

    瀏覽量

    124396

原文標(biāo)題:基于PyTorch、易上手,細(xì)粒度圖像識別深度學(xué)習(xí)工具庫Hawkeye開源

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    安防監(jiān)控系統(tǒng)如何實(shí)現(xiàn)AI智能識別

    不可替代的價(jià)值。 一、智能感知:從“像素”到“語義”的跨越 目標(biāo)精準(zhǔn)檢測與分類 系統(tǒng)實(shí)時(shí)識別畫面中的人、車、物等目標(biāo),并細(xì)粒度區(qū)分(如人員/車輛/動(dòng)物、轎車/貨車/非機(jī)動(dòng)車)。在周界防護(hù)場景中,自動(dòng)過濾飛鳥、落葉等干擾源
    的頭像 發(fā)表于 02-02 13:39 ?185次閱讀

    ??低暤\花圖像識別智能系統(tǒng)推動(dòng)水質(zhì)處理精細(xì)化管控

    為了解決這個(gè)痛點(diǎn),海康威視推出礬花圖像識別智能系統(tǒng)——為水處理提質(zhì)增效,告別單一“肉眼判斷”時(shí)代。
    的頭像 發(fā)表于 01-10 16:08 ?2429次閱讀

    深度解析淘寶拍立淘按圖搜索API接口與JSON數(shù)據(jù)示例參考

    引言 淘寶拍立淘是淘寶推出的一項(xiàng)基于圖像識別的搜索功能,用戶可以通過上傳圖片來搜索相似商品。淘寶開放平臺提供了拍立淘按圖搜索API接口,幫助開發(fā)者實(shí)現(xiàn)圖像搜索功能。本文將深度解析淘寶拍
    的頭像 發(fā)表于 11-06 13:43 ?307次閱讀

    大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計(jì)

    DeepSeek-V3 / R1 等模型采用大規(guī)模細(xì)粒度混合專家模型 (MoE) 架構(gòu),大幅提升了開源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)布的開源模型的設(shè)計(jì)原則也采用了類似的大規(guī)模
    的頭像 發(fā)表于 09-06 15:21 ?1225次閱讀
    大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計(jì)

    精準(zhǔn)定位性能瓶頸:深入解析 PaddleOCR v3.2 全新 Benchmark 功能

    v3.2 給出了一個(gè)非常實(shí)用的解決方案——全新的 細(xì)粒度 Benchmark 功能。它不僅能測量端到端的整體速度,還能拆解到每個(gè)模塊、每個(gè)關(guān)鍵方法的耗時(shí),幫你一眼鎖定性能瓶頸。結(jié)果支持控制臺直觀展示,也能導(dǎo)出為 CSV 方便后續(xù)可視化和分析。有了這個(gè)工具,性能
    的頭像 發(fā)表于 09-05 16:02 ?1177次閱讀
    精準(zhǔn)定位性能瓶頸:深入<b class='flag-5'>解析</b> PaddleOCR v3.2 全新 Benchmark 功能

    基于米爾MYC-YM90X安路飛龍DR1開發(fā)板儀表圖像識別系統(tǒng)開發(fā)

    預(yù)處理和特征提取等功能進(jìn)行 FPGA 硬件設(shè)計(jì),生成比特流文件;在 FD 環(huán)境中開發(fā) ARM 側(cè)的應(yīng)用程序,實(shí)現(xiàn)系統(tǒng)整體控制與圖像識別算法的高層執(zhí)行。 2.2.2 驅(qū)動(dòng)與支持 官方提供了豐富
    發(fā)表于 08-17 21:29

    華怡豐推出ISC-B/C系列圖像識別傳感器

    在工業(yè)自動(dòng)化領(lǐng)域,精準(zhǔn)、高效的視覺檢測是提升生產(chǎn)效率的關(guān)鍵。華怡豐全新推出的ISC-B/C系列圖像識別傳感器集高精度定位、測量算法與先進(jìn)圖像處理技術(shù)于一體,為各類工業(yè)場景提供穩(wěn)定、可靠的解決方案!
    的頭像 發(fā)表于 08-15 11:36 ?1712次閱讀
    華怡豐推出ISC-B/C系列<b class='flag-5'>圖像識別</b>傳感器

    Commvault Cloud平臺如何應(yīng)對勒索軟件攻擊

    在之前的文章中,我們探討了可能影響AD小規(guī)模中斷的因素,例如意外刪除對象等,以及為何快速、細(xì)粒度的恢復(fù)至關(guān)重要。
    的頭像 發(fā)表于 07-29 15:07 ?778次閱讀

    火車車號圖像識別系統(tǒng)如何應(yīng)對不同光照條件下的識別問題?

    在鐵路運(yùn)輸管理中,準(zhǔn)確識別火車車號是實(shí)現(xiàn)自動(dòng)化車輛管理的關(guān)鍵環(huán)節(jié)。然而,實(shí)際應(yīng)用場景中復(fù)雜多變的光照條件給車號識別帶來了巨大挑戰(zhàn)?,F(xiàn)代火車車號圖像識別系統(tǒng)通過多項(xiàng)技術(shù)創(chuàng)新,有效解決了這一難題。 多
    的頭像 發(fā)表于 07-15 11:37 ?742次閱讀
    火車車號<b class='flag-5'>圖像識別</b>系統(tǒng)如何應(yīng)對不同光照條件下的<b class='flag-5'>識別</b>問題?

    【高云GW5AT-LV60 開發(fā)套件試用體驗(yàn)】基于開發(fā)板進(jìn)行深度學(xué)習(xí)實(shí)踐,并盡量實(shí)現(xiàn)皮膚病理圖片的識別

    收到開發(fā)板已經(jīng)有一段時(shí)間了,最初申請的時(shí)候?qū)懙氖窍M軌驅(qū)崿F(xiàn)基于fpga的圖像識別相關(guān)的項(xiàng)目,最初對這個(gè)還是有些模糊的,不過這幾天折騰下來,似乎有點(diǎn)思路了,但是畢竟基礎(chǔ)還是有點(diǎn)薄弱,所以廢話不多
    發(fā)表于 06-11 22:35

    【免費(fèi)工具】華秋AI電路識別助手:讓電路設(shè)計(jì)與分析變得輕松高效!

    基于人工智能技術(shù)開發(fā)的微信小程序,通過先進(jìn)的圖像識別技術(shù)和深度學(xué)習(xí)算法,快速準(zhǔn)確識別電路圖中的元件和電路功能,并提供詳細(xì)的分析報(bào)告。無論是原理圖、PCB還是產(chǎn)品實(shí)物,都
    的頭像 發(fā)表于 06-05 18:18 ?2309次閱讀
    【免費(fèi)<b class='flag-5'>工具</b>】華秋AI電路<b class='flag-5'>識別</b>助手:讓電路設(shè)計(jì)與分析變得輕松高效!

    手持終端集裝箱識別系統(tǒng)的圖像識別技術(shù)

    行業(yè)提供了更靈活、精準(zhǔn)的管理工具。 一、技術(shù)核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識別技術(shù),結(jié)合深度學(xué)習(xí)算法,可快速捕捉
    的頭像 發(fā)表于 04-03 10:49 ?723次閱讀

    岸橋箱號識別系統(tǒng)如何工作?揭秘AI圖像識別技術(shù)!

    在港口自動(dòng)化升級的浪潮中,AI岸橋識別系統(tǒng)憑借前沿的圖像識別技術(shù),成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實(shí)現(xiàn)集裝箱信息的精準(zhǔn)捕捉?又是如何通過AI技術(shù)替代傳統(tǒng)人工理貨?讓我們一探
    的頭像 發(fā)表于 04-02 09:45 ?748次閱讀

    【幸狐Omni3576邊緣計(jì)算套件試用體驗(yàn)】RKNN 推理測試與圖像識別

    【幸狐 Omni3576 邊緣計(jì)算套件測評】RKNN 推理測試與圖像識別 本文介紹了幸狐 Omni3576 邊緣計(jì)算套件實(shí)現(xiàn) RKNN 推理和圖像物體識別的測試流程,包括 RKNN 介紹、環(huán)境搭建
    發(fā)表于 03-20 16:14