91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 第九屆 Sky Hackathon 優(yōu)秀作品展示 | 靜語畫韻:藝術(shù)中的無聲詩篇

NVIDIA英偉達企業(yè)解決方案 ? 來源:未知 ? 2023-12-21 19:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 第九屆Sky Hackathon 大賽旨在通過 NVIDIA Jetson 平臺和 Microsoft Azure OpenAI 平臺,由 NVIDIA 和 Microsoft 導師精心設計的大模型應用場景,引領(lǐng)參與者領(lǐng)略大模型的應用潛力,以及如何運用人工智能技術(shù)構(gòu)建智能化解決方案。

本次 Hackathon 聚焦在如何在物聯(lián)網(wǎng)設備上構(gòu)建基于大模型的應用解決方案。參與者通過使用 NVIDIA Jetson 平臺,親身體驗了大模型在圖像識別和生成式模型調(diào)用方面的應用。從 Resnet50 模型的優(yōu)化到 TensorRT 推理引擎的生成,每一步都呈現(xiàn)了 NVIDIA Jetson 在深度學習加速方面的卓越性能。

下文供稿自 NVIDIA 第九屆 Sky Hackathon 大賽的冠軍團隊,通過本官方微信公眾號推薦給開發(fā)者朋友們,希望開發(fā)者朋友們能夠積極交流,碰撞出更多創(chuàng)新的火花!

在當前時代,數(shù)字化與人工智能正不斷推動藝術(shù)與技術(shù)的深度融合,開創(chuàng)了全新的創(chuàng)作與體驗方式。來自山東科技大學的團隊(指導老師:王魯昆老師,團隊成員:許金浩、李振宇、王俊豐、紀中華)在最近的NVIDIA 第九屆 Sky Hackathon中以其杰出的作品 Narrative Canvas 奪得冠軍,成為這一趨勢的杰出代表。本文旨在深入分析這個項目的核心理念、技術(shù)創(chuàng)新之處,以及它為藝術(shù)體驗帶來的革命性改變,展示了這個團隊如何在藝術(shù)與技術(shù)交匯的邊界上探索新領(lǐng)域。

項目倉庫:https://github.com/1438802682/NarrativeCanvas

演示視頻:https://www.bilibili.com/video/BV1rc411D7pP/

項目概覽:圖文互動的新紀元

項目介紹

Narrative Canvas 項目的核心,在于“圖生文,文生圖”的相互作用。畫作激發(fā)文字的創(chuàng)作,文字又給畫作賦予了新的生命。這種互動不僅增強了藝術(shù)作品的表現(xiàn)力,也為觀者提供了一種全新的藝術(shù)體驗。在這個過程中,觀者可以看到一個故事從視覺形象轉(zhuǎn)化為文字敘述,再從文字中重新想象出視覺畫面,這是一場視覺與文字的雙重旅行。

wKgZomWEJBqAYkLXAAJKPJ5tsqE270.png

項目流程簡述

  1. 圖像推理:用戶上傳圖片、選擇模型和精度、執(zhí)行推斷,推斷完成后得到處理過的圖片。

  2. 生成故事:基于處理過的圖片,用戶選擇模型、風格、主題和輸入自定義提示詞,完成故事生成。

  3. 生成圖片:根據(jù)故事內(nèi)容,用戶再次選擇模型、風格并輸入自定義提示詞,完成圖像生成。

這個循環(huán)過程創(chuàng)造了一個從視覺到文本再回到視覺的獨特旅程。

wKgZomWEJBqAOK-tAACLmC5jqrI266.png

技術(shù)創(chuàng)新點

使用 NVIDIA Polygraphy

對 ONNX 模型預處理優(yōu)化

該項目的圖片推理部分基于 mmlab 算法庫中的 mmpretrain 預訓練模型,精選了25 個經(jīng)典主干網(wǎng)絡進行圖像分類任務。

(2014)VGG 11
(2015)Inception v3
(2015)ResNet 50
(2017)ResNeXt 50
(2018)SE-ResNet 50
(2018)ShuffleNet v1
(2018)ShuffleNet v2
(2019)Res2Net 50
(2018)MobileNet v2
(2019)MobileNet v3
(2020)RegNet
(2019)EfficientNet
(2021)EfficientNet v2
(2021)Vision Transformer
(2021)Swin Transformer
(2021)Conformer
(2021)Twins
(2021)MobileViT
(2021)CLIP
(2021)DeiT
(2022)DeiT3
(2022)MViT V2
(2022)MobileOne
(2022)EdgeNeXt
(2023)EfficientVit

上下滑動查看更多↑↓

項目團隊使用了 NVIDIA 的 Polygraphy 工具對 ONNX 模型進行了優(yōu)化,移除和合并了多余節(jié)點,如多余的 Transpose 節(jié)點等,這些節(jié)點原本阻礙了 TensorRT 的優(yōu)化。這使得 TensorRT 引擎構(gòu)建更加高效。該團隊將優(yōu)化前后的 ONNX 模型和原始的 pt 權(quán)重都上傳到 Hugging Face。

ONNX 模型優(yōu)化文件下載地址:https://huggingface.co/CtrlX/ModelReady-pretrain/tree/main

優(yōu)化過程包括:

  1. 移除無用節(jié)點:刪除對輸出無影響的節(jié)點。

  2. 合并冗余節(jié)點:將執(zhí)行相似功能的節(jié)點合并。

  3. 優(yōu)化圖結(jié)構(gòu):通過節(jié)點合并和折疊,簡化模型結(jié)構(gòu)。

  4. 提高 TensorRT 兼容性:轉(zhuǎn)換或減少特殊處理的節(jié)點。

  5. 加速推理性能:優(yōu)化后的模型在 TensorRT 中運行更高效。

示例:以 2023 年的最新工作 EfficientVit 為例:

優(yōu)化前的 ONNX 模型:

wKgZomWEJBqAUtMPAABaFYfydwQ614.png

優(yōu)化后的 ONNX 模型:

wKgZomWEJBqAertMAAA4uak33Zs062.png

通過優(yōu)化的日志文件可以看出優(yōu)化后的模型去除了一半以上的冗余節(jié)點,節(jié)點數(shù)量由原來的 1440 減少到了 673,經(jīng)過測試后沒有發(fā)現(xiàn)明顯的精度損失,但是大大提高了引擎的構(gòu)建速度:

wKgZomWEJBqAITOBAABUIEtM6tM046.png

Note:提供 Jetson Xavier NX 平臺的 TensorRT 引擎序列化文件

該項目團隊提供了針對 Jetson Xavier NX 8G 平臺的 TensorRT 引擎序列化文件,以便用戶能夠一鍵下載并在 Jetson Xavier NX 上直接進行推理,從而快速啟動項目。

Jetson Xavier NX 平臺序列化引擎文件下載地址:https://huggingface.co/CtrlX/ModelReady-TRT/tree/main/Jetson-Xavier-NX-8G/engine

NVIDIA TensorRT Dynamic Shape

模式在多圖推理中的應用

在構(gòu)建引擎過程中,該團隊在項目中利用 NVIDIA 的 TensorRT 工具啟用了 Dynamic Shape 功能于批處理維度,支持一次最多處理 8 張圖片,顯著提升了推理效率。

wKgZomWEJBqAamrNAACF1kh5xw0549.png

NVIDIA TensorRT實現(xiàn)

推理精度多元選擇機制:fp32/fp16/int8

該項目提供了構(gòu)建不同精度引擎的代碼,允許用戶根據(jù)需要在精度和速度之間做出選擇。

默認情況下,TensorRT 以 32 位精度 (fp32) 工作,但也支持 16 位浮點 (fp16) 和 8 位量化浮點 (int8) 執(zhí)行操作。使用較低精度能減少內(nèi)存需求并加快計算速度。盡管 fp16 和 fp32 的使用相對簡單,使用 int8 則涉及更多復雜性。有關(guān) int8 的更多詳情,請參見 INT8 章節(jié)。

wKgZomWEJBqAEC9JAACo4AP8EnQ453.png

NVIDIA TensorRT:

啟用 INT8 PTQ 量化加速推理機制

該項目通過使用 NVIDIA TensorRT 實現(xiàn)了 INT8 精度量化 (Post-Training Quantization, PTQ) 來加速推理。構(gòu)建 INT8 引擎的步驟包括:

  1. 構(gòu)建 32 位引擎,運行校準集,記錄每個張量激活值分布的直方圖。

  2. 根據(jù)直方圖創(chuàng)建校準表,為每個張量提供標度值。

  3. 使用校準表和網(wǎng)絡定義構(gòu)建 INT8 引擎。

校準過程可能較慢,因此校準表的輸出可以被緩存并重復使用,尤其適用于同一平臺上重復構(gòu)建相同網(wǎng)絡的情況。

該項目提供了基于 ImageNet 1K val 數(shù)據(jù)集中 510 張圖片的 INT8 Cache(校準表),使用 dynamic shape([batch, 3, 224, 224],batch 維度 1-8,opt=4)模式迭代 120 次。

針對 Xavier NX8G 平臺,該團隊測試了 10 種主流模型的 INT8 Cache 文件,由于時間限制未能覆蓋全部 25 個模型,但提供了優(yōu)化后的 ONNX 模型文件,可供后續(xù)測試。

ImageNet1k INT8 Cache 文件下載地址:https://huggingface.co/CtrlX/ModelReady-TRT/tree/main/Jetson-Xavier-NX-8G/int8Cache

Note:Dynamic Shape 模式與 INT8 PTQ

要在具有動態(tài)形狀的網(wǎng)絡上運行 INT8 校準,需設置校準優(yōu)化配置文件,使用配置文件的 kOPT 值進行校準,且校準輸入數(shù)據(jù)大小必須與配置文件匹配。

創(chuàng)建校準優(yōu)化配置文件的示例代碼如下:

wKgZomWEJBuAAo9kAACFQjs2uXs134.png

Note:雙模式 INT8 量化策略

該項目為不同類型的主干網(wǎng)絡提供了兩種 INT8 量化策略:

  1. trt.IInt8MinMaxCalibrator

    這種方法選擇張量的比例因子以優(yōu)化量化張量的信息論內(nèi)容,通常會抑制分布中的異常值。這是目前推薦的熵校準器,也是 DLA 所必需的。校準通常在層融合之前進行,校準批量大小可能會影響結(jié)果。推薦用于基于 CNN 的網(wǎng)絡。

  2. trt.IInt8EntropyCalibrator2

    這個校準器使用激活分布的整個范圍來確定比例因子,似乎更適合于 NLP 任務。校準一般在層融合之前進行。推薦用于 NVIDIA BERT(Google 官方實現(xiàn)的優(yōu)化版本)等網(wǎng)絡。

NVIDIA TensorRT:

Timing Cache 優(yōu)化加速引擎構(gòu)建

項目團隊通過在 NVIDIA TensorRT 中開啟 Timing Cache 優(yōu)化了神經(jīng)網(wǎng)絡模型的引擎構(gòu)建過程。這種方法利用了模型中重復的 layer,記錄下算子的優(yōu)化結(jié)果。當再次遇到相同的算子時,系統(tǒng)會直接使用優(yōu)選結(jié)果,而非重新評估所有可行的 kernel,從而加速構(gòu)建過程。

Timing Cache 文件下載地址:

https://huggingface.co/CtrlX/ModelReady-TRT/tree/main/Jetson-Xavier-NX-8G/int8Cache

下面借用了 TensorRT cookbook 中的一個示例展示 Timing Cache 的加速效果:

開啟了 Timing Cache 前的日志信息:

wKgZomWEJBuAdrmiAAIkzuuj-4U092.png

開啟了 Timing Cache 后的日志信息:

wKgZomWEJBuAeLetAAEjxuUyOX4122.png

日志信息顯示,通過 Timing Cache,多次測試被跳過,TensorRT 直接在 Cache 中找到了最快的算法。經(jīng)過測試的時間顯示:

  • 未啟用 Timing Cache:1707.987785 ms

  • 初次啟用 Timing Cache:774.889298 ms

  • 后續(xù)使用 Timing Cache:32.098293 ms

以下是該項目中與 Timing Cache 相關(guān)的 Build 代碼(models/Build.py)部分,團隊還提供了 Timing Cache 融合接口的多種優(yōu)化方式:

wKgZomWEJBuAJEEKAAESx5Q9W7c038.png

NVIDIA NeMo Guardrails:

增強 LLM 應用的可編程護欄工具

項目在生成故事部分使用了 NeMo Guardrails,以防止大模型輸出的敏感內(nèi)容被用戶接收。這為 LLM 服務提供了多種護欄類型,如輸入護欄、對話護欄、檢索護欄等。同時,項目提供了使用 Colang 編寫的 NeMo Guardrails 示例。

(位于 models/configurations.py )

wKgZomWEJBuAYMAoAACHi6z0jCk736.png

NeMo Guardrails 為 LLM 服務提供五種主要護欄類型:

  1. 輸入護欄(Input Rails):應用于用戶輸入,可能拒絕或更改輸入。

  2. 對話護欄(Dialog Rails):影響 LLM 的提示方式,操作規(guī)范消息并決定是否執(zhí)行某些操作。

  3. 檢索護欄(Retrieval Rails):應用于 RAG 場景下檢索的內(nèi)容,可能拒絕或更改相關(guān)塊。

  4. 執(zhí)行護欄(Execution Rails):應用于需要自定義操作的輸入/輸出。

  5. 輸出護欄(Output Rails):應用于 LLM 生成的輸出,可能拒絕或更改輸出。

wKgZomWEJBuAFrEUAABBRBwAEsg556.png

示例 Colang 配置:

wKgZomWEJByAUxvjAAAf52bkwZ0614.png

在項目的 models/Generater 中的 AzureChatBot 類中,護欄被用作 Azure OpenAI gpt-3.5-turbo 服務的一部分。

wKgZomWEJByALR3bAAChngLa_Wk758.png

項目架構(gòu)

UI 設計原型圖 wKgZomWEJByAKWvmAABdc9pdlBc340.png

項目結(jié)構(gòu)圖

wKgZomWEJByAbu0IAAEJ79fDhe0321.png

項目流程圖

wKgZomWEJByAezfUAAD6Rt1E9SY290.png

*本文中圖片來源于山東科技大學的團隊,若您有任何疑問或需要使用本文中圖片,請聯(lián)系山東科技大學的團隊

點擊“閱讀原文”掃描海報二維碼,鎖定北京時間 1 月 9 日 (星期二) 凌晨 0 點舉行的線上 NVIDIA CES 2024 特別演講。


原文標題:NVIDIA 第九屆 Sky Hackathon 優(yōu)秀作品展示 | 靜語畫韻:藝術(shù)中的無聲詩篇

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99279

原文標題:NVIDIA 第九屆 Sky Hackathon 優(yōu)秀作品展示 | 靜語畫韻:藝術(shù)中的無聲詩篇

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    抒微智能Surertech受邀參展?第九屆世界無人機大會(深圳)

    抒微智能Surertech受邀參展?第九屆世界無人機大會(深圳)
    的頭像 發(fā)表于 02-03 11:40 ?383次閱讀
    抒微智能Surertech受邀參展?<b class='flag-5'>第九屆</b>世界無人機大會(深圳)

    東軟載波榮獲第九屆“智光杯”智能照明十佳案例示范獎

    2026年1月21日,第九屆物聯(lián)網(wǎng)照明大會暨“智光杯”優(yōu)秀會員典禮于上海隆重啟幕。
    的頭像 發(fā)表于 01-27 13:56 ?253次閱讀

    博聯(lián)智能榮膺第九屆物聯(lián)網(wǎng)照明大會“智光杯”大獎

    近日,第九屆物聯(lián)網(wǎng)照明大會暨“智光杯”優(yōu)秀會員典禮在上海成功舉辦。博聯(lián)智能(BroadLink)榮膺大會頒發(fā)的 “智能跨界優(yōu)秀企業(yè)” 稱號。這一獎項,正是行業(yè)對其以開放技術(shù)打破生態(tài)壁壘、持續(xù)推動智能家居產(chǎn)業(yè)走向無界融合的實踐與實
    的頭像 發(fā)表于 01-26 16:00 ?599次閱讀

    必易微榮獲第九屆“智光杯”雙項大獎

    2026年1月21日,第九屆物聯(lián)網(wǎng)照明大會暨“智光杯”優(yōu)秀會員典禮于上海隆重舉行。必易微憑借在智能照明領(lǐng)域深厚的技術(shù)積累、卓越的產(chǎn)品性能以及穩(wěn)定可靠的供應鏈服務,一舉榮獲“智能照明優(yōu)秀產(chǎn)品創(chuàng)新成果獎”與“智能照明
    的頭像 發(fā)表于 01-23 15:04 ?311次閱讀
    必易微榮獲<b class='flag-5'>第九屆</b>“智光杯”雙項大獎

    第九屆集創(chuàng)賽全國總決賽“法動杯”圓滿收官

    第九屆全國大學生集成電路創(chuàng)新創(chuàng)業(yè)大賽全國總決賽“法動杯”取得圓滿成功!
    的頭像 發(fā)表于 09-19 16:55 ?1083次閱讀

    第九屆集創(chuàng)賽全國總決賽“紫光同創(chuàng)杯”圓滿落幕

    近日,第九屆全國大學生集成電路創(chuàng)新創(chuàng)業(yè)大賽(簡稱“第九屆集創(chuàng)賽”)全國總決賽在上海臨港圓滿落幕。第九屆集創(chuàng)賽覆蓋集成電路全產(chǎn)業(yè)鏈,報名隊伍超過7400支,參賽師生逾20000人,參與高校500余家,賽事規(guī)模和影響力再創(chuàng)新高!
    的頭像 發(fā)表于 09-04 15:20 ?1914次閱讀

    第九屆集創(chuàng)賽“法動杯”全國總決賽隆重舉行

    第九屆集創(chuàng)賽“法動杯”全國總決賽于8月22日在上海臨港隆重舉行。法動科技祝大賽取得圓滿成功!
    的頭像 發(fā)表于 08-26 09:59 ?1229次閱讀

    第12NVIDIA Sky Hackathon精彩回顧

    作為 NVIDIA 開發(fā)者社區(qū)的年度技術(shù)盛事,第 12 Sky Hackathon 剛剛落下帷幕,但其帶來的技術(shù)創(chuàng)新浪潮卻遠未結(jié)束。42 支優(yōu)秀
    的頭像 發(fā)表于 08-05 16:26 ?1102次閱讀

    第九屆集創(chuàng)賽“法動杯”燃爆七大賽區(qū)

    盛夏創(chuàng)新熱潮涌動,“法動杯”燃爆集創(chuàng)賽七大賽區(qū)。第九屆全國大學生集成電路創(chuàng)新創(chuàng)業(yè)大賽(簡稱“集創(chuàng)賽”)正如火如荼進行,集創(chuàng)賽七大分賽區(qū)決賽已全面啟動。
    的頭像 發(fā)表于 07-23 16:45 ?1477次閱讀

    零距離·芯方案|杰和科技亮相RKDC 2025第九屆瑞芯微開發(fā)者大會

    第九屆瑞芯微開發(fā)者大會AIoT產(chǎn)品矩陣集中發(fā)布2025年7月17日,第九屆瑞芯微開發(fā)者大會(RKDC!2025)在福州隆重開幕。本屆大會以“AIoT模型創(chuàng)新重做產(chǎn)品”
    的頭像 發(fā)表于 07-21 10:03 ?1513次閱讀
    零距離·芯方案|杰和科技亮相RKDC 2025<b class='flag-5'>第九屆</b>瑞芯微開發(fā)者大會

    靈眸科技邀您相約第九屆瑞芯微開發(fā)者大會

    第九屆瑞芯微開發(fā)者大會將于7 月 17-18 日在福州海峽國際會展中心盛大開幕!
    的頭像 發(fā)表于 07-17 14:16 ?1339次閱讀

    邊緣計算×硬核產(chǎn)品 杰和科技即將亮相第九屆瑞芯微開發(fā)者大會

    第九屆瑞芯微開發(fā)者大會將于今年7月17–18日在福州舉行,杰和科技將攜多款基于瑞芯微處理器的解決方案亮相大會
    的頭像 發(fā)表于 07-10 09:12 ?642次閱讀
    邊緣計算×硬核產(chǎn)品 杰和科技即將亮相<b class='flag-5'>第九屆</b>瑞芯微開發(fā)者大會

    青銅劍技術(shù)亮相第九屆電氣化交通前沿技術(shù)論壇

    此前,5月22-24日,第九屆電氣化交通前沿技術(shù)論壇在秦皇島成功舉辦。青銅劍技術(shù)攜功率器件驅(qū)動整體解決方案精彩亮相,全面展示了公司在驅(qū)動領(lǐng)域的技術(shù)優(yōu)勢與創(chuàng)新成果,成為現(xiàn)場關(guān)注的焦點。
    的頭像 發(fā)表于 05-28 18:10 ?1035次閱讀

    NVIDIA Sky Hackathon即將再度起航

    NVIDIA Sky Hackathon 即將再度啟航!本次主題將以“構(gòu)建 MCP 多模態(tài)創(chuàng)新智能體助理”為主題,融合了微軟 Reactor 社區(qū)的創(chuàng)新基因,聚焦兩大前沿命題:“MCP 多模態(tài)智能體
    的頭像 發(fā)表于 05-15 10:39 ?910次閱讀

    第九屆華為ICT大賽中國總決賽圓滿落幕

    近日,第九屆華為ICT大賽中國總決賽頒獎典禮在南京東南大學龍湖校區(qū)圓滿落幕。此次大賽由華為與東南大學聯(lián)合舉辦,期間同步舉辦ICT人才發(fā)展高峰論壇、創(chuàng)新賽、編程賽等系列活動和比賽。頒獎典禮上揭曉了
    的頭像 發(fā)表于 04-03 14:16 ?1174次閱讀