91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA視覺(jué)生成式AI的最新進(jìn)展

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-09-09 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Research 發(fā)表 50 多篇論文,介紹 AI 軟件在創(chuàng)意產(chǎn)業(yè)、自動(dòng)駕駛汽車(chē)開(kāi)發(fā)、醫(yī)療和機(jī)器人領(lǐng)域的潛在應(yīng)用。

NVIDIA 的研究人員站在快速發(fā)展的視覺(jué)生成式 AI 領(lǐng)域最前沿,正在開(kāi)發(fā)用于創(chuàng)建和解釋圖像、視頻與 3D 環(huán)境的新技術(shù)。

NVIDIA日前在西雅圖舉行的國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR)上展示 50 多個(gè)此類(lèi)項(xiàng)目成果。其中的兩篇論文(一篇關(guān)于擴(kuò)散模型訓(xùn)練動(dòng)態(tài),另一篇關(guān)于自動(dòng)駕駛汽車(chē)高清地圖)入圍了 CVPR 最佳論文獎(jiǎng)。

NVIDIA 同時(shí)還在 CVPR 自動(dòng)駕駛大型挑戰(zhàn)賽中獲得了大規(guī)模端到端駕駛類(lèi)別第一名。這座重要的里程碑代表 NVIDIA 正在將生成式 AI 全面應(yīng)用于自動(dòng)駕駛模型。NVIDIA 提交的獲獎(jiǎng)作品在全球 450 多件參賽作品中脫穎而出,還獲得了 CVPR 創(chuàng)新獎(jiǎng)。

NVIDIA 在 CVPR 上展示的研究成果包括:一種可輕松定制以描繪特定物體或角色的文本轉(zhuǎn)圖像模型、全新的物體姿態(tài)估計(jì)模型、神經(jīng)輻射場(chǎng)(NeRF)編輯技術(shù)以及一種能夠理解流行語(yǔ)的視覺(jué)語(yǔ)言模型等。另外還展示了介紹汽車(chē)、醫(yī)療和機(jī)器人等行業(yè)的特定領(lǐng)域創(chuàng)新的論文。

這些研究成果都加入了強(qiáng)大的 AI 模型,幫助創(chuàng)作者能夠更快地將其藝術(shù)構(gòu)想變?yōu)楝F(xiàn)實(shí),加快制造業(yè)自主機(jī)器人的訓(xùn)練速度,通過(guò)協(xié)助處理放射學(xué)報(bào)告為醫(yī)療專(zhuān)業(yè)人員提供支持。

NVIDIA 感知與學(xué)習(xí)研究副總裁 Jan Kautz 表示:“人工智能,尤其是生成式人工智能,是一次關(guān)鍵的技術(shù)進(jìn)步。從可以為專(zhuān)業(yè)創(chuàng)作者提供超強(qiáng)助力的強(qiáng)大圖像生成模型,一直擴(kuò)展到可以幫助開(kāi)發(fā)新一代自動(dòng)駕駛汽車(chē)的自動(dòng)駕駛軟件,都將在 CVPR 上呈現(xiàn) NVIDIA Research 如何不斷拓寬技術(shù)邊界?!?/p>

NVIDIA 還在 CVPR 上發(fā)布了 NVIDIA Omniverse Cloud Sensor RTX,這套能實(shí)現(xiàn)物理級(jí)精確傳感器仿真的微服務(wù),從而加速各類(lèi)全自主機(jī)器的開(kāi)發(fā)工作。

無(wú)需微調(diào),JeDi 簡(jiǎn)化自定義圖像生成

擴(kuò)散模型是當(dāng)前基于文本生成圖像的核心方法。使用擴(kuò)散模型的創(chuàng)作者通常以一個(gè)特定的角色或物體為中心,例如圍繞一只動(dòng)畫(huà)老鼠創(chuàng)作一個(gè)故事,或者集思廣益討論一款特定玩具的廣告等。

此前的研究已經(jīng)讓這些創(chuàng)作者能夠通過(guò)微調(diào)(即用戶(hù)在自定義數(shù)據(jù)集上訓(xùn)練模型)對(duì)擴(kuò)散模型的輸出結(jié)果進(jìn)行個(gè)性化處理,使模型能夠?qū)W⒂谔囟ǖ闹黝}。但這一過(guò)程非常耗時(shí),而且不支持普通用戶(hù)使用。

由約翰-霍普金斯大學(xué)(Johns Hopkins University)、豐田工業(yè)大學(xué)芝加哥分校(Toyota Technological Institute at Chicago)和 NVIDIA 研究人員共同撰寫(xiě)的論文《JeDi》提出了一種新的技術(shù),使用戶(hù)只需要使用參考圖像就能在幾秒鐘內(nèi)輕松實(shí)現(xiàn)個(gè)性化的擴(kuò)散模型輸出結(jié)果。研究小組發(fā)現(xiàn)該模型達(dá)到了最先進(jìn)的質(zhì)量水平,明顯優(yōu)于當(dāng)前基于微調(diào)和無(wú)微調(diào)的方法。

JeDi 還可以與檢索增強(qiáng)生成(RAG)相結(jié)合,為品牌產(chǎn)品目錄等數(shù)據(jù)庫(kù)生成特定視覺(jué)效果。

新基礎(chǔ)模型讓姿態(tài)更完美

NVIDIA 研究人員還在 CVPR 上展示了用于物體姿態(tài)估計(jì)和跟蹤的基礎(chǔ)模型 FoundationPose。該模型無(wú)需進(jìn)行微調(diào),即可在推理過(guò)程中即時(shí)應(yīng)用于新的物體。

該模型通過(guò)一小組參考圖像或者物體的 3D 呈現(xiàn)了解物體的形狀,并且在流行的物體姿態(tài)估計(jì)基準(zhǔn)測(cè)試中創(chuàng)下了新紀(jì)錄。在了解物體形狀后,它就可以識(shí)別并跟蹤物體在視頻中的 3D 移動(dòng)和旋轉(zhuǎn)情況,即使在光線(xiàn)條件較差或有視覺(jué)障礙物的復(fù)雜場(chǎng)景中也不受影響。

FoundationPose 可用于工業(yè)應(yīng)用,以幫助自主機(jī)器人識(shí)別和跟蹤與之交互的物體。它還可以用于增強(qiáng)現(xiàn)實(shí)應(yīng)用,使用 AI 模型在實(shí)時(shí)場(chǎng)景上疊加視覺(jué)效果。

NeRFDeformer 轉(zhuǎn)換 3D 場(chǎng)景,

只需一張快照

NeRF 是一種 AI 模型,可以基于在環(huán)境不同位置拍攝的一系列 2D 圖像進(jìn)行 3D 場(chǎng)景渲染。在機(jī)器人等領(lǐng)域,NeRF 可用于生成現(xiàn)實(shí)世界復(fù)雜場(chǎng)景的沉浸式 3D 渲染,例如雜亂無(wú)章的房間或建筑工地等。一旦需要進(jìn)行更改,開(kāi)發(fā)人員就需要手動(dòng)定義場(chǎng)景的轉(zhuǎn)變方式,或者重新制作 NeRF。

伊利諾伊大學(xué)香檳分校(University of Illinois Urbana-Champaign)和 NVIDIA 的研究人員則使用 NeRFDeformer 簡(jiǎn)化了這一過(guò)程。在 CVPR 大會(huì)上展示的這一方法,可以利用單張 RGB-D 圖像成功轉(zhuǎn)換現(xiàn)有的 NeRF。RGB-D 圖像由正常照片與深度圖組合而成,深度圖可以捕捉到場(chǎng)景中每個(gè)物體與攝像機(jī)之間的距離。

VILA 視覺(jué)語(yǔ)言模型獲取圖像

NVIDIA 與麻省理工學(xué)院(MIT)聯(lián)合開(kāi)展的 CVPR 研究項(xiàng)目正在推動(dòng)視覺(jué)語(yǔ)言模型技術(shù)的發(fā)展。視覺(jué)語(yǔ)言模型是一種能夠處理視頻、圖像和文本的生成式 AI 模型。

該研究小組開(kāi)發(fā)的 VILA 是一個(gè)開(kāi)源視覺(jué)語(yǔ)言模型系列。在測(cè)試 AI 模型回答圖像問(wèn)題能力的關(guān)鍵基準(zhǔn)測(cè)試中,VILA 的表現(xiàn)優(yōu)于先前的神經(jīng)網(wǎng)絡(luò)。VILA 獨(dú)特的預(yù)訓(xùn)練流程解鎖了新的模型能力,包括更加深厚的世界知識(shí)、更強(qiáng)大的上下文學(xué)習(xí)能力以及多圖像間的推理能力。

VILA 可以理解流行語(yǔ)并基于多個(gè)圖像或視頻進(jìn)行推理。

VILA 模型系列支持使用 NVIDIA TensorRT-LLM 開(kāi)源程序庫(kù)進(jìn)行推理優(yōu)化,并且可以部署在數(shù)據(jù)中心、工作站甚至邊緣設(shè)備的 NVIDIA GPU 上。

在 NVIDIA 技術(shù)博客和 GitHub 上均可進(jìn)一步了解 VILA。

生成式 AI 助力自動(dòng)駕駛和智慧城市研究

在 NVIDIA 主筆的 CVPR 論文中,關(guān)于自動(dòng)駕駛汽車(chē)研究的論文有十多篇。其他與自動(dòng)駕駛汽車(chē)相關(guān)的重點(diǎn)內(nèi)容包括:

NVIDIA 自動(dòng)駕駛汽車(chē)應(yīng)用研究,贏得 CVPR 自動(dòng)駕駛挑戰(zhàn)賽冠軍并在如下 demo 中進(jìn)行了演示。

NVIDIA AI 研究副總裁 Sanja Fidler 于 6 月 17 日的自動(dòng)駕駛研討會(huì)上發(fā)表關(guān)于視覺(jué)語(yǔ)言模型的演講。

多倫多大學(xué)和 NVIDIA 研究人員共同撰寫(xiě)的論文《在軌跡預(yù)測(cè)中生成和利用在線(xiàn)地圖的不確定性》成為 24 篇入圍 CVPR 最佳論文獎(jiǎng)的論文之一。

此外,在本屆 CVPR 上,NVIDIA 為 AI 城市挑戰(zhàn)賽提供了有史以來(lái)最大的室內(nèi)合成數(shù)據(jù)集,助力研究人員和開(kāi)發(fā)人員推進(jìn)智慧城市與工業(yè)自動(dòng)化解決方案的開(kāi)發(fā)。該挑戰(zhàn)賽的數(shù)據(jù)集使用 NVIDIA Omniverse 生成,這是一個(gè)由 API、SDK 和服務(wù)構(gòu)成的平臺(tái),可幫助開(kāi)發(fā)人員構(gòu)建基于通用場(chǎng)景描述(OpenUSD)的應(yīng)用和工作流。

NVIDIA Research 在全球擁有數(shù)百名科學(xué)家和工程師,專(zhuān)注于 AI、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)、自動(dòng)駕駛汽車(chē)和機(jī)器人等領(lǐng)域的研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5598

    瀏覽量

    109805
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14890

    瀏覽量

    180044
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    1092

原文標(biāo)題:CVPR 2024 | NVIDIA Research 在 CVPR 上展示視覺(jué)生成式 AI 最新進(jìn)展

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA全新開(kāi)放物理AI模型和框架加速人形機(jī)器人開(kāi)發(fā)

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse”重點(diǎn)介紹開(kāi)發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進(jìn)展從根本上變革他們的工作流程。
    的頭像 發(fā)表于 02-06 15:36 ?525次閱讀

    國(guó)芯科技DPNPU新IP產(chǎn)品最新進(jìn)展,單核支持0.5~4.8TOPS靈活算力配置

    國(guó)芯科技DPNPU新IP產(chǎn)品 最新進(jìn)展,單核支持0.5~4.8TOPS 靈活算力配置 ? 電子發(fā)燒友網(wǎng)綜合報(bào)道 國(guó)芯科技發(fā)布公告稱(chēng),其自主研發(fā)的神經(jīng)網(wǎng)絡(luò)處理器DPNPU(Dataflow
    的頭像 發(fā)表于 01-09 09:19 ?1902次閱讀
    國(guó)芯科技DPNPU新IP產(chǎn)品<b class='flag-5'>最新進(jìn)展</b>,單核支持0.5~4.8TOPS靈活算力配置

    使用OpenUSD與NVIDIA Halos構(gòu)建安全物理AI系統(tǒng)

    如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進(jìn)展深入改變他們的工作流。 物理 AI 正從研究實(shí)驗(yàn)室走向現(xiàn)實(shí)世界,為智能機(jī)器人和智能汽車(chē) (如無(wú)人駕駛出租車(chē)) 提供支持,這些系統(tǒng)必須在不可預(yù)測(cè)
    的頭像 發(fā)表于 12-24 10:22 ?738次閱讀

    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最新進(jìn)展

    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的最新進(jìn)展
    的頭像 發(fā)表于 12-19 15:26 ?1527次閱讀
    從協(xié)議到實(shí)踐——EtherNet/IP與NetStaX的<b class='flag-5'>最新進(jìn)展</b>

    芯科科技分享在物聯(lián)網(wǎng)領(lǐng)域的最新進(jìn)展

    Labs(芯科科技)亞太區(qū)業(yè)務(wù)副總裁王祿銘、中國(guó)大陸區(qū)總經(jīng)理周巍及臺(tái)灣區(qū)總經(jīng)理寶陸格就公司技術(shù)路線(xiàn)、產(chǎn)品策略及市場(chǎng)趨勢(shì)回答了媒體提問(wèn)。三位高管?chē)@安全認(rèn)證、無(wú)線(xiàn)連接、邊緣計(jì)算等議題,介紹了公司在物聯(lián)網(wǎng)領(lǐng)域的最新進(jìn)展。
    的頭像 發(fā)表于 11-13 10:48 ?1694次閱讀

    上海光機(jī)所在激光驅(qū)動(dòng)離子加速方面取得新進(jìn)展

    圖1 實(shí)驗(yàn)原理示意圖 近期,中國(guó)科學(xué)院上海光學(xué)精密機(jī)械研究所超強(qiáng)激光科學(xué)與技術(shù)全國(guó)重點(diǎn)實(shí)驗(yàn)室賓建輝研究員團(tuán)隊(duì)在激光驅(qū)動(dòng)離子加速方面取得新進(jìn)展。相關(guān)研究成果分別以“Enhanced proton
    的頭像 發(fā)表于 08-06 09:36 ?626次閱讀
    上海光機(jī)所在激光驅(qū)動(dòng)離子加速方面取得<b class='flag-5'>新進(jìn)展</b>

    使用NVIDIA Cosmos模型提高未來(lái)智能汽車(chē)安全性

    本文是洞悉 Omniverse 系列文章。“洞悉 Omniverse” 重點(diǎn)介紹開(kāi)發(fā)者、3D 從業(yè)者與企業(yè)如何使用 OpenUSD 和 NVIDIA Omniverse 的最新進(jìn)展深入改變他們的工作流。
    的頭像 發(fā)表于 07-14 11:46 ?1177次閱讀

    東風(fēng)汽車(chē)轉(zhuǎn)型突破取得新進(jìn)展

    上半年,東風(fēng)汽車(chē)堅(jiān)定高質(zhì)量發(fā)展步伐,整體銷(xiāo)量逐月回升,經(jīng)營(yíng)質(zhì)量持續(xù)改善,自主品牌和新能源滲透率和收益性進(jìn)一步提升,半年累計(jì)終端銷(xiāo)售汽車(chē)111.6萬(wàn)輛,轉(zhuǎn)型突破取得新進(jìn)展。
    的頭像 發(fā)表于 07-10 15:29 ?919次閱讀

    使用NVIDIA Earth-2生成AI基礎(chǔ)模型革新氣候建模

    NVIDIA 正通過(guò) cBottle(Climate in a Bottle 的簡(jiǎn)稱(chēng))為這項(xiàng)工作帶來(lái)新的突破,這是全球首個(gè)專(zhuān)為以公里尺度分辨率模擬全球氣候而設(shè)計(jì)的生成 AI 基礎(chǔ)模型
    的頭像 發(fā)表于 06-12 15:54 ?1318次閱讀

    英特爾持續(xù)推進(jìn)核心制程和先進(jìn)封裝技術(shù)創(chuàng)新,分享最新進(jìn)展

    近日,在2025英特爾代工大會(huì)上,英特爾展示了多代核心制程和先進(jìn)封裝技術(shù)的最新進(jìn)展,這些突破不僅體現(xiàn)了英特爾在技術(shù)開(kāi)發(fā)領(lǐng)域的持續(xù)創(chuàng)新,也面向客戶(hù)需求提供了更高效、更靈活的解決方案。 在制程技術(shù)方面
    的頭像 發(fā)表于 05-09 11:42 ?880次閱讀
    英特爾持續(xù)推進(jìn)核心制程和先進(jìn)封裝技術(shù)創(chuàng)新,分享<b class='flag-5'>最新進(jìn)展</b>

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們?cè)谖錆h舉辦了Create2025百度AI開(kāi)發(fā)者大會(huì),與全球各地的5000多名開(kāi)發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展。
    的頭像 發(fā)表于 04-30 10:14 ?1347次閱讀

    谷歌Gemini API最新進(jìn)展

    體驗(yàn)的 Live API 的最新進(jìn)展,以及正式面向開(kāi)發(fā)者開(kāi)放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開(kāi)發(fā)者推出了許多不容錯(cuò)過(guò)的重要更新,一起來(lái)看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?1700次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展

    近日,華為公司常務(wù)董事、華為云計(jì)算CEO張平安在華為云生態(tài)大會(huì)2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展——推出基于新型高速總線(xiàn)架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線(xiàn)。
    的頭像 發(fā)表于 04-12 15:09 ?1967次閱讀

    NVIDIA技術(shù)在汽車(chē)領(lǐng)域的最新進(jìn)展

    全球領(lǐng)先汽車(chē)制造商、移動(dòng)出行創(chuàng)新企業(yè)、供應(yīng)商和軟件供應(yīng)商利用 NVIDIA 的加速計(jì)算,實(shí)現(xiàn)從云端到車(chē)端的 AI 應(yīng)用部署。
    的頭像 發(fā)表于 03-25 15:02 ?1393次閱讀

    京東方華燦光電氮化鎵器件的最新進(jìn)展

    日前,京東方華燦的氮化鎵研發(fā)總監(jiān)馬歡應(yīng)半導(dǎo)體在線(xiàn)邀請(qǐng),分享了關(guān)于氮化鎵器件的最新進(jìn)展,引起了行業(yè)的廣泛關(guān)注。隨著全球半導(dǎo)體領(lǐng)域?qū)Ω咝阅?、高效率器件的需求不斷加大,氮化鎵(GaN)技術(shù)逐漸成為新一代電子器件的熱點(diǎn),其優(yōu)越的性能使其在電源轉(zhuǎn)換和射頻應(yīng)用中展現(xiàn)出巨大的潛力。
    的頭像 發(fā)表于 03-13 11:44 ?1722次閱讀