91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達發(fā)布視頻AI大模型論文,自動駕駛是其潛在應用領域

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-04-23 00:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,英偉達與慕尼黑大學等院校的研究人員聯(lián)合發(fā)布了一篇有關視頻潛在擴散模型(VideoLDM,Latent Diffusion Model)的論文,該模型能夠?qū)⑽谋巨D(zhuǎn)換成視頻,實現(xiàn)高分辨率的長視頻合成。

研究人員指出,該模型其中一大具有潛力的應用領域,是駕駛數(shù)據(jù)的高分辨率視頻合成,能夠模擬特定駕駛場景,在自動駕駛領域中具有巨大的應用潛力。

AI大模型在自動駕駛領域的應用探索

當下,文字大模型、文生圖大模型發(fā)展迅速,受限于視頻訓練數(shù)據(jù)的計算成本高昂以及缺乏大規(guī)模公開可用的數(shù)據(jù)集等原因,視頻大模型的發(fā)展相對較慢。VideoLDM則成功解決了這個關鍵問題。

從原理上來分析,VideoLDM基于圖像數(shù)據(jù)集預訓練,并在此基礎上加入時間維度以形成視頻框架,最后在編碼的視頻序列上進行微調(diào),得到視頻生成器。

目前,VideoLDM生成視頻的最高分辨率可達2048×1280、24幀。在論文中,該研究團隊給出了幾個駕駛場景視頻的生成案例:

pYYBAGRCZSOAQuZdAAfWNjkpXd4563.png

在自動駕駛領域,AI大模型被認為能夠賦能感知標注、決策推理等環(huán)節(jié)。今年4月11日,毫末智行了一款自動駕駛生成式大模型DriveGPT,中文名雪湖·海若。據(jù)介紹,毫末DriveGPT雪湖·海若現(xiàn)階段主要用于解決自動駕駛的認知決策問題。

DriveGPT雪湖·海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預訓練大模型,與ChatGPT使用自然語言進行輸入與輸出有所不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動駕駛場景文本序列,即將自動駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預測以及決策邏輯鏈的輸出等任務。

毫末表示,DriveGPT雪湖·海若首發(fā)車型新摩卡DHT-PHEV,即將量產(chǎn)上市。DriveGPT雪湖·海若可以逐步應用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。

汽車是AI大模型一大重要應用場景

隨著眾多AI大模型的發(fā)展,其商業(yè)應用場景也引起諸多思考,其中汽車被認為是其中一大重要的應用場景。最近,百度、阿里、商湯發(fā)布AI大模型,都在汽車智能方面展示出能力。

3月16日,百度正式發(fā)布文心一言,在發(fā)布會上,李彥宏展示了文心一言在文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。

其中在多模態(tài)生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。李彥宏表示,多模態(tài)是生成式AI一個明確的發(fā)展趨勢。未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強,文心一言的多模態(tài)生成能力會不斷提升。

文心一言發(fā)布之后,長安汽車官宣,旗下逸達將成為國內(nèi)首款搭載文心一言的量產(chǎn)車型,后續(xù)將通過軟件升級的形式搭載到新車上。除了長安汽車外,集度、吉利、嵐圖、紅旗、長城、東風日產(chǎn)、愛馳、零跑、海馬等多家車企都已確認將內(nèi)測體驗并接入其相關能力,與百度共同打造針對汽車智能場景的大模型人工智能交互體驗。

4月11日,阿里也正式發(fā)布其AI大模型通義千問。與文心一言、ChatGPT類似,作為大語言模型,通義千問支持多輪交互及復雜指令理解、多模態(tài)融合以及外部增強API,能夠?qū)崿F(xiàn)多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等功能。

在近日第二十屆上海國際汽車工業(yè)展覽會上,阿里集團副總裁、斑馬智行CEO張春暉談到,汽車是大模型最大的交互應用場景,智能汽車操作系統(tǒng)將會被重塑。他表示,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試,相關技術會率先在智己汽車上落地。

商湯科技推出的“日日新SenseNova”大模型體系,含中文語言大模型應用平臺“商量SenseChat”、圖片生成模型“秒畫SenseMirage”、AI數(shù)字人視頻生成平臺“如影SenseAvatar”、3D內(nèi)容生成平臺“瓊宇SenseSpace”和“格物SenseThings”等,

在此次展會上,商湯科技展示了其大模型在車艙智能化方面的實力,商湯語言大模型“商量SenseChat”會與嘉賓交流互動,并推薦個性化體驗內(nèi)容。商量SenseChat還支持郵件模式,會自動提煉郵件關鍵信息,幫助用戶節(jié)省閱讀時間?!懊氘婼enseMirage”文生圖創(chuàng)作平臺亦首次與展示艙結(jié)合,借助商湯AIGC模型能力自動為嘉賓生成各種風格的照片。

在“日日新SenseNova”大模型體系的支持,其自動駕駛產(chǎn)品方案也獲得持續(xù)創(chuàng)新的能力。商湯絕影率先實現(xiàn)BEV感知在國內(nèi)首批量產(chǎn)落地,還首創(chuàng)自動駕駛GOP感知體系,充分提升數(shù)據(jù)利用效率,引領感知技術突破。

商湯絕影的自動駕駛GOP感知體系可將目標數(shù)據(jù)獲取的人力成本降低94%,目前已投入量產(chǎn)。憑借通用視覺模型,絕影有效實現(xiàn)了對超過3000種物體目標的高精度識別,降低智能駕駛系統(tǒng)對激光雷達和高精度地圖的依賴。

小結(jié)

今年以來,AI大模型的發(fā)展如火如荼,國內(nèi)外眾多科技企業(yè)紛紛入局。隨著各種AI大模型陸續(xù)發(fā)布,其商業(yè)應用場景也引起業(yè)界關注,而汽車被認為是其中一大重要的應用場景。

從目前的情況來看,百度、阿里發(fā)布的AI大模型已經(jīng)在推進汽車領域的應用。不過當前主要還是在智能座艙方面,用于人工智能交流對話等領域,在自動駕駛方面的應用少有提及。估計原因在于,雖然其AI大模型都具有視頻生成能力,但這方面的能力還有待升級。就如李彥宏在發(fā)布會上就提到,視頻生成能力方面,因為成本較高,現(xiàn)階段還未對所有用戶開放,當然未來會逐步接入。

可以看到,AI大模型在汽車的智能座艙、自動駕駛等領域都將有所作為,業(yè)界也正在推進AI大模型加速上車,預計在智能座艙方面會率先落地,而在自動駕駛方面還需要在視頻能力方面有更多突破。而英偉達此次發(fā)布視頻模型論文,可能會起到一定的引領作用。



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99193
  • 自動駕駛
    +關注

    關注

    793

    文章

    14883

    瀏覽量

    179900
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何構建適合自動駕駛的世界模型?

    [首發(fā)于智駕最前沿微信公眾號]世界模型經(jīng)歷了系統(tǒng)動力學階段(1960年~2000年)、認知科學階段(2001年~2017年)、深度學習階段(2018年至今),但將其應用到自動駕駛汽車上,還是近幾年才
    的頭像 發(fā)表于 02-18 08:14 ?1w次閱讀
    如何構建適合<b class='flag-5'>自動駕駛</b>的世界<b class='flag-5'>模型</b>?

    黃仁勛:未來十年很多汽車是自動駕駛 英偉發(fā)布Alpamayo汽車大模型平臺

    最看好的AI落地場景就是自動駕駛。在演講中黃仁勛提到,未來十年,世界上很大一部分汽車將是自動駕駛或高度自動駕駛的。你期待嗎? 英偉
    的頭像 發(fā)表于 01-06 11:45 ?1094次閱讀

    世界模型是讓自動駕駛汽車理解世界還是預測未來?

    ? [首發(fā)于智駕最前沿微信公眾號]世界模型自動駕駛技術中已有廣泛應用。但當談及它對自動駕駛的作用時,難免會出現(xiàn)分歧。它到底是讓自動駕駛汽車得以理解世界,還是為
    的頭像 發(fā)表于 12-16 09:27 ?873次閱讀
    世界<b class='flag-5'>模型</b>是讓<b class='flag-5'>自動駕駛</b>汽車理解世界還是預測未來?

    今日看點:象帝先推出首款量產(chǎn)Imagination DXD GPU顯卡;小米汽車累計交付突破 50 萬臺

    英偉發(fā)布專注于自動駕駛的視覺語言動作模型 近日,英偉
    發(fā)表于 12-02 10:24 ?1066次閱讀

    模型中常提的快慢思考會對自動駕駛產(chǎn)生什么影響?

    2024年7月,理想汽車發(fā)布的基于端到端模型、VLM視覺語言模型和世界模型的全新自動駕駛技術架構標志著
    的頭像 發(fā)表于 11-22 10:59 ?2504次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會對<b class='flag-5'>自動駕駛</b>產(chǎn)生什么影響?

    西井科技端到端自動駕駛模型獲得國際認可

    近日,西井科技AI創(chuàng)研團隊在國際權威自動駕駛算法榜單NAVSIM v2中脫穎而出,憑借創(chuàng)新的端到端自動駕駛模型,以綜合得分48.759的成績榮登榜單全球第二位,并在多個關鍵安全指標上取
    的頭像 發(fā)表于 10-15 17:20 ?1286次閱讀

    小鵬汽車在全球AI頂會展示下一代自動駕駛模型

    Driving),與Waymo、英偉、加利福尼亞大學洛杉磯分校(UCLA)、圖賓根大學(University of Tuebingen)等來自工業(yè)界和學術界的自動駕駛同行共同探討業(yè)界最新A
    的頭像 發(fā)表于 06-23 09:13 ?1157次閱讀

    從游戲到智能駕駛,英偉有哪些技術升級?

    [首發(fā)于智駕最前沿微信公眾號]在2025年國際消費電子展(CES 2025)上,英偉重磅發(fā)布最新一代車規(guī)級自動駕駛芯片“Thor”,并
    的頭像 發(fā)表于 05-16 09:02 ?998次閱讀
    從游戲到智能<b class='flag-5'>駕駛</b>,<b class='flag-5'>英偉</b><b class='flag-5'>達</b>有哪些技術升級?

    新能源車軟件單元測試深度解析:自動駕駛系統(tǒng)視角

    ? AWS RoboMaker等云平臺支持萬級測試用例的并行執(zhí)行。某自動駕駛初創(chuàng)企業(yè)利用云端GPU集群,將AI模型單元測試時間從3周縮短至6小時。 ?標準體系演進? UL 4600標準要求單元測試需證明
    發(fā)表于 05-12 15:59

    劉強東,進軍汽車領域# 京東# 自動駕駛# 自動駕駛出租車# 京東自動駕駛快遞車

    自動駕駛
    jf_15747056
    發(fā)布于 :2025年05月09日 17:44:10

    AI將如何改變自動駕駛?

    [首發(fā)于智駕最前沿微信公眾號]五一假期繼續(xù)閑聊一下,還歡迎大家隨意留言,隨著人工智能(AI)的發(fā)展,很多車企及自動駕駛供應商正嘗試將AI融入自動駕駛系統(tǒng),為何大家都在積極推動這一技術?
    的頭像 發(fā)表于 05-04 09:58 ?842次閱讀

    模型如何推動自動駕駛技術革新?

    [首發(fā)于智駕最前沿微信公眾號]近年來,人工智能技術正以前所未有的速度在各個領域滲透與應用,而大模型(大語言模型和多模態(tài)大模型)的迅猛發(fā)展為自動駕駛
    的頭像 發(fā)表于 04-20 13:16 ?1022次閱讀
    大<b class='flag-5'>模型</b>如何推動<b class='flag-5'>自動駕駛</b>技術革新?

    自動駕駛模型中常提的Token是個啥?對自動駕駛有何影響?

    近年來,人工智能技術迅速發(fā)展,大規(guī)模深度學習模型(即大模型)在自然語言處理、計算機視覺、語音識別以及自動駕駛等多個領域取得了突破性進展。自動駕駛
    的頭像 發(fā)表于 03-28 09:16 ?1338次閱讀

    偉創(chuàng)力攜手英偉與Torc開啟自動駕駛卡車新紀元

    近年來,自動駕駛技術的發(fā)展如火如荼。作為世界領先的汽車級計算平臺提供商的偉創(chuàng)力成為自動駕駛8級卡車商業(yè)化先驅(qū)——Torc的合作伙伴,并攜手技術巨頭英偉(NVIDIA),合作開發(fā)了用于
    的頭像 發(fā)表于 03-26 16:10 ?983次閱讀

    NVIDIA Halos自動駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動駕駛開發(fā)技術套件,涵蓋車輛架構到 AI 模型,包括芯片、軟件、工具和服務。 物理 AI 正在為自動駕駛
    的頭像 發(fā)表于 03-25 14:51 ?1178次閱讀