91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌DeepMind重磅發(fā)布Genie 3,首次實現(xiàn)世界模型實時交互

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-08-13 08:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報道 當(dāng)?shù)貢r間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達科學(xué)家Jim Fan譽為“游戲引擎2.0”的模型,通過單文本提示即可生成實時交互的720p動態(tài)世界,將世界模擬技術(shù)推向全新高度。

技術(shù)突破:實時交互與超真實模擬

Genie3的核心創(chuàng)新在于首次實現(xiàn)了世界模型的實時交互能力。傳統(tǒng)生成模型需完整處理輸入后輸出結(jié)果,而Genie3采用流式處理架構(gòu),支持每秒24幀的持續(xù)生成,用戶可實時導(dǎo)航并修改生成環(huán)境。這種突破性設(shè)計使模型能即時響應(yīng)用戶輸入,在動態(tài)世界中保持數(shù)分鐘的環(huán)境一致性。

在物理模擬層面,Genie3展現(xiàn)出驚人的真實感。模型可精準(zhǔn)呈現(xiàn)水體流動、光影變化等復(fù)雜現(xiàn)象,在佛羅里達颶風(fēng)場景演示中,系統(tǒng)精確模擬了海浪拍打、棕櫚樹彎曲等細節(jié),連雨衣的褶皺變化都符合物理規(guī)律。這種深度模擬能力源于對海量視頻數(shù)據(jù)的無監(jiān)督學(xué)習(xí),模型通過110億參數(shù)構(gòu)建起對現(xiàn)實世界的深層理解。

視覺記憶技術(shù)是Genie3的另一大亮點。系統(tǒng)采用自回歸生成機制,每幀生成時需參考此前所有幀信息。當(dāng)用戶一分鐘后重返某地,模型能準(zhǔn)確還原之前生成的物體狀態(tài),建筑物左側(cè)的樹木在整個交互過程中始終保持一致。這種"涌現(xiàn)能力"使生成的世界更具沉浸感,遠超依賴3D表示的傳統(tǒng)方法。

可提示的世界事件功能為模型注入動態(tài)靈魂。用戶可通過文本指令改變天氣、引入新物體,甚至創(chuàng)造反事實場景。在威尼斯汽船演示中,系統(tǒng)不僅重現(xiàn)了運河的逼真倒影,還能根據(jù)指令添加貢多拉船和水上出租車,這種靈活性使Genie3超越單純的環(huán)境生成,成為真正的交互式創(chuàng)作平臺。

應(yīng)用革命:從游戲開發(fā)到具身智能

在游戲產(chǎn)業(yè),Genie3正引發(fā)創(chuàng)作范式的根本變革。傳統(tǒng)3D游戲開發(fā)需數(shù)月構(gòu)建場景,而Genie3通過單張圖片和文本描述即可生成可交互的虛擬世界。在面包房任務(wù)演示中,系統(tǒng)為通用智能體SIMA創(chuàng)建了包含工業(yè)攪拌機、冷卻架的復(fù)雜環(huán)境,智能體通過發(fā)送導(dǎo)航指令即可完成任務(wù)學(xué)習(xí)。這種能力不僅縮短開發(fā)周期,更可能催生《我的世界》級別的開放世界游戲革命。

機器人訓(xùn)練領(lǐng)域迎來突破性進展。DeepMind已將Genie3與Gemini Robotics模型結(jié)合,為機械臂和雙足機器人創(chuàng)建多樣化訓(xùn)練場景。在物流分揀測試中,系統(tǒng)生成的動態(tài)環(huán)境包含隨機障礙物和突發(fā)狀況,使機器人能在接近真實的風(fēng)險條件下完成策略學(xué)習(xí)。這種訓(xùn)練方式相比傳統(tǒng)方法效率提升300%,且無需實體設(shè)備支持。

自動駕駛模擬同樣受益匪淺。Genie3可生成包含極端天氣的駕駛場景,系統(tǒng)能根據(jù)指令隨時引入行人、動物等突發(fā)因素。在暴雨場景測試中,模型不僅模擬了路面反光和水花飛濺,還能通過世界事件功能制造輪胎打滑等意外狀況,為自動駕駛算法提供前所未有的訓(xùn)練數(shù)據(jù)。
教育領(lǐng)域的應(yīng)用前景同樣廣闊。歷史教師可通過文本提示重現(xiàn)古羅馬斗獸場,學(xué)生能在虛擬場景中自由探索;地理課堂可生成實時演變的火山噴發(fā)模型,配合可提示的世界事件功能,讓學(xué)生直觀理解地質(zhì)變化規(guī)律。這種沉浸式學(xué)習(xí)體驗,正重新定義教育技術(shù)的可能性邊界。

盡管Genie3已實現(xiàn)重大突破,仍存在三大技術(shù)瓶頸:智能體行動空間受限,復(fù)雜多智能體交互模擬不足,地理精度無法完美復(fù)現(xiàn)現(xiàn)實世界。DeepMind研究團隊透露,下一代模型將重點突破這些限制,計劃通過分層強化學(xué)習(xí)擴展行動維度,引入社會規(guī)范約束提升多智能體交互真實度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    眾智FlagOS適配面壁智能開源全模態(tài)大模型MiniCPM-o 4.5

    2月3日,面壁智能正式發(fā)布并開源了集語言、視覺、語音于一體的全模態(tài)大模型 MiniCPM-o 4.5。作為首個全雙工全模態(tài)大模型,MiniCPM-o 4.5
    的頭像 發(fā)表于 02-09 14:45 ?626次閱讀
    眾智FlagOS適配面壁智能開源全模態(tài)大<b class='flag-5'>模型</b>MiniCPM-o 4.5

    2026年,3DGS和世界模型,在自動駕駛仿真中的組合應(yīng)用

    寫在前面:作為自動駕駛仿真的核心支撐,3DGS與世界模型的技術(shù)落地一直備受關(guān)注。我們看到了車路漫漫的一篇文章,探討了3DGS與世界
    的頭像 發(fā)表于 02-03 17:32 ?3171次閱讀
    2026年,<b class='flag-5'>3</b>DGS和<b class='flag-5'>世界</b><b class='flag-5'>模型</b>,在自動駕駛仿真中的組合應(yīng)用

    云知聲山海知音大模型2.0重磅發(fā)布

    隨著智能體時代到來,云知聲在“山海·Atlas”通用智算基座持續(xù)演進基礎(chǔ)上,年前實現(xiàn)了“山海·知醫(yī)”5.0醫(yī)療大模型升級,今天迎來了“山海·知音”2.0的重磅發(fā)布,正在完成“一基兩翼”
    的頭像 發(fā)表于 01-27 14:08 ?199次閱讀
    云知聲山海知音大<b class='flag-5'>模型</b>2.0<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>

    谷歌正式推出Gemini 3 Flash模型

    我們正式推出了 Gemini 3 Flash,這是以較低成本打造的高效前沿智能,成功地進一步擴展了 Gemini 3 模型系列。
    的頭像 發(fā)表于 01-22 16:04 ?463次閱讀

    VLA與世界模型有什么不同?

    [首發(fā)于智駕最前沿微信公眾號]當(dāng)前自動駕駛行業(yè),各車企的技術(shù)路徑普遍選擇了單車智能方向。而在實際落地過程中,不同企業(yè)選擇了差異化的技術(shù)實現(xiàn)方式,部分車企側(cè)重于視覺—語言—動作模型(Vision
    的頭像 發(fā)表于 12-17 09:13 ?607次閱讀
    VLA與<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發(fā)布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯(lián)網(wǎng)連接協(xié)議平臺。其芯片已在
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    Gemini AI 再進化:谷歌聯(lián)合XREAL發(fā)布Project Aura, 打開“看見世界”的新能力

    [2025年12月9日,美國加利福尼亞州山景城]?—— 在今日舉行的 The Android Show 上,谷歌首次公布了 Project Aura產(chǎn)品和 Android XR系統(tǒng)的關(guān)鍵細節(jié),該產(chǎn)品
    發(fā)表于 12-09 11:06 ?1263次閱讀
    Gemini AI 再進化:<b class='flag-5'>谷歌</b>聯(lián)合XREAL<b class='flag-5'>發(fā)布</b>Project Aura, 打開“看見<b class='flag-5'>世界</b>”的新能力

    谷歌正式推出最新Gemini 3 AI模型

    今天我們正式推出 Gemini 3,這是我們迄今為止最智能的模型,能夠幫助用戶實現(xiàn)任何創(chuàng)意。Gemini 3 Pro 基于最先進的推理技術(shù),與之前的版本相比,它在所有主要的 AI 基準(zhǔn)
    的頭像 發(fā)表于 11-24 11:10 ?1215次閱讀
    <b class='flag-5'>谷歌</b>正式推出最新Gemini <b class='flag-5'>3</b> AI<b class='flag-5'>模型</b>

    谷歌AlphaEarth和維智時空AI大模型的技術(shù)路徑

    谷歌AlphaEarth和維智時空AI大模型在應(yīng)用場景和技術(shù)實現(xiàn)上各有側(cè)重,但兩者在底層技術(shù)理念上存在顯著共性。
    的頭像 發(fā)表于 10-22 14:48 ?897次閱讀

    成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化

    Gemini 2.5 Flash Image登頂 多主流圖像榜,Meta 也從 Midjourney 授權(quán) AI 圖像模型;視頻領(lǐng)域,阿里字節(jié)等刷新能力高度 ,谷歌將視頻模型推進至實時
    的頭像 發(fā)表于 09-09 09:30 ?912次閱讀

    商湯大裝置重磅發(fā)布多項標(biāo)志性成果

    在2025世界人工智能大會(WAIC 2025)期間,作為“最懂大模型的AI基礎(chǔ)設(shè)施”,商湯大裝置重磅發(fā)布多項標(biāo)志性成果,持續(xù)打造AI基礎(chǔ)設(shè)施發(fā)展新范式,力推動產(chǎn)業(yè)生態(tài)與應(yīng)用場景的系統(tǒng)
    的頭像 發(fā)表于 08-05 10:07 ?1064次閱讀

    廣和通發(fā)布自研端側(cè)語音識別大模型FiboASR

    7月,全球領(lǐng)先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識別大模型FiboASR。該模型專為端側(cè)設(shè)備上面臨的面對面實時對話及多人會議場景深度優(yōu)化,在低延遲語音
    的頭像 發(fā)表于 08-04 11:43 ?1582次閱讀

    德賽西威與面壁智能發(fā)布端側(cè)大模型語音交互方案

    日前,全球領(lǐng)先的移動出行科技公司德賽西威與端側(cè)大模型技術(shù)領(lǐng)軍企業(yè)面壁智能共同發(fā)布業(yè)界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側(cè)大模型語音交互方案,這是雙方自2024年1
    的頭像 發(fā)表于 05-14 17:40 ?1288次閱讀

    genie nano c2020無法顯示畫面

    一開始顯示“the packet size may be too large for the network setup”后面減小了數(shù)據(jù)包大小,沒有報錯,但是點擊grab之后沒有畫面 NI MAX和labview都試過了,換另外一個鏡頭就有畫面,genie nano c2020應(yīng)該沒有壞,請問是為什么呢
    發(fā)表于 04-16 14:19

    軟通計算機重磅發(fā)布DeepSeek大模型一體機產(chǎn)品

    3月20日,華為中國合作伙伴大會2025在深圳盛大啟幕。大會上,軟通計算機重磅發(fā)布了“DeepSeek大模型一體機產(chǎn)品”,為用戶提供一站式的AI應(yīng)用算力平臺,讓大
    的頭像 發(fā)表于 03-22 10:40 ?1529次閱讀
    軟通計算機<b class='flag-5'>重磅</b><b class='flag-5'>發(fā)布</b>DeepSeek大<b class='flag-5'>模型</b>一體機產(chǎn)品