ABSTRACT摘要
2 月 16 日凌晨,也就是中國大年初七,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書面命令立即創(chuàng)建短視頻。
JAEALOT
2024年2月16日
2 月 16 日凌晨,也就是中國大年初七,OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
這家舊金山公司周四推出的該工具使用生成人工智能,根據(jù)書面命令立即創(chuàng)建短視頻。
Sora 并不是第一個展示這種技術(shù)的產(chǎn)品。但行業(yè)分析師指出,該工具迄今為止展示的視頻質(zhì)量很高,并指出它的推出標(biāo)志著 OpenAI 和文本到視頻生成的未來的整體重大飛躍。
盡管如此,與當(dāng)今快速發(fā)展的人工智能領(lǐng)域的所有事物一樣,此類技術(shù)也引發(fā)了人們對潛在道德和社會影響的擔(dān)憂。
Sora 是一款文本到視頻生成器 - 使用生成式 AI 根據(jù)書面提示創(chuàng)建長達(dá) 60 秒的視頻。該模型還可以從現(xiàn)有的靜態(tài)圖像生成視頻。
生成式人工智能是人工智能的一個分支,可以創(chuàng)造新的東西。示例包括聊天機(jī)器人(如 OpenAI 的 ChatGPT)以及圖像生成器(如 DALL-E 和 Midjourney)。讓人工智能系統(tǒng)生成視頻是更新且更具挑戰(zhàn)性的,但依賴于一些相同的技術(shù)。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根據(jù)用戶的文本提示創(chuàng)建長達(dá)一分鐘的視頻。
OpenAI 在帖子中表示:“我們正在教人工智能理解和模擬運動中的物理世界,目的是訓(xùn)練模型來幫助人們解決需要現(xiàn)實世界交互的問題?!?/p>
OpenAI 在帖子中補充道:“Sora 能夠生成具有多個角色、特定類型的運動以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場景。” “該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式?!?/p>
此外,根據(jù)該帖子,生成式人工智能模型可以基于單個圖像創(chuàng)建視頻,以及擴(kuò)展現(xiàn)有視頻或填充缺失的幀。
Sora 尚未可供公眾使用(OpenAI 表示,在正式發(fā)布該工具之前,它正在與政策制定者和藝術(shù)家進(jìn)行接觸),而且還有很多我們不知道的事情。但自周四宣布以來,該公司已經(jīng)分享了一些 Sora 生成的視頻示例,以展示其功能。
OpenAI 首席執(zhí)行官 Sam Altman 還利用 X(以前稱為Twitter 的平臺)要求社交媒體用戶及時發(fā)送想法。后來,他分享了逼真詳細(xì)的視頻,這些視頻響應(yīng)了“兩只金毛獵犬在山頂上播客”和“在海洋上與不同動物進(jìn)行自行車比賽,運動員在無人機(jī)攝像機(jī)視圖下騎自行車”等提示。
雖然 Sora 生成的視頻可以描繪復(fù)雜、極其詳細(xì)的場景,但 OpenAI 指出仍然存在一些弱點,包括一些空間和因果元素。例如,OpenAI 在其網(wǎng)站上補充道,“一個人可能會咬一口餅干,但之后,餅干可能沒有咬痕?!?/p>
OpenAI 的 Sora 并不是同類產(chǎn)品中的第一個。谷歌、Meta 和初創(chuàng)公司 Runway ML 等公司都展示了類似的技術(shù)。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31073瀏覽量
222184 -
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301364 -
人工智能
+關(guān)注
關(guān)注
1817文章
50094瀏覽量
265297
發(fā)布評論請先 登錄
商湯科技日日新Seko系列模型與寒武紀(jì)成功適配
OpenAI Sora 2模型上線微軟Azure AI Foundry國際版
看點:谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產(chǎn)龍頭西安奕材今日申購
全球首個動漫專屬AI視頻生成平臺Animon,國內(nèi)版"萌動AI"正式發(fā)布
智能體化AI和生成式AI的區(qū)別
【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)
亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型
美泰與OpenAI聯(lián)手,共探生成式AI智能玩具新領(lǐng)域
百度重磅發(fā)布!全球首創(chuàng)中文音視頻模型
一種基于擴(kuò)散模型的視頻生成框架RoboTransfer
OpenAI 在 AI 生成視頻領(lǐng)域扔出一枚“王炸”,視頻生成模型“Sora”
評論