我們決定忽略顯而易見(jiàn)的事情。我們知道,大型語(yǔ)言模型將繼續(xù)占據(jù)主導(dǎo)地位。監(jiān)管機(jī)構(gòu)將變得更加大膽。人工智能的問(wèn)題——從偏見(jiàn)到版權(quán)再到末日論——將影響研究人員、監(jiān)管機(jī)構(gòu)和公眾的議程,不僅在 2024 年,而且在未來(lái)幾年。
相反,我們挑選了一些更具體的趨勢(shì)。以下是 2024 年需要注意的事項(xiàng)。
1. 定制聊天機(jī)器人
你會(huì)得到一個(gè)聊天機(jī)器人!你會(huì)得到一個(gè)聊天機(jī)器人!到2024年,在生成式人工智能方面投入巨資的科技公司將面臨壓力,需要證明他們可以從他們的產(chǎn)品中賺錢。為此,人工智能巨頭谷歌(Google)和OpenAI正在大舉押注:兩家公司都在開發(fā)用戶友好的平臺(tái),允許人們定制強(qiáng)大的語(yǔ)言模型,并制作自己的迷你聊天機(jī)器人來(lái)滿足他們的特定需求,而無(wú)需編碼技能。兩家公司都推出了基于網(wǎng)絡(luò)的工具,允許任何人成為生成式人工智能應(yīng)用程序開發(fā)人員。
到 2024 年,生成式 AI 實(shí)際上可能對(duì)普通的非技術(shù)人員有用,我們將看到更多的人修補(bǔ)一百萬(wàn)個(gè)小 AI 模型。最先進(jìn)的 AI 模型,如 GPT-4 和 Gemini,是多模態(tài)的,這意味著它們不僅可以處理文本,還可以處理圖像甚至視頻。這項(xiàng)新功能可以解鎖一大堆新應(yīng)用程序。例如,房地產(chǎn)經(jīng)紀(jì)人可以上傳以前房源中的文本,只需單擊一個(gè)按鈕即可微調(diào)強(qiáng)大的模型以生成類似的文本,上傳新房源的視頻和照片,只需讓定制的 AI 生成房產(chǎn)描述。
但是,當(dāng)然,這個(gè)計(jì)劃的成功取決于這些模型是否可靠地工作。語(yǔ)言模型經(jīng)常會(huì)編造一些東西,而生成模型則充滿了偏見(jiàn)。它們也很容易被黑客入侵,特別是如果它們被允許瀏覽網(wǎng)頁(yè)。科技公司還沒(méi)有解決這些問(wèn)題。當(dāng)新奇感消失時(shí),他們將不得不為客戶提供處理這些問(wèn)題的方法。
2. 生成式人工智能的第二波浪潮將是視頻
令人驚訝的是,夢(mèng)幻般的事物變得如此迅速。2022 年,第一批生成逼真圖像的生成模型成為主流,并很快變得司空見(jiàn)慣。OpenAI 的 DALL-E、Stability AI 的 Stable Diffusion 和 Adobe 的 Firefly 等工具充斥著互聯(lián)網(wǎng)上令人瞠目結(jié)舌的圖片,從巴黎世家的教皇到獲獎(jiǎng)藝術(shù),應(yīng)有盡有。但這并不全是好玩的:對(duì)于每一個(gè)揮舞著絨球的哈巴狗來(lái)說(shuō),還有另一件仿冒的幻想藝術(shù)或性別歧視的性別刻板印象。新的領(lǐng)域是文本到視頻。期望它把所有關(guān)于文本到圖像的好的、壞的或丑陋的東西都放大。
一年前,我們第一次看到了生成模型在訓(xùn)練將多個(gè)靜止圖像拼接成幾秒鐘長(zhǎng)的剪輯時(shí)可以做什么。結(jié)果是扭曲和生澀的。但技術(shù)已經(jīng)迅速改進(jìn)。
Runway是一家制作生成視頻模型的初創(chuàng)公司(以及共同創(chuàng)建Stable Diffusion的公司),每隔幾個(gè)月就會(huì)發(fā)布其工具的新版本。它的最新型號(hào)稱為Gen-2,仍然生成只有幾秒鐘長(zhǎng)的視頻,但質(zhì)量是驚人的。 最好的剪輯離皮克斯可能推出的并不遙遠(yuǎn)。
Runway 設(shè)立了一年一度的 AI 電影節(jié),展示使用一系列 AI 工具制作的實(shí)驗(yàn)電影。今年的電影節(jié)有60,000美元的獎(jiǎng)金,10部最佳電影將在紐約和洛杉磯放映。 頂級(jí)工作室注意到這一點(diǎn)也就不足為奇了。包括派拉蒙和迪士尼在內(nèi)的電影巨頭現(xiàn)在正在探索在其制作流程中使用生成式人工智能。該技術(shù)被用于對(duì)演員的表演進(jìn)行口型同步,以配音多個(gè)外語(yǔ)配音。它正在重塑特效的可能性。2023 年,《印第安納瓊斯與命運(yùn)轉(zhuǎn)盤》由一位衰老的深度偽造哈里森福特主演。這僅僅是個(gè)開始。
在大銀幕之外,用于營(yíng)銷或培訓(xùn)目的的深度偽造技術(shù)也在起飛。例如,總部位于英國(guó)的 Synthesia 開發(fā)的工具可以將演員的一次性表演變成源源不斷的深度偽造化身,只需按一下按鈕即可背誦您給他們的任何劇本。據(jù)該公司稱,其技術(shù)現(xiàn)在被 44% 的財(cái)富 100 強(qiáng)公司使用。
用這么少的東西做這么多事情的能力給演員帶來(lái)了嚴(yán)重的問(wèn)題。對(duì)工作室使用和濫用人工智能的擔(dān)憂是去年SAG-AFTRA罷工的核心。但這項(xiàng)技術(shù)的真正影響才剛剛顯現(xiàn)出來(lái)。“電影制作的工藝正在發(fā)生根本性的變化,”獨(dú)立電影制片人、專門從事創(chuàng)意技術(shù)咨詢公司Bell & Whistle的聯(lián)合創(chuàng)始人Souki Mehdaoui說(shuō)。
3. AIGC的選舉虛假信息將無(wú)處不在
如果最近的選舉有什么可取之處,那么人工智能生成的選舉虛假信息和深度偽造將是一個(gè)巨大的問(wèn)題,因?yàn)?2024 年將有創(chuàng)紀(jì)錄的人數(shù)參加投票。我們已經(jīng)看到政客們將這些工具武器化。在阿根廷,兩名總統(tǒng)候選人創(chuàng)建了人工智能生成的對(duì)手圖像和視頻來(lái)攻擊他們。在斯洛伐克,一位自由派親歐洲政黨領(lǐng)導(dǎo)人威脅要提高啤酒價(jià)格,并拿兒童色情制品開玩笑,在該國(guó)選舉期間像野火一樣傳播開來(lái)。在美國(guó),唐納德·特朗普(Donald Trump)為一個(gè)使用人工智能生成帶有種族主義和性別歧視比喻的迷因(memes)的團(tuán)體歡呼。
雖然很難說(shuō)這些例子對(duì)選舉結(jié)果有多大影響,但它們的擴(kuò)散是一個(gè)令人擔(dān)憂的趨勢(shì)。在網(wǎng)上識(shí)別什么是真實(shí)的將變得比以往任何時(shí)候都更難。在已經(jīng)激化和兩極分化的政治氣候中,這可能會(huì)產(chǎn)生嚴(yán)重后果。
就在幾年前,創(chuàng)建深度偽造需要先進(jìn)的技術(shù)技能,但生成式人工智能使它變得非常容易和容易獲得,而且輸出看起來(lái)越來(lái)越逼真。即使是信譽(yù)良好的來(lái)源也可能被人工智能生成的內(nèi)容所愚弄。例如,用戶提交的人工智能生成的圖像,旨在描繪以色列-加沙危機(jī),已經(jīng)充斥著像Adobe這樣的庫(kù)存圖像市場(chǎng)。
對(duì)于那些與此類內(nèi)容擴(kuò)散作斗爭(zhēng)的人來(lái)說(shuō),來(lái)年將是關(guān)鍵的一年。跟蹤和緩解其內(nèi)容的技術(shù)仍處于開發(fā)的早期階段。水印,例如 Google DeepMind 的 SynthID,仍然大多是自愿的,并非完全萬(wàn)無(wú)一失。眾所周知,社交媒體平臺(tái)在刪除錯(cuò)誤信息方面進(jìn)展緩慢。準(zhǔn)備好進(jìn)行大規(guī)模的實(shí)時(shí)實(shí)驗(yàn),以破壞人工智能生成的假新聞。
4. 多任務(wù)機(jī)器人
受到生成式人工智能當(dāng)前繁榮背后的一些核心技術(shù)的啟發(fā),機(jī)器人專家開始構(gòu)建更多可以執(zhí)行更廣泛任務(wù)的通用機(jī)器人。在過(guò)去的幾年里,人工智能已經(jīng)從使用多個(gè)小模型(每個(gè)模型被訓(xùn)練來(lái)執(zhí)行不同的任務(wù)——識(shí)別圖像、繪制圖像、為它們添加標(biāo)題)轉(zhuǎn)向單個(gè)、單一的單體模型,這些模型經(jīng)過(guò)訓(xùn)練可以完成所有這些事情,甚至更多。通過(guò)向 OpenAI 的 GPT-3 展示一些額外的示例(稱為微調(diào)),研究人員可以訓(xùn)練它解決編碼問(wèn)題、編寫電影腳本、通過(guò)高中生物學(xué)考試等。多模態(tài)模型,如 GPT-4 和 Google DeepMind 的 Gemini,可以解決視覺(jué)任務(wù)和語(yǔ)言任務(wù)。同樣的方法也適用于機(jī)器人,因此沒(méi)有必要訓(xùn)練一個(gè)機(jī)器人翻轉(zhuǎn)煎餅,另一個(gè)機(jī)器人打開門:一個(gè)放之四海而皆準(zhǔn)的模型可以讓機(jī)器人能夠同時(shí)處理多項(xiàng)任務(wù)。2023 年出現(xiàn)了該領(lǐng)域的幾個(gè)工作實(shí)例。今年6月,DeepMind發(fā)布了Robocat(去年Gato的更新),它通過(guò)反復(fù)試驗(yàn)生成自己的數(shù)據(jù),以學(xué)習(xí)如何控制許多不同的機(jī)器人手臂(而不是更典型的一個(gè)特定手臂)。今年10月,該公司與33個(gè)大學(xué)實(shí)驗(yàn)室合作,推出了另一個(gè)通用機(jī)器人模型RT-X,以及一個(gè)大型的新通用訓(xùn)練數(shù)據(jù)集。其他頂級(jí)研究團(tuán)隊(duì),如加州大學(xué)伯克利分校的RAIL(機(jī)器人人工智能和學(xué)習(xí)),正在研究類似的技術(shù)。
問(wèn)題是缺乏數(shù)據(jù)。生成式 AI 利用互聯(lián)網(wǎng)大小的文本和圖像數(shù)據(jù)集。相比之下,機(jī)器人很少有好的數(shù)據(jù)來(lái)源來(lái)幫助它們學(xué)習(xí)如何完成我們希望它們完成的許多工業(yè)或家庭任務(wù)。
紐約大學(xué)的勒雷爾·平托(Lerrel Pinto)領(lǐng)導(dǎo)了一個(gè)團(tuán)隊(duì)來(lái)解決這個(gè)問(wèn)題。他和他的同事們正在開發(fā)技術(shù),讓機(jī)器人通過(guò)反復(fù)試驗(yàn)來(lái)學(xué)習(xí),并隨時(shí)提出自己的訓(xùn)練數(shù)據(jù)。在一個(gè)更加低調(diào)的項(xiàng)目中,平托招募了志愿者,使用安裝在垃圾撿拾器上的iPhone攝像頭從他們家中收集視頻數(shù)據(jù)。在過(guò)去的幾年里,大公司也開始發(fā)布用于訓(xùn)練機(jī)器人的大型數(shù)據(jù)集,例如 Meta 的 Ego4D。
這種方法已經(jīng)在無(wú)人駕駛汽車中顯示出前景。Wayve、Waabi 和 Ghost 等初創(chuàng)公司正在引領(lǐng)新一波自動(dòng)駕駛 AI,它使用單個(gè)大型模型來(lái)控制車輛,而不是多個(gè)小型模型來(lái)控制特定的駕駛?cè)蝿?wù)。這讓小公司趕上了 Cruise 和 Waymo 等巨頭。Wayve現(xiàn)在正在倫敦狹窄繁忙的街道上測(cè)試其無(wú)人駕駛汽車。世界各地的機(jī)器人都將獲得類似的推動(dòng)力。
審核編輯:劉清
-
人工智能
+關(guān)注
關(guān)注
1818文章
50120瀏覽量
265611 -
GPT
+關(guān)注
關(guān)注
0文章
368瀏覽量
16887 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
348瀏覽量
13095 -
OpenAI
+關(guān)注
關(guān)注
9文章
1245瀏覽量
10125 -
AIGC
+關(guān)注
關(guān)注
1文章
391瀏覽量
3232
原文標(biāo)題:MIT科技評(píng)論:2024 年 AI 的四大熱門趨勢(shì)
文章出處:【微信號(hào):軟件質(zhì)量報(bào)道,微信公眾號(hào):軟件質(zhì)量報(bào)道】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Arm解析未來(lái)AI領(lǐng)域創(chuàng)新技術(shù)發(fā)展趨勢(shì)
淺談SOI晶圓制造技術(shù)的四大成熟工藝體系
華為高治國(guó)分享移動(dòng)AI時(shí)代通信網(wǎng)絡(luò)的四大核心轉(zhuǎn)型
從洞察到趨勢(shì):Canva可畫上線 Canva AI并發(fā)布 2026 年設(shè)計(jì)趨勢(shì)
微軟暢談亞太地區(qū)AI躍遷的四大趨勢(shì)
RFID技術(shù)在中國(guó)的四大成熟應(yīng)用領(lǐng)域:從識(shí)別到智能賦能
谷東智能創(chuàng)新方案解決AI+AR眼鏡的四大痛點(diǎn)
AI如何讓家電更懂你
AI的未來(lái),屬于那些既能寫代碼,又能焊電路的“雙棲人才”
上能電氣2024年光伏逆變器出貨量全球第四
2025人工智能證書 2025年人工智能行業(yè)AI證書如何選擇?
英飛凌碳化硅產(chǎn)品創(chuàng)新的四大支柱綜述(二)
2024年AI的四大熱門趨勢(shì)
評(píng)論