據(jù)報(bào)道,2023年5月14日,OpenAI正式公布其最新人工智能模型GPT-4o,預(yù)計(jì)其將于數(shù)周內(nèi)在OpenAI的各類產(chǎn)品中逐步實(shí)現(xiàn)集成。尤其值得關(guān)注的是,GPT-4o將向所有用戶免費(fèi)開放。
OpenAI首席技術(shù)官穆里·穆拉蒂(Muri Murati)指出,GPT-4o具備與GPT-4相同的智能水平,且在文本、圖像及語(yǔ)音處理方面有顯著進(jìn)步。他在OpenAI總部的主題演講中表示:“GPT-4o能整合語(yǔ)音、文本和視覺信息進(jìn)行推理?!盙PT-4是OpenAI先前的旗艦?zāi)P?,擅長(zhǎng)處理圖像和文本混合信息,如從圖像中提取文字或描述圖像內(nèi)容等任務(wù);而GPT-4o在此基礎(chǔ)上增加了語(yǔ)音處理功能。
GPT-4o的運(yùn)行速度將得到極大提高,其中最大亮點(diǎn)為其語(yǔ)音交互模式采用了創(chuàng)新技術(shù)。OpenAI一直致力于使用戶能以語(yǔ)音方式與ChatGPT進(jìn)行交流,如同與真人對(duì)話一樣。然而,早期版本因延遲問題影響了對(duì)話的沉浸感。GPT-4o采用全新技術(shù),使得聊天機(jī)器人的響應(yīng)速度大幅度提升。
IT之家觀察到,發(fā)布會(huì)現(xiàn)場(chǎng)OpenAI展示了GPT-4o進(jìn)行語(yǔ)音對(duì)話的實(shí)例。演示者提問后,GPT-4o幾乎能立即作出回應(yīng),并通過文本轉(zhuǎn)語(yǔ)音功能進(jìn)行朗讀,使對(duì)話更具真實(shí)感。
另一演示展示了GPT-4o根據(jù)需求調(diào)整語(yǔ)調(diào)的能力,GPT-4o能根據(jù)指令改變聲音,從夸張戲劇到冰冷機(jī)械,表現(xiàn)出卓越的可塑性。最后,演示還展示了GPT-4o的歌唱功能。
過去,OpenAI發(fā)布新版ChatGPT模型時(shí),往往將其設(shè)為付費(fèi)服務(wù)。此次GPT-4o將對(duì)所有用戶免費(fèi)開放,付費(fèi)用戶則享有五倍的調(diào)用額度。
此外,OpenAI還發(fā)布了桌面版ChatGPT和新的用戶界面。穆拉蒂表示:“我們意識(shí)到這些模型正在變得日益復(fù)雜,因此我們希望用戶與人工智能模型的交互體驗(yàn)更為自然、輕松,讓他們能專注于與模型的協(xié)作,而不必過多關(guān)注界面本身?!?/p>
-
圖像
+關(guān)注
關(guān)注
2文章
1096瀏覽量
42328 -
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265363 -
GPT
+關(guān)注
關(guān)注
0文章
368瀏覽量
16871 -
OpenAI
+關(guān)注
關(guān)注
9文章
1245瀏覽量
10069
發(fā)布評(píng)論請(qǐng)先 登錄
GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍
OpenAI與Anthropic對(duì)戰(zhàn),Claude Opus 4.6與GPT-5.3-Codex同日發(fā)布
上海交大發(fā)布國(guó)產(chǎn)光學(xué)大模型Optics GPT
GPT-5.1發(fā)布 OpenAI開始拼情商
成都匯陽(yáng)投資關(guān)于大模型白熱化,應(yīng)用加速分化
NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實(shí)現(xiàn)150萬TPS推理
澎峰科技完成OpenAI最新開源推理模型適配
訊飛星辰MaaS平臺(tái)率先上線OpenAI最新開源模型
SuperX全新發(fā)布多種規(guī)格的多模型一體機(jī):全新定義企業(yè)級(jí)智能生產(chǎn)力
OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價(jià)向美國(guó)政府提供ChatGPT
OpenAI發(fā)布2款開源模型
AI真會(huì)人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開關(guān)已開啟
“天才”!OpenAI o3 成全球 IQ 最高的 AI 大模型
OpenAI發(fā)布GPT-4o模型,供全體用戶免費(fèi)使用
評(píng)論