NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技術(shù),增強(qiáng)了 AI 虛擬形象和數(shù)字人的真實(shí)感和可訪問(wèn)性,這些新的動(dòng)畫(huà)和語(yǔ)音功能實(shí)現(xiàn)了更自然的對(duì)話和情感表達(dá)。
開(kāi)發(fā)者現(xiàn)在可以使用新的云 API 在應(yīng)用中輕松實(shí)現(xiàn)和擴(kuò)展智能虛擬形象,包括自動(dòng)語(yǔ)音識(shí)別(ASR)、文本轉(zhuǎn)語(yǔ)音(TTS)、神經(jīng)機(jī)器翻譯(NMT)和 Audio2Face(A2F)。
借助這些高級(jí)功能,搶先體驗(yàn)計(jì)劃的創(chuàng)作者可以利用 NVIDIA 技術(shù)快速構(gòu)建新一代虛擬形象體驗(yàn)?,F(xiàn)在,使用 Unreal Engine 5 等一些熱門渲染工具,可以更輕松地在任何地方大規(guī)模構(gòu)建和部署數(shù)字人。
AI 驅(qū)動(dòng)的情感動(dòng)畫(huà)
用戶可使用最新的 ACE AI 動(dòng)畫(huà)功能和微服務(wù)(包括新添加的 A2F 情感支持)構(gòu)建更具表現(xiàn)力的數(shù)字人,現(xiàn)在還提供用于身體、頭部和眼球運(yùn)動(dòng)的 Animation Graph 微服務(wù)。
對(duì)于使用云來(lái)處理渲染生產(chǎn)或?qū)で筮M(jìn)行實(shí)時(shí)推理的開(kāi)發(fā)者,現(xiàn)在有了易于使用的微服務(wù)。A2F 的質(zhì)量改進(jìn)包括嘴型同步,可為數(shù)字人帶來(lái)更多的真實(shí)感。

圖 1. NVIDIA ACE 端到端開(kāi)發(fā)套件
增強(qiáng)的 AI 語(yǔ)音功能
現(xiàn)在支持的語(yǔ)言包括意大利語(yǔ)、西班牙語(yǔ)、德語(yǔ)和普通話,ASR 技術(shù)的整體準(zhǔn)確性也得到了提高,ASR、TTS 和 NMT 的云 API 簡(jiǎn)化了對(duì)最新語(yǔ)音 AI 功能的訪問(wèn)。
無(wú)論用戶是想使用自己的語(yǔ)音將自定義語(yǔ)音應(yīng)用到智能 NPC,還是在視頻會(huì)議通話中隨機(jī)化用戶的語(yǔ)音,新的 Voice Font 微服務(wù)都能讓用戶自定義 TTS 輸出。這項(xiàng)技術(shù)可將說(shuō)話者的獨(dú)特音調(diào)和音量轉(zhuǎn)換為參考音頻,同時(shí)保持相同的節(jié)奏和聲音模式。
新工具和框架
ACE Agent 是一家專業(yè)的對(duì)話管理和系統(tǒng)集成商,它能夠提供更加流暢的端到端體驗(yàn),并高效地協(xié)調(diào)微服務(wù)之間的連接。開(kāi)發(fā)者還可以利用與 NVIDIA Omniverse 平臺(tái)的集成,通過(guò) NVIDIA NeMo Guardrails、NVIDIA SteerLM 和 LangChain 來(lái)更好地控制精確且可調(diào)節(jié)的響應(yīng)。
現(xiàn)在,可以更輕松地在用戶選擇的渲染器或編碼環(huán)境中啟動(dòng)和運(yùn)行這些工具。新功能包括:
在 Avatar 配置器中支持 Blendshape,以輕松集成 Unreal Engine 等熱門渲染器。
面向 Python 用戶的全新 A2F 應(yīng)用程序。
一款參考應(yīng)用程序,適用于有興趣為客戶服務(wù)構(gòu)建虛擬助理的開(kāi)發(fā)者。
總結(jié)
這些新推出的 NVIDIA ACE 功能提高了數(shù)字人體驗(yàn)的質(zhì)量標(biāo)準(zhǔn)。借助簡(jiǎn)化構(gòu)建和部署的增強(qiáng)功能,開(kāi)發(fā)者現(xiàn)在可以獲得構(gòu)建新一代數(shù)字人應(yīng)用所需的簡(jiǎn)化配置。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5594瀏覽量
109781 -
ASR
+關(guān)注
關(guān)注
2文章
44瀏覽量
19428 -
python
+關(guān)注
關(guān)注
57文章
4876瀏覽量
90071 -
TTS
+關(guān)注
關(guān)注
0文章
62瀏覽量
11548 -
NPC
+關(guān)注
關(guān)注
0文章
32瀏覽量
5583
原文標(biāo)題:在 NVIDIA ACE 中使用 AI 動(dòng)畫(huà)和語(yǔ)音功能打造逼真的虛擬形象
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
達(dá)索系統(tǒng)與 NVIDIA 合作構(gòu)建支持虛擬孿生的工業(yè) AI 平臺(tái)
借助NVIDIA Isaac Sim與World Labs Marble加速機(jī)器人仿真環(huán)境構(gòu)建
NVIDIA推動(dòng)面向數(shù)字與物理AI的開(kāi)源模型發(fā)展
NVIDIA ACE現(xiàn)已支持開(kāi)源Qwen3-8B小語(yǔ)言模型
使用OpenUSD和SimReady資產(chǎn)構(gòu)建AI工廠
AI開(kāi)啟更逼真的游戲時(shí)代
增加語(yǔ)音控制功能關(guān)注這幾顆芯片輕松搞定
NVIDIA RTX PRO 4500 Blackwell產(chǎn)品特性
如何在NVIDIA ACE中使用AI動(dòng)畫(huà)和語(yǔ)音功能打造逼真的虛擬形象呢?
評(píng)論