從“屏幕幻象”到“物理實(shí)體”,智能體正在重塑生產(chǎn)力的邊界!
當(dāng)大模型的敘事邏輯從“參數(shù)競賽”轉(zhuǎn)向“應(yīng)用落地”,智能體從只會紙上談兵的“賽博玩具”,進(jìn)化為真正下地干活的“生產(chǎn)工具”。感知、聲音、圖像、動作——這些被視為“輔助功能”的維度,成為智能體深入業(yè)務(wù)流程、實(shí)現(xiàn)規(guī)?;涞氐摹叭雸鋈?。
1月26日,星辰智能體平臺升級發(fā)布,讓智能體跨出屏幕,擁有“感知物理世界、理解復(fù)雜上下文、甚至像真人一樣多模態(tài)溝通”的能力。整合“語音、視覺、運(yùn)動與執(zhí)行”的多模交互全棧方案,讓智能體從“單點(diǎn)工具”,正式升級為具備“五官、手腳與個(gè)性”的「數(shù)字合伙人」。
01讓智能體走出屏幕
成為物理世界的得力助手
從智能音箱到企業(yè)客服,語音無疑是AI進(jìn)入真實(shí)世界的關(guān)鍵入口。然而,將復(fù)雜的 Agent 接入語音鏈路并非易事——響應(yīng)延遲、語義割裂、系統(tǒng)狀態(tài)不同步,已是行業(yè)普遍痛點(diǎn)。涉及硬件運(yùn)動控制時(shí),往往還需并行對接多套接口,研發(fā)周期動輒以月為單位。
本次發(fā)布會上,星辰智能體平臺和AIUI平臺實(shí)現(xiàn)完全打通,讓Agent一鍵接入語音交互,在AIUI“聽懂指令、理解意圖、執(zhí)行動作、語音反饋”基礎(chǔ)之上,結(jié)合智能體讓交互更個(gè)性化,支持多模態(tài)感知和輸出。事實(shí)上,這意味著:
·場景打通:智能體能夠極速接入機(jī)器人、智能穿戴與各類智能硬件,實(shí)現(xiàn)工業(yè)、家庭與消費(fèi)等場景落地。
·降本增效:通過更低的人力與時(shí)間成本,實(shí)現(xiàn)交互效率和效果的雙重提升。
桌面硬件機(jī)器人“小飛”現(xiàn)場展示了融合所帶來的進(jìn)化,當(dāng)主持人說:“小飛,你看看我們發(fā)布會現(xiàn)場感覺怎么樣?”。小飛準(zhǔn)確識別指令,自主移動并環(huán)顧四周,調(diào)用視覺能力并回復(fù):“我看到一個(gè)有柔和的燈光,還有好多正在關(guān)注我們的朋友”。
對于孩子難以理解古詩的場景,小飛也能輕松應(yīng)對,可以調(diào)用繪本智能體,將詩句轉(zhuǎn)化為圖文和聲音結(jié)合的繪本,幫助孩子輕松學(xué)、快樂學(xué)。依托于訊飛AIUI 1.6s的秒極速響應(yīng),讓用戶幾乎感覺不到卡頓,像真人聊天一樣流暢,實(shí)現(xiàn)了人類對話中的精髓——“有來有往”。
02定義智能體的形象與聲音
多模態(tài)交互 懂你更智能
相較于千篇一律的文本/語音交互,用戶更喜愛有“溫度”的交互對象。智能體要走向真實(shí)世界,不僅要在復(fù)雜環(huán)境中被聽見、被看見、被理解,并與人自然互動,還需要一個(gè)“五官”。
本次發(fā)布會上,全新升級多模態(tài)超擬人交互技術(shù),融合語音、人臉、環(huán)境等多模態(tài)信息,實(shí)現(xiàn)多人高噪場景下的自由交互,讓智能體得以搭載上豐富的聲音和形象,進(jìn)行更具象的情感表達(dá)。
聲音層面,超擬人合成在語音合成大模型底座升級賦能下實(shí)現(xiàn)提升,在自然度、情感表達(dá)、節(jié)奏停頓等維度和細(xì)節(jié)上表現(xiàn)更好,尤其在多輪交互中的效果顯著提升,具備“更快響應(yīng)、更懂情緒、更加靈活、更加百變”四大特點(diǎn),能像真人聊天一樣和我們“交心”。同時(shí)一句話復(fù)刻能力,也在支持的語種、方言以及多風(fēng)格表達(dá)上有了進(jìn)一步的突破,交互的底層聲音表達(dá)上更加擬人、多元。
形象層面,僅需一張照片就能生成專屬的數(shù)字人形象,口型、表情、動作均由大模型自動生成,可以自動匹配文本的意圖,進(jìn)一步降低數(shù)字人的應(yīng)用門檻。多模態(tài)超擬人交互技術(shù)的升級可以幫助企業(yè),快速打造專屬企業(yè)數(shù)字形象代言人,塑造統(tǒng)一、生動的品牌形象,積淀品牌資產(chǎn),實(shí)現(xiàn)品牌傳播;同時(shí),實(shí)現(xiàn)降本增效,賦能業(yè)務(wù)創(chuàng)新與全球化拓展。更重要的是,具備情感與溫度的交互方式,能夠顯著提升用戶粘性,持續(xù)驅(qū)動業(yè)務(wù)增長。
目前,搭載多模態(tài)超擬人交互技術(shù)的數(shù)字人已在企業(yè)服務(wù)、旅游導(dǎo)覽、陪伴學(xué)習(xí)、健康管理等多場景應(yīng)用,重塑服務(wù)體驗(yàn)。
在智慧大廳,數(shù)字人前臺通過多模態(tài)視覺理解,實(shí)時(shí)融合語音、人臉、環(huán)境等多模態(tài)信息,實(shí)現(xiàn)自動感知與主動迎賓。同時(shí)與多人自然交流,精準(zhǔn)識別人人對話與人機(jī)對話的意圖,并輔以生動的手勢與類人舉止反饋,讓每一次指引都清晰親切。
在業(yè)務(wù)終端,通過人臉識別快速認(rèn)證,數(shù)字人助手將引導(dǎo)用戶完成從查詢、填表到電子簽名的復(fù)雜業(yè)務(wù)流程,輕松自主辦結(jié)。
03智能體也有了MBTI
捏出懂你脾氣的專屬伙伴
“好看的形象”讓智能體擁有了辨識度,“有趣的靈魂”才是建立長期陪伴與信任的關(guān)鍵。此次升級,將角色性格從以往單薄的一段文案描述升級成了“可組合、可遷移”的能力模塊。
通過星辰MaaS的一句話精調(diào)模式,只需通過 “性格、經(jīng)歷、技能、語言習(xí)慣” 幾個(gè)維度的精準(zhǔn)描述,系統(tǒng)即可生成100條場景數(shù)據(jù),自動定制場景的角色模型,實(shí)現(xiàn)Agent交互的千人千面,除了一句話精調(diào),星辰MaaS基于高效的工具鏈+豐富的基座模型,還提供0代碼可視化精調(diào)、notebook精調(diào),滿足Agent各個(gè)環(huán)節(jié)的效果精調(diào),提升效果、效率的同時(shí)降低成本,助力應(yīng)用規(guī)?;鲩L。
星辰智能體平臺還上線了音色創(chuàng)造功能——通過與語種、情感、風(fēng)格等屬性的聯(lián)合訓(xùn)練,實(shí)現(xiàn)了音色與風(fēng)格的任意組合。不被錄音限制,一句指令要求,即可讓智能體實(shí)現(xiàn)聲音風(fēng)格的“瞬間”切換。
假設(shè)要制作一款三國戰(zhàn)略游戲,對于精調(diào)的曹操人設(shè),現(xiàn)在能夠在不改變角色模型前提下,僅僅調(diào)整音色描述,就可以賦予其“沉穩(wěn)梟雄”或“意氣青年”的不同聲線,讓歷史人物栩栩如生。
這種能力的結(jié)合,為教育、玩具、虛擬IP等場景提供了更大的想象空間。在玩具、教育等長期陪伴、高頻使用場景,用戶留下來靠的不是技能,而是像不像一個(gè)真正的伙伴。同樣,對虛擬IP來說,角色扮演性格本身就是產(chǎn)品的一部分,換一個(gè)性格就相當(dāng)于換了一種體驗(yàn)。
04讓智能體擁有“靈巧手腳”
接管重復(fù)性工作
智能體不僅要“能言善辯”,更要“躬身入局”,唯有真正接管任務(wù)才能釋放生產(chǎn)力。通過將 Agent 與 RPA 深度融合,星辰讓智能體具備了“動手”的能力,讓聰明的大腦搭配7x24小時(shí)不知疲倦的雙手。
針對RPA需要有技術(shù)背景才能玩轉(zhuǎn),大多數(shù)卡在“搭建流程”的尷尬處境。此次發(fā)布會,星辰平臺在RPA工作流編排層面帶來了兩項(xiàng)新能力——智能組件與數(shù)據(jù)表格,讓開發(fā)者能專注于業(yè)務(wù)邏輯編排,而非底層代碼實(shí)現(xiàn)。
智能組件:通過自然交互即可生成“可配置、可重復(fù)執(zhí)行”自動化組件,應(yīng)用于網(wǎng)頁自動化和基礎(chǔ)的數(shù)據(jù)、文本處理場景,極大地降低自動化能力的創(chuàng)造門檻。數(shù)據(jù)表格:用戶在流程中直接對數(shù)據(jù)進(jìn)行“讀寫、編輯、展示和導(dǎo)出”,讓整個(gè)自動化流程涉及到數(shù)據(jù)獲取和處理的部分變得更加透明和可調(diào)試,提升了復(fù)雜數(shù)據(jù)處理任務(wù)的可靠性和執(zhí)行效率。
發(fā)布會現(xiàn)場,通過在RPA設(shè)計(jì)器中拖入智能組件,一句自然語言指令就能自動打開指定網(wǎng)頁、精準(zhǔn)抓取待辦事項(xiàng)的標(biāo)題、時(shí)間等關(guān)鍵信息。整個(gè)流程還支持“對話式二次編輯”,可以像修改文檔一樣通過文字微調(diào)邏輯。流程運(yùn)行后,RPA 將自動接管瀏覽器,實(shí)現(xiàn)數(shù)據(jù)自動化篩選與提取,將結(jié)構(gòu)化信息呈現(xiàn)在“數(shù)據(jù)表格”,實(shí)現(xiàn)從原始網(wǎng)頁到業(yè)務(wù)報(bào)表的閉環(huán)。
事實(shí)上,在整場發(fā)布會中,多位RPA數(shù)字員工都在高效支撐——它們活躍在電腦中,幫助主持人自動通知演示官上場、回復(fù)同事信息、收取郵件設(shè)置待辦,完美展現(xiàn)了RPA的精準(zhǔn)執(zhí)行力。
05跨語言、懂業(yè)務(wù)的智能體
助力全球企業(yè)創(chuàng)新
在大模型時(shí)代,全球化成為企業(yè)的“共同選擇"??拼笥嶏w持續(xù)推進(jìn)全球化戰(zhàn)略,向全球開發(fā)者開放核心AI能力與解決方案。聚焦中東與東南亞兩大新興市場,星辰智能體平臺將多模交互與執(zhí)行能力同步延展至海外場景,構(gòu)建起覆蓋多行業(yè)的海外智能體矩陣。
從數(shù)千頁基建標(biāo)書的自動分析與比對,到多語言混雜的實(shí)時(shí)出行引導(dǎo),再到隱藏于復(fù)雜合同中的合規(guī)風(fēng)險(xiǎn)透視,覆蓋公共服務(wù)與出行、大型基建招投標(biāo)、金融與支付等場景,賦能全球企業(yè)業(yè)務(wù)的創(chuàng)新升級。在提升效率、管控風(fēng)險(xiǎn)的同時(shí),為全球企業(yè)構(gòu)建起可持續(xù)的智能化競爭力,打造全場景、全鏈路的智能新生態(tài)。
Agent的真正爆發(fā),也將始于它不再是一個(gè)需要用戶去“遷就”的對話框,而是一個(gè)能聽懂情緒、能處理表格、能跨越國界解決復(fù)雜問題的“貼心伙伴”。
全新升級的星辰智能體平臺,補(bǔ)齊了通往物理世界的最后三塊拼圖——感知的“五官”、執(zhí)行的“手腳”以及共情的“靈魂”。 從AIUI的語音閉環(huán)到RPA動作接管,從超擬人數(shù)字人的情感交互到出海場景的跨語言穿透,星辰正在構(gòu)建一套完整的“Agent 基礎(chǔ)設(shè)施”。
從“AI 技術(shù)”向“AI 原生應(yīng)用”跨越的臨界點(diǎn),唯有智能體“移出屏幕”,才能將AI深度嵌入工業(yè)生產(chǎn)、家庭陪伴、全球貿(mào)易等真實(shí)的商業(yè)毛細(xì)血管中,讓技術(shù)在最堅(jiān)硬的泥土里扎根。
當(dāng)成千上萬個(gè)具備“執(zhí)行力”的智能體走向生產(chǎn)一線,這場關(guān)于效率的革命,才算真正爆發(fā)!
-
智能體
+關(guān)注
關(guān)注
1文章
469瀏覽量
11604 -
科大訊飛
+關(guān)注
關(guān)注
19文章
860瀏覽量
63704
原文標(biāo)題:星辰智能體煥新發(fā)布,多模協(xié)同的「AI實(shí)干派」
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
訊飛智文產(chǎn)品完成重磅升級
科大訊飛設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局
訊飛星辰Agent平臺入選36氪WISE 2025年度焦點(diǎn)產(chǎn)品
2025科大訊飛全球1024開發(fā)者節(jié)精彩回顧
科大訊飛發(fā)布訊飛星火X1.5及系列AI產(chǎn)品
2025科大訊飛全球1024開發(fā)者節(jié)科博展開幕
香港立法會與科大訊飛聯(lián)合打造智慧謄錄系統(tǒng)“智識聽”
科大訊飛聯(lián)手“挑戰(zhàn)杯”加速國產(chǎn)算力應(yīng)用
科大訊飛加速東南亞企業(yè)的人工智能應(yīng)用
訊飛星辰Agent開發(fā)平臺發(fā)布
科大訊飛亮相第137屆廣交會
科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本
科大訊飛星辰智能體平臺升級發(fā)布
評論