91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器人市場(chǎng)化的人機(jī)語(yǔ)音交互

深圳市江智工業(yè)技術(shù)有限公司 ? 2023-04-03 11:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音交互無(wú)論是人與人溝通,還是AI人工智能時(shí)代人與機(jī)器人互動(dòng)以及機(jī)器人與機(jī)器人之間的交互等都是最為基礎(chǔ)重要的一種方式。

對(duì)于今天AI人工智能時(shí)代基本的平臺(tái)載體--機(jī)器人來(lái)說(shuō),人機(jī)語(yǔ)音交互必須首先具有的主要功能之一。

盡管?chē)?guó)內(nèi)的科大訊飛,百度以及目前最為火爆的國(guó)外Chat GPT已經(jīng)在人機(jī)語(yǔ)音交互技術(shù)上不斷地進(jìn)行突破,特別是Chat GPT給人的體驗(yàn)感。相信人機(jī)語(yǔ)音交互近年來(lái)市場(chǎng)化的應(yīng)用會(huì)帶來(lái)較大的變革與突破。但這多年實(shí)際市場(chǎng)上幾乎人機(jī)語(yǔ)音交互仍然還停留在最為初級(jí)還不足以支撐一個(gè)基本完整場(chǎng)景下的人與人交互的效果。

我們通過(guò)2016年至今2000臺(tái)左右機(jī)器人不同產(chǎn)業(yè)領(lǐng)域場(chǎng)景實(shí)際市場(chǎng)上的反饋以及人機(jī)語(yǔ)音交互市場(chǎng)化要求的不斷探索已基本上找到并驗(yàn)證過(guò)的方法與路徑。

首先我們回歸分析日常人與人語(yǔ)言交流的場(chǎng)景狀況。其主要特點(diǎn)如下:

1交談的主要內(nèi)容話(huà)題:無(wú)論是初次見(jiàn)面還是相識(shí)后的交流,基本上都是群體(行業(yè)/公司/朋友/親戚等)內(nèi)的相關(guān)的內(nèi)容。

2內(nèi)容的屬性:大部分溝通的內(nèi)容中是不便對(duì)外界完全可公開(kāi)的。也就是說(shuō)具有一定范圍群體的私密性。

3內(nèi)容的范圍延展性: 交談的內(nèi)容有些是已發(fā)生的;有些是計(jì)劃要做的;有些是即興而說(shuō)的。

4內(nèi)容的頻次與關(guān)聯(lián)性:前后交流的內(nèi)容話(huà)題基本上關(guān)聯(lián)度比較高;前后之間交流內(nèi)容的跨度不大,內(nèi)容頻次較高。

5公共話(huà)題內(nèi)容:交流中也會(huì)涉及到與話(huà)題引發(fā)的公眾內(nèi)容,也就是可以對(duì)任何人不存在隱私的內(nèi)容。

6交互的時(shí)長(zhǎng)與內(nèi)容跨度:一般交流的時(shí)間與交談內(nèi)容的跨度不會(huì)很大。

然后我們?cè)賮?lái)分析一下人機(jī)語(yǔ)音交互內(nèi)容的主要方法:

目前主流方法就是通過(guò)對(duì)相關(guān)大數(shù)據(jù)的訓(xùn)練并賦予模型深度學(xué)習(xí)的辦法。當(dāng)然效果要好就需要有大量的相關(guān)數(shù)據(jù)資源以及技術(shù)團(tuán)隊(duì)包括資金的支撐。

最后的結(jié)論與正確的做法路徑

1 我們從上述方法與人與人溝通的主要特點(diǎn)對(duì)比不難看出:目前主流做法訓(xùn)練出的人機(jī)語(yǔ)音交互還是不能支撐替代人與人實(shí)際交流溝通場(chǎng)景的主要內(nèi)容。

2 正確的做法就是:基于訊飛/百度/Chat GPT基礎(chǔ)上+自有系統(tǒng)上的數(shù)據(jù)庫(kù)(這個(gè)才是支撐交互溝通內(nèi)容的主要部分)而且這個(gè)數(shù)據(jù)庫(kù)的內(nèi)容也必須由用戶(hù)/相關(guān)人自己隨時(shí)根據(jù)實(shí)際需要來(lái)完善增添。

3我們近2年來(lái)通過(guò)上述辦法開(kāi)發(fā)的人機(jī)語(yǔ)音交互軟件,通過(guò)實(shí)際用戶(hù)的使用體驗(yàn)以及與別家的對(duì)比;效果非常明顯;用戶(hù)體驗(yàn)感強(qiáng);愿意使用,評(píng)價(jià)較高。當(dāng)然我們會(huì)繼續(xù)按此思路不斷完善升級(jí)軟件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31073

    瀏覽量

    222172
  • 人機(jī)語(yǔ)音
    +關(guān)注

    關(guān)注

    0

    文章

    3

    瀏覽量

    7236
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI機(jī)器人方案_ai人機(jī)對(duì)話(huà)機(jī)器人PCBA硬件定制開(kāi)發(fā)

    隨著人工智能技術(shù)的不斷進(jìn)步,人機(jī)交互的方式正變得更加自然與高效。一款基于聯(lián)發(fā)科MTK八核處理器的AI對(duì)話(huà)機(jī)器人方案脫穎而出,憑借其強(qiáng)大的性能、多樣顯示方案和卓越的語(yǔ)音
    的頭像 發(fā)表于 12-24 20:19 ?1255次閱讀
    AI<b class='flag-5'>機(jī)器人</b>方案_ai<b class='flag-5'>人機(jī)對(duì)話(huà)機(jī)器人</b>PCBA硬件定制開(kāi)發(fā)

    端到端語(yǔ)音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    總監(jiān)孫穎欣在地瓜機(jī)器人的DDC2025 人機(jī)交互分論壇上指出,大模型時(shí)代的交互方式經(jīng)歷了三個(gè)關(guān)鍵階段的演進(jìn):第一階段是文本、語(yǔ)音交互第二階段
    發(fā)表于 12-01 01:07 ?1725次閱讀
    端到端<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>革命:百度智能云聯(lián)合地瓜<b class='flag-5'>機(jī)器人</b>,重塑AI陪伴體驗(yàn)

    RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    引擎,訪問(wèn)并顯示米爾官方網(wǎng)頁(yè),承擔(dān)人機(jī)信息查詢(xún)與交互角色?!?MINI DP接口(27寸顯示器):實(shí)時(shí)顯示8路攝像頭捕捉的圖像預(yù)覽,充當(dāng)機(jī)器人的"視覺(jué)監(jiān)控中心"
    發(fā)表于 10-29 16:41

    小蘿卜機(jī)器人的故事

    經(jīng)過(guò)我的申請(qǐng), 馬老師發(fā)放了, 小蘿卜機(jī)器人的, 開(kāi)發(fā)權(quán)限, 原來(lái)的小蘿卜公司, 因?yàn)榻?jīng)營(yíng)不善倒閉, 作為科研產(chǎn)品, 幾個(gè)技術(shù)對(duì)此惋惜, 自掏腰包, 要讓小蘿卜機(jī)器人, 再生, 每次聽(tīng)到小蘿卜說(shuō)
    發(fā)表于 10-23 05:24

    語(yǔ)音機(jī)器人交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    ? ? ? 語(yǔ)音機(jī)器人交互系統(tǒng)是融合多學(xué)科技術(shù)的復(fù)雜工程,其核心目標(biāo)是實(shí)現(xiàn)機(jī)器間的自然、流暢語(yǔ)音
    的頭像 發(fā)表于 09-02 11:08 ?825次閱讀

    再掀語(yǔ)音交互革命,廣和通AI解決方案加速機(jī)器人聽(tīng)覺(jué)進(jìn)化

    機(jī)器人世界里,感知是智能的第一步,是機(jī)器人獲取環(huán)境信息,學(xué)習(xí)適應(yīng)并自主決策的前提。聽(tīng)覺(jué)作為五感之一,深度融合AI,可幫助機(jī)器人實(shí)現(xiàn)高效感知、數(shù)據(jù)獲取、
    的頭像 發(fā)表于 08-26 17:44 ?889次閱讀

    工業(yè)機(jī)器人的特點(diǎn)

    的基礎(chǔ),也是三者的實(shí)現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機(jī)床、工業(yè)機(jī)器人、自動(dòng)化成套生產(chǎn)線(xiàn)、精密儀器儀表、智能傳感器、汽車(chē)自動(dòng)焊接線(xiàn)、柔性自動(dòng)化生產(chǎn)線(xiàn)、智能農(nóng)機(jī)、3D 打印機(jī)等領(lǐng)域。而智能制造裝備中工業(yè)
    發(fā)表于 07-26 11:22

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強(qiáng)勁的運(yùn)算性能,能夠高效處理語(yǔ)音機(jī)器人運(yùn)行過(guò)程中的復(fù)雜任務(wù)。語(yǔ)音識(shí)別和合成需要大量的計(jì)算資源,該處理器可以快速對(duì)語(yǔ)音信號(hào)進(jìn)行分析、處理和轉(zhuǎn)換。在實(shí)時(shí)
    發(fā)表于 05-28 11:36

    盤(pán)點(diǎn)#機(jī)器人開(kāi)發(fā)平臺(tái)

    Athena機(jī)器人****開(kāi)發(fā)平臺(tái)思嵐推出Athena機(jī)器人開(kāi)發(fā)平臺(tái),有望主導(dǎo)機(jī)器人開(kāi)發(fā)平臺(tái)未來(lái)市場(chǎng)-電子發(fā)燒友網(wǎng)AUTO CUBEROS機(jī)器人
    發(fā)表于 05-13 15:02

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    免與行人發(fā)生碰撞,為旅客提供安全、舒適的引導(dǎo)服務(wù)。 智能交互系統(tǒng) 語(yǔ)音識(shí)別與理解 :智能指路機(jī)器人利用先進(jìn)的語(yǔ)音識(shí)別技術(shù),將旅客輸入的語(yǔ)音
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門(mén)的引路書(shū)

    ROS的全稱(chēng):Robot Operating System 機(jī)器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫(kù),是通信總線(xiàn),協(xié)調(diào)多個(gè)傳感器 為了解決機(jī)器人里各廠商模塊不通用的問(wèn)題,讓機(jī)器人快速開(kāi)發(fā)
    發(fā)表于 04-30 01:05

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開(kāi)源六軸機(jī)械臂產(chǎn)品

    識(shí)別聯(lián)調(diào)。 進(jìn)迭時(shí)空致力于為智能機(jī)器人提供完整全棧優(yōu)化的RISC-V AI軟硬件解決方案,第一代RISC-V AI CPU芯片K1已完成AI視覺(jué)感知、AI語(yǔ)音處理、自動(dòng)避障、路徑規(guī)劃、運(yùn)動(dòng)控制等
    發(fā)表于 04-25 17:59

    具身智能工業(yè)機(jī)器人人機(jī)交互設(shè)計(jì):重新定義人機(jī)協(xié)作新體驗(yàn)

    在工業(yè) 4.0 時(shí)代,機(jī)器人不再是冰冷的機(jī)械臂,而是成為與人類(lèi)協(xié)同創(chuàng)造價(jià)值的 “智能伙伴”。富唯智能憑借具身智能工業(yè)機(jī)器人人機(jī)交互設(shè)計(jì),突破傳統(tǒng)操作界面的局限,通過(guò)自然語(yǔ)言、手勢(shì)識(shí)別、力控反饋等多模態(tài)交互技術(shù),構(gòu)建了安全、高效、
    的頭像 發(fā)表于 04-07 15:02 ?1223次閱讀

    零知開(kāi)源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開(kāi)發(fā)教程

    小智AI聊天機(jī)器人是一個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開(kāi)發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言處理、音頻解碼播放及圖形
    的頭像 發(fā)表于 03-29 15:33 ?1.2w次閱讀
    零知開(kāi)源——ESP32<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開(kāi)發(fā)教程

    基于WTVxxx語(yǔ)音芯片的智能清潔機(jī)器人語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

    ?一、產(chǎn)品概述與設(shè)計(jì)需求隨著智能家居設(shè)備的普及,擦窗機(jī)器人和掃地機(jī)器人逐漸成為家庭清潔的重要工具。為提升用戶(hù)體驗(yàn),語(yǔ)音交互功能成為產(chǎn)品差異化的關(guān)鍵需求。廣州唯創(chuàng)電子WTVxxx系列
    的頭像 發(fā)表于 03-06 08:27 ?831次閱讀
    基于WTVxxx<b class='flag-5'>語(yǔ)音</b>芯片的智能清潔<b class='flag-5'>機(jī)器人語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)設(shè)計(jì)方案介紹