91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開發(fā)者說 | AI操控機(jī)器人系列第三期——語音控制

地瓜機(jī)器人 ? 2022-08-17 11:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:

AI操控機(jī)器人系列第二期的人體跟隨教程中,身為地平線資深程序員的奶爸朱靠,使用地平線發(fā)布的機(jī)器人開發(fā)平臺TogetherROS軟件棧,搭建了人體跟隨機(jī)器人。

同為開發(fā)者的梁雪,期待AI的世界,想讓自己的生活也AI一把,并且一向是個能動口絕不動手的懶人,于是熱衷于體驗(yàn)各類AI機(jī)器人,尤其是動動口就能操控的機(jī)器人,想著有朝一日過上“能只動口絕不動手”的生活,于是乎,就有了下面的這些體驗(yàn)。

產(chǎn)品A:說說話確實(shí)是能跟著走一走,but,我真的不想說完話之后還需要自己向右轉(zhuǎn)才能引導(dǎo)它右轉(zhuǎn)呀……

產(chǎn)品B:為什么還是得動動手,遙控來操控……噢,可達(dá)不到懶人預(yù)期呢。

難道就沒有動動口就能讓機(jī)器人運(yùn)動,達(dá)到控制機(jī)器人的目的嗎?答案必然是,有!下面地平線AI操控機(jī)器人系列——語音控制閃亮登場。

一、功能介紹

大家先看一下最終實(shí)現(xiàn)的功能。

20220815-190006.gif

從開始語音到機(jī)器人依據(jù)指令快速且準(zhǔn)確的運(yùn)動,得益于地平線旭日??X3派上5Tops算力的BPU,可以實(shí)現(xiàn)低延遲算法推理能力,以及語音算法模塊實(shí)現(xiàn)的遠(yuǎn)場(3~5米)降噪、回聲消除,高準(zhǔn)確率的asr識別功能。開始碼代碼前,先來簡單分析一下人體跟隨機(jī)器人需要具備哪些基本模塊。

語音輸入——麥克風(fēng)

旭日X3派采用的是麥克風(fēng)陣列硬件拾音,通過麥克風(fēng)采集到音頻之后交給后面的智能語音分析模塊處理。

智能語音感知

智能語音算法對原始音頻進(jìn)行處理,對音頻進(jìn)行降噪并且識別出語音,同時(shí)還能輸出語音聲源定位的DOA角度。

交互

識別出語音之后,定義并且實(shí)現(xiàn)不同語音對應(yīng)的不同功能應(yīng)用,比如“向前走”語音控制機(jī)器人向前運(yùn)動。

控制

根據(jù)“交互”模塊輸出的控制指令,實(shí)現(xiàn)對機(jī)器人的機(jī)械控制。

機(jī)器人本體

當(dāng)然還需要一個具備運(yùn)動能力的機(jī)器人本體,接收控制指令并控制電機(jī)運(yùn)動,最終實(shí)現(xiàn)通過語音控制機(jī)器人運(yùn)動的效果。

地平線發(fā)布的機(jī)器人開發(fā)平臺TogetherROS軟件棧內(nèi)置了豐富易用的機(jī)器人開發(fā)組件,包含搭建一個智能機(jī)器人應(yīng)用(如機(jī)器人語音控制)所涉及到的所有功能模塊,完全開源免費(fèi),并允許開發(fā)者二次開發(fā)。

二、準(zhǔn)備工作

準(zhǔn)備搭建機(jī)器人人體跟隨應(yīng)用案例的硬件設(shè)備和軟件包。

硬件

①旭日X3派

3.png


②麥克風(fēng)陣列及轉(zhuǎn)接板

640.jpg


③機(jī)器人

5.png


本次使用本末的輪足機(jī)器人來介紹,沒有的開發(fā)者們也不用擔(dān)心,文章后面會介紹自己搭建機(jī)器人的方式。

安裝系統(tǒng)
參考旭日X3派的用戶手冊的安裝系統(tǒng)章節(jié),安裝完成(或者已經(jīng)安裝過)需要更新系統(tǒng)。

系統(tǒng)配置
配置旭日X3派的無線網(wǎng)絡(luò),參考旭日X3派的用戶手冊的無線網(wǎng)絡(luò)章節(jié)。

安裝TogetherROS
使用apt命令通過DEB包安裝TogetherROS。登錄旭日X3派ssh root@192.168.1.147,執(zhí)行命令:

root@ubuntu:~# sudo apt install hhp
root@ubuntu:/userdata# ls /opt/
tros

可以看到TogetherROS已安裝在/opt目錄下,說明安裝成功。至此,準(zhǔn)備工作結(jié)束,下面開始使用這些硬件設(shè)備和軟件包搭建機(jī)器人人體跟隨App。

三、使用介紹

接下來開始操作各個功能模塊,再一步步組裝起來,分別驗(yàn)證其功能。

安裝音頻麥克風(fēng)

首先需要將旭日X3派與音頻轉(zhuǎn)接板連接起來,安裝好的旭日X3派以及音頻板圖如下:

接口.jpg


直接使用TogetherROS中的ROS package測試麥克風(fēng)陣列的功能,通過腳本加載麥克風(fēng)陣列驅(qū)動,并且啟動智能語音識別模塊。登錄旭日X3派ssh root@192.168.1.147后,在終端(以下默認(rèn)終端都是通過ssh登錄)中輸入以下命令啟動:

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
# 從TogetherROS的安裝路徑中拷貝出運(yùn)行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加載音頻驅(qū)動,設(shè)備啟動之后只需要加載一次
bash config/audio.sh
#啟動launch文件
ros2 launch hobot_audio hobot_audio.launch.py

智能語音識別模塊默認(rèn)發(fā)布的智能語音消息話題名為:/audio_smart, 在另一個終端執(zhí)行使用ros2 topic list命令可以查詢到此topic信息:

$ ros2 topic list
/audio_smart

語音識別和命令詞控制小車運(yùn)動功能

旭日X3派上打開一個終端,啟動語音識別和控制的腳本

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
# 從TogetherROS的安裝路徑中拷貝出運(yùn)行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加載音頻驅(qū)動,設(shè)備啟動之后只需要加載一次
bash config/audio.sh
#啟動launch文件
ros2 launch audio_control hobot_audio_control.launch.py

在當(dāng)前終端執(zhí)行ros2 topic echo /cmd_vel命令查詢旭日X3派上的話題信息,當(dāng)語音控制“向前走”,終端輸出如下:

linear:
  x: 0.30000001192092896
  y: 0.0
  z: 0.0
angular:
  x: 0.0
  y: 0.0
  z: 0.0

說明智能語音識別算法和交互功能的軟件包已安裝成功,并能夠通過/cmd_vel話題對外發(fā)布機(jī)器人運(yùn)動控制消息。

將旭日X3派安裝在機(jī)器人上

首先,需要將音頻板安裝在旭日X3派上,其次,將安裝了線性四麥麥克風(fēng)陣列的旭日X3派直接固定在機(jī)器人上,并將機(jī)器人的USB控制接口插到旭日X3派上。安裝效果如下圖:

10 (3).jpg

安裝好后,可以通過控制機(jī)器人運(yùn)動查看是否成功安裝。在旭日X3派上啟動本末雙足機(jī)器人運(yùn)行控制Node,打開一個終端,執(zhí)行如下命令:

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
#啟動本末機(jī)器人運(yùn)動控制package
ros2 run diablo_sdk ros_bridge_example

旭日X3派上重新打開一個終端,通過發(fā)布/cmd_vel話題消息控制機(jī)器人以0.3r/s的速度轉(zhuǎn)動:


# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
ros2 topic pub -r 10 /cmd_vel geometry_msgs/Twist '{linear: {x: 0, y: 0, z: 0}, angular: {x: 0, y: 0, z: 0.3}}'

機(jī)器人收到控制指令后轉(zhuǎn)動的效果如下:

轉(zhuǎn).gif

四、完整的機(jī)器人語音控制效果

旭日X3派上打開一個終端,啟動智能語音識別和語音控制腳本

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
# 從TogetherROS的安裝路徑中拷貝出運(yùn)行示例需要的配置文件。
cp -r /opt/tros/lib/hobot_audio/config/ .
# 加載音頻驅(qū)動,設(shè)備啟動只需要加載一次
bash config/audio.sh
#啟動語音控制launch文件
ros2 launch audio_control hobot_audio_control.launch.py

旭日X3派上打開一個終端,啟動機(jī)器人運(yùn)動控制Node

# 配置TogetherROS環(huán)境
source /opt/tros/setup.bash
#啟動本末機(jī)器人運(yùn)動控制Node
ros2 run diablo_sdk ros_bridge_example

通過語音控制機(jī)器人運(yùn)動

20220815-190006.gif

五、原理分析

對于一個復(fù)雜的機(jī)器人系統(tǒng),一般在機(jī)器人上配置上位機(jī)和下位機(jī)兩種處理器。語音控制機(jī)器人由兩部分組成,分為上位機(jī)和下位機(jī)。各部分詳細(xì)組成如下圖:

17.jfif

!

六、語音控制進(jìn)階

智能語音識別Node中,設(shè)備喚醒詞和命令詞默認(rèn)配置/opt/tros/lib/hobot_audio/config/hrsc/cmd_word.json文件下(當(dāng)然,若用戶將此config文件夾拷貝到了其他路徑,那以實(shí)際使用的配置路徑為準(zhǔn)):

{
    "cmd_word": [
        "地平線你好",
        "向前走",
        "向后退",
        "向左轉(zhuǎn)",
        "向右轉(zhuǎn)",
        "停止運(yùn)動"
    ]
}

配置文件的第一項(xiàng)為喚醒詞,后面的是命令詞,用戶可以根據(jù)需要進(jìn)行配置,實(shí)現(xiàn)語音操作的自定義。

本文轉(zhuǎn)自地平線開發(fā)者社區(qū),完整文章內(nèi)容詳見:https://developer.horizon.ai/forumDetail/109609560406362625

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116116
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50145

    瀏覽量

    265812
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    513

    瀏覽量

    29699
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Jetson系列開發(fā)者套件助力打造面向未來的智能機(jī)器人

    NVIDIA Jetson AGX Thor、AGX Orin 以及 Jetson Orin Nano Super 開發(fā)者套件,助力打造面向未來的智能機(jī)器人
    的頭像 發(fā)表于 12-13 10:20 ?3123次閱讀

    打造機(jī)器人母生態(tài)!一年開發(fā)者數(shù)量翻倍,地瓜機(jī)器人發(fā)布具身智能大算力開發(fā)平臺

    增長200%,個人開發(fā)者數(shù)量翻倍。 ? 作為機(jī)器人芯片公司,地瓜機(jī)器人已經(jīng)打造了兩大系列產(chǎn)品:旭日X系列主打高性價(jià)比,面向泛消費(fèi)
    的頭像 發(fā)表于 11-27 09:16 ?7973次閱讀
    打造<b class='flag-5'>機(jī)器人</b>母生態(tài)!一年<b class='flag-5'>開發(fā)者</b>數(shù)量翻倍,地瓜<b class='flag-5'>機(jī)器人</b>發(fā)布具身智能大算力<b class='flag-5'>開發(fā)</b>平臺

    廣和通亮相DDC 2025地瓜機(jī)器人開發(fā)者大會

    11月21日,DDC2025地瓜機(jī)器人開發(fā)者大會在深圳順利舉行。大會匯聚來自機(jī)器人全產(chǎn)業(yè)鏈的技術(shù)團(tuán)隊(duì)、生態(tài)伙伴與開發(fā)者,共同探討機(jī)器人技術(shù)的
    的頭像 發(fā)表于 11-26 15:49 ?519次閱讀
    廣和通亮相DDC 2025地瓜<b class='flag-5'>機(jī)器人</b><b class='flag-5'>開發(fā)者</b>大會

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運(yùn)動控制方案

    方案; 開發(fā)者可直接對接上層 ROS 框架,實(shí)現(xiàn)多軸機(jī)器人同步控制與智能路徑規(guī)劃。 、典型應(yīng)用:高精度裝配機(jī)器人
    發(fā)表于 11-14 15:48

    鑄校企合作典范,領(lǐng)無鉛技術(shù)前沿!奧迪威與蘭州大學(xué)舉行聯(lián)合研究院第三期合作簽約儀式

    鑄校企合作典范,領(lǐng)無鉛技術(shù)前沿!奧迪威與蘭州大學(xué)舉行聯(lián)合研究院第三期合作簽約儀式
    的頭像 發(fā)表于 11-04 15:30 ?859次閱讀
    鑄校企合作典范,領(lǐng)無鉛技術(shù)前沿!奧迪威與蘭州大學(xué)舉行聯(lián)合研究院<b class='flag-5'>第三期</b>合作簽約儀式

    RK3576機(jī)器人核心:屏異顯+八路攝像頭,重塑機(jī)器人交互與感知

    ,以其"屏異顯"和"八路攝像頭"的強(qiáng)悍能力,為機(jī)器人開發(fā)者提供了前所未有的強(qiáng)大算力平臺。米爾電子基于其MYD-LR3576
    發(fā)表于 10-29 16:41

    亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進(jìn)程

    北京——2025年10月28日 ,亞馬遜云科技第三期創(chuàng)業(yè)加速器項(xiàng)目圓滿收官。35家入營企業(yè)齊聚一堂,分享了各自的業(yè)務(wù)發(fā)展情況,以及參與本期加速器的收獲及體驗(yàn)。第三期創(chuàng)業(yè)加速器持續(xù)聚焦AI,特別是前沿
    的頭像 發(fā)表于 10-29 15:18 ?956次閱讀

    涂鴉AI畫畫機(jī)器人開發(fā)方案

    兒童教育的畫畫機(jī)器人品牌,通過語音互動激發(fā)孩子創(chuàng)作力,已暢銷全球100多個國家。為助力開發(fā)者和各類品牌高效構(gòu)建此類產(chǎn)品,涂鴉重點(diǎn)突破AI語音
    的頭像 發(fā)表于 06-12 18:17 ?1450次閱讀
    涂鴉<b class='flag-5'>AI</b>畫畫<b class='flag-5'>機(jī)器人</b><b class='flag-5'>開發(fā)</b>方案

    明遠(yuǎn)智睿SSD2351開發(fā)板:語音機(jī)器人領(lǐng)域的變革力量

    源的開發(fā)資料為開發(fā)者提供了深入研究和定制語音機(jī)器人功能的基礎(chǔ),開發(fā)者可以根據(jù)不同的應(yīng)用需求,對語音
    發(fā)表于 05-28 11:36

    網(wǎng)課回放 I 升級版“一站式” PCB 設(shè)計(jì)第三期:原理圖完整性及可靠性分析

    網(wǎng)課回放 I 升級版“一站式” PCB 設(shè)計(jì)第三期:原理圖完整性及可靠性分析
    的頭像 發(fā)表于 05-10 11:09 ?659次閱讀
    網(wǎng)課回放 I 升級版“一站式” PCB 設(shè)計(jì)<b class='flag-5'>第三期</b>:原理圖完整性及可靠性分析

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    的非常好的,特別是一些流程圖,很清晰的闡釋了概念 很適合作為初學(xué)者入門的引路書 還能了解很多技術(shù)和框架,破除初學(xué)者的自負(fù)困境,讓初學(xué)者知道功能是由很多開發(fā)者維護(hù)的,前人已經(jīng)為各種產(chǎn)品搭建了完善的框架。避免陷入得一個單打獨(dú)斗的錯覺 一直蠢蠢欲動ros2和
    發(fā)表于 04-30 01:05

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品

    末端執(zhí)行器。 全棧開源 從RISC-V指令集、芯片SDK到機(jī)器人控制代碼100%開放,開發(fā)者可自由定制算法與控制邏輯。 官方apt倉庫提供deepseek-r1-distill-qwe
    發(fā)表于 04-25 17:59

    思必馳助力2025年第三期科技人才沙龍活動

    近日,由蘇州市科學(xué)技術(shù)協(xié)會主辦,思必馳科技股份有限公司承辦的2025第三期科技人才沙龍“具身智能機(jī)器人創(chuàng)新生態(tài)研討”活動成功舉辦。活動匯聚了來自相關(guān)企業(yè)、高校院所、學(xué)會協(xié)會等近60名專業(yè)人士參加,圍繞具身智能機(jī)器人領(lǐng)域的技術(shù)突破
    的頭像 發(fā)表于 04-24 15:42 ?844次閱讀

    第三期 “亞馬遜云科技創(chuàng)業(yè)加速器” 正式啟動

    新 助力生成式 AI 初創(chuàng)企業(yè)釋放潛能,加速全球化進(jìn)程 ? 北京 ——2025 年 4 月 18 日 亞馬遜云科技今日宣布,第三期 "亞馬遜云科技創(chuàng)業(yè)加速器" 正式啟動。亞馬遜云科技將聯(lián)合包括啟明創(chuàng)
    發(fā)表于 04-18 10:46 ?1279次閱讀

    地瓜機(jī)器人,和全球機(jī)器人開發(fā)者交朋友

    前言自2024年9月20日在國內(nèi)官宣以來,地瓜機(jī)器人(D-Robotics)正在以行業(yè)領(lǐng)軍者的角色,開放姿態(tài)擁抱全球機(jī)遇,致力于和全球機(jī)器人開發(fā)者交朋友。短短半年間,從亞洲的東京、首爾、新加坡
    的頭像 發(fā)表于 03-24 15:27 ?1730次閱讀
    地瓜<b class='flag-5'>機(jī)器人</b>,和全球<b class='flag-5'>機(jī)器人</b><b class='flag-5'>開發(fā)者</b>交朋友