市場研究估計,自然語言處理市場將從 2021 年的 209.8 億美元增長到 2028 年的超過 1270 億美元。同樣,人工智能視覺市場預(yù)計將從 2020 年的 70.4 億美元增長到 1444.6 億美元。
顯然,人工感官知覺正在興起。
對于構(gòu)建視覺和對話計算系統(tǒng)的開發(fā)人員,Smart Cow Apollo AI 工程套件考慮了 NVIDIA Jetson Xavier NX 計算模塊的 21 TOPS 性能和四個麥克風(fēng)、兩個揚聲器端子、兩個 3.5 毫米電話插孔、一個 8MP 攝像頭模塊、一個 OLED 顯示器,以及一個 128 GB NVMe SSD 進(jìn)入等式。
Apollo 套件的特色NVIDIA Jetson Xavier NX 計算模塊與 NVIDIA Riva、DeepStream 和開箱即用的 JetPack SDK 可加速創(chuàng)建基于邊緣 AI 的自動語音識別 (ASR) 和自然語言處理 (NLP) 解決方案。
兩個 PVA 視覺加速器、兩個深度學(xué)習(xí)加速器、H.264 和 H.265 視頻編碼器/解碼器增強了這種性能。高速數(shù)據(jù)傳輸還可以使用 8 GB 到 16 GB 的 128 位 LPDDR4x 內(nèi)存,運行速度高達(dá) 60 Gbps,或者通過使用 16 GB 的板載 eMMC 5.1 閃存使事情更持久。
當(dāng)然,Apollo Kit 的獨特之處在于它周圍的一切:
內(nèi)置音頻編解碼器支持其 4 個 MEMS 麥克風(fēng)
8MP IMX179 攝像頭模塊支持多種視覺應(yīng)用
2.08 英寸 OLED 顯示屏顯示狀態(tài)和其他讀數(shù)
隨附的 128 GB NVMe SSD 預(yù)裝了上述 NVIDIA SDK
底架使其能夠直立以進(jìn)行符合人體工程學(xué)的工程
SmartCow Apollo 音頻/視頻工程套件在行動:
希望開發(fā)基于感知的應(yīng)用程序原型的開發(fā)人員可以通過設(shè)備正面的 40 針接頭或側(cè)面的 USB 端口訪問 Apollo Kit 資源。套件上還有一個以太網(wǎng) RJ45 插孔,供希望在項目中添加網(wǎng)絡(luò)元素的用戶使用。
通過系統(tǒng)訪問,工程師幾乎可以立即開始利用 NVIDIA SDK 提供的所有軟件功能。不僅 Riva、DeepStream 和 JetPack SDK 提供了簡化應(yīng)用程序開發(fā)的框架,在許多情況下,SmartCow 還在套件上實施了可立即運行的演示和用例優(yōu)化的 AI 模型,以幫助您起步。
例如:
ASR示例利用 NVIDIA Citrinet 模型轉(zhuǎn)錄口語(語音到文本)
基于開源 NLTK 模型的 NLP 示例應(yīng)用程序分析文本數(shù)據(jù)以確定輸入文本的正面或負(fù)面程度,該應(yīng)用程序?qū)⒃?OLED 屏幕上顯示一頭表情牛。此設(shè)置還支持命名實體識別 (NER),這是一個從句子中確定命名實體的過程。
第三個聊天機器人演示利用 Chatterbot 開源 GitHub 存儲庫在 Jetson 上創(chuàng)建兩個互相通信的聊天機器人實例。用戶可以運行其他 NLP 任務(wù),例如對聊天機器人生成的文本進(jìn)行情感分析,并在生成的文本上使用文本到語音。
該套件隨附的其他軟件包括用于視聽 AI 應(yīng)用程序的 Gstreamer (webRTC) 開源多媒體框架示例和主機 Ubuntu Linux 操作系統(tǒng)。
Apollo 音頻/視頻 AI 工程套件入門
Apollo 音頻/視頻 AI 工程套件的尺寸為 81 x 69 x 125 毫米,因此您真正需要的只是工作臺和開發(fā) PC 上的足夠空間。
審核編輯:郭婷
-
Linux
+關(guān)注
關(guān)注
88文章
11772瀏覽量
219132 -
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
7405瀏覽量
129378 -
AI
+關(guān)注
關(guān)注
91文章
40001瀏覽量
301630
發(fā)布評論請先 登錄
SmartCow的Apollo音頻/視頻AI工程套件
評論