91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能語音技術(shù)大有可為

MEMS ? 來源:中國電子報 ? 作者:中國電子報 ? 2021-05-24 10:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說到聲音,你會想到什么?是人講話的聲音、汽車發(fā)動機啟動時發(fā)出的轟鳴聲,還是手指敲擊鍵盤的陣陣窸窣聲?每天縈繞于人耳的聲音其實是包羅萬象的,有關(guān)聲音的學問也與人工智能領(lǐng)域有著密不可分的關(guān)系。

“人耳能聽到的聲音大體上可以為幾種?!北笨迫鹇暱萍脊煞萦邢薰靖笨偨?jīng)理黃石磊告訴《中國電子報》記者,“第一類聲音是人們?nèi)粘Uf話的聲音,即語音;第二類是音樂;第三類聲音分別是自然界、城市生產(chǎn)生活中產(chǎn)生的聲音。這三者我們通常也稱為廣義的音頻。”所有的聲音都蘊藏著“智慧”的要義,智能系統(tǒng)通過機器感知技術(shù)可以實現(xiàn)聲音采集、識別和理解等信息處理,也可以利用更加復雜的技術(shù)進行分析,最終實現(xiàn)人機對話、智能判析和決策。作為人工智能產(chǎn)業(yè)鏈的重要細分領(lǐng)域之一,智能音頻處理也因此有了賦能千行百業(yè)的力量。

智能語音技術(shù)大有可為

現(xiàn)階段,我們正處在一個信息爆炸的時代,每個行業(yè)的發(fā)展都會產(chǎn)生海量的信息。正是這些浩如煙海的信息,構(gòu)成了非常專業(yè)和復雜的系統(tǒng)。要想在這個復雜的系統(tǒng)下將業(yè)務(wù)流程做到標準化和規(guī)范化,智能語音的應(yīng)用就顯得尤為關(guān)鍵。

“語音是人們一種最自然的交互方式,它有非接觸、可穿透等特性。”北科瑞聲科技股份有限公司總經(jīng)理助理汪雪說,“基于它的特性,語音是賦能傳統(tǒng)行業(yè)最好的方式之一?!?/p>

汪雪表示,智能語音的應(yīng)用十分自然,可以賦能非常多的應(yīng)用場景。在看到智能語音市場中存在的發(fā)展機遇后,北科瑞聲選擇了智能音頻賽道,專注于人工智能語音音頻信息處理,目前已成為國內(nèi)擁有全鏈條語音技術(shù)的人工智能企業(yè)。

與國外的Nuance、谷歌、蘋果、微軟和國內(nèi)的科大訊飛、百度、小i機器人等眾多擁有全棧技術(shù)的智能語音企業(yè)不同,北科瑞聲對垂直領(lǐng)域進行了定制化研發(fā),更多專注于與特定行業(yè)結(jié)合的智能語音技術(shù),產(chǎn)品應(yīng)用也面向醫(yī)療、政務(wù)和交通等特定行業(yè)。黃石磊以醫(yī)療行業(yè)為例向記者表示,運用智能語音技術(shù)可以讓每位醫(yī)務(wù)工作者都擁有一個自動化語音小助手,這個語音小助手能夠聽懂他講話,并在必要時給他提供幫助。

“各行業(yè)業(yè)務(wù)流程的信息化和規(guī)范化會涉及很多重復的工作,而通過智能化的手段可以自動完成這些重復的工作?!秉S石磊對記者說,“這能夠大大提升專業(yè)工作人員的效率。”

例如在醫(yī)療信息化應(yīng)用中,目前北科瑞聲正在布局的醫(yī)療行業(yè)面臨真實環(huán)境帶來的難題。黃石磊談道,除了人發(fā)出的聲音以外,周圍環(huán)境的人和各種設(shè)備都會產(chǎn)生聲音。他表示,當這些聲音混在一起,就會讓人們關(guān)注的聲音難以被處理?!搬t(yī)院中的環(huán)境是非常嘈雜的,(在這種情況下進行語音處理)其實是對現(xiàn)有技術(shù)的一大考驗?!秉S石磊說。

又比如,當前信息化建設(shè)的提速也讓工業(yè)互聯(lián)網(wǎng)屢次成為業(yè)內(nèi)關(guān)注的焦點。在采訪過程中,黃石磊特別強調(diào)了智能音頻在工業(yè)互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用情況。他表示,工業(yè)互聯(lián)網(wǎng)涉及包括音頻處理在內(nèi)的信號處理技術(shù),基于語音的人機交互可以應(yīng)用于人和設(shè)備的交互過程中,還可以在針對非語音實現(xiàn)從智能語音到智能音頻的擴展。但是目前,工業(yè)領(lǐng)域是一個充滿噪聲、混響、回聲等相對復雜因素的場景,智能語音、只能音頻技術(shù)在工業(yè)領(lǐng)域的賦能效果尚不明顯,落地場景也有待拓寬。很多企業(yè)礙于高成本和低收益,智能化轉(zhuǎn)型動力不足。作為行業(yè)伙伴的賦能者,北科瑞聲將對該領(lǐng)域進行更為深入的布局。

共性挑戰(zhàn)亟待突破

不同的應(yīng)用場景會產(chǎn)生不同的數(shù)據(jù)和需求,比如在語音識別等場景中,用戶的需求正在不斷涌現(xiàn)、提升。然而,很多的智能音頻處理產(chǎn)品的應(yīng)用和功能仍具有一定邊界,只能在理想的環(huán)境條件中發(fā)揮作用。

智能音頻處理行業(yè)的發(fā)展一波三折,在整個行業(yè)的發(fā)展過程中,深耕垂直領(lǐng)域和特定行業(yè)的北科瑞聲也遇到了很多企業(yè)都在面臨的共性挑戰(zhàn)。在黃石磊看來,第一個挑戰(zhàn)就來源于不同行業(yè)間的行業(yè)知識的壁壘。每一個行業(yè)都有自己獨特的符號體系和術(shù)語體系。對智能語音產(chǎn)品來講,要想游刃有余地在不同行業(yè)中理解并識別各種紛繁復雜的音頻信息,是比較困難的一件事?!熬拖袢艘粯?,當我們從一個行業(yè)跑到另一個行業(yè),我們也會發(fā)現(xiàn)自己完全聽不懂或者不理解新行業(yè)中的一些術(shù)語?!秉S石磊對記者說。

第二個挑戰(zhàn)在于目前機器與人對語音語言理解的能力差異。黃石磊表示,人類具備抽象表達的能力,也具備察言觀色的能力。人類的語言會涉及一些隱含的意思和抽象的表達,但機器在這些方面還遠遠達不到人類理解能力。

最后一個挑戰(zhàn)來自于數(shù)據(jù)的獲取,這也是“先有雞還是先有蛋”的問題。黃石磊說,發(fā)展智能音頻處理行業(yè)需要先獲得語音數(shù)據(jù),但通常只有進入到這個行業(yè)中并得到用戶認可后才能獲得數(shù)據(jù)?!袄硐肭闆r下,還是應(yīng)該先獲得數(shù)據(jù)。”他說,“從商業(yè)模式和技術(shù)的角度來看,(數(shù)據(jù)的獲?。┦且粋€挑戰(zhàn)。”

針對如何克服這些困難,黃石磊也給出了自己的建議。他認為,從公司的角度來講,還是應(yīng)該專注于核心技術(shù)的研發(fā),比如在核心技術(shù)能力方面提供一些具體的產(chǎn)品形態(tài)。此外,他還特別提到要找一些已經(jīng)在行業(yè)深耕的合作伙伴,進行協(xié)同發(fā)展。

就像站在巨人的肩膀上可以看得更遠,與合作伙伴的配合也可以加速公司對智能音頻對各個行業(yè)的理解。由于在整個行業(yè)中扮演的是一個“被集成者”的角色,北科瑞聲在尋找行業(yè)合作伙伴時相對而言更具優(yōu)勢。黃石磊表示,合作伙伴在某些領(lǐng)域有一定技術(shù)和客戶基礎(chǔ),公司可以借助合作伙伴已有的基礎(chǔ),更快地融入到行業(yè)中去,為行業(yè)客戶提升價值,最終實現(xiàn)行業(yè)客戶、行業(yè)產(chǎn)品提供方和公司的三方共贏。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    31

    文章

    5930

    瀏覽量

    90218
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50094

    瀏覽量

    265278
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    826

    瀏覽量

    50268

原文標題:北科瑞聲:智能音頻提升空間巨大

文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    ATH8809 智能語音處理芯片

    智能語音
    深圳市聲訊電子有限公司
    發(fā)布于 :2025年12月24日 16:58:05

    軟智賦能,功放大有可為!Aigtek安泰電子亮相軟體機器人大會!

    會議回顧2025年11月14-11月16日,第十屆軟體機器人大會——基礎(chǔ)理論與關(guān)鍵技術(shù)研討暨軟體機器人創(chuàng)新設(shè)計競賽于在山東青島圓滿召開。本次大會旨在推動軟體機器人技術(shù)的發(fā)展,為解決現(xiàn)實問題開辟
    的頭像 發(fā)表于 11-20 19:03 ?572次閱讀
    軟智賦能,功放<b class='flag-5'>大有可為</b>!Aigtek安泰電子亮相軟體機器人大會!

    廣州唯創(chuàng)電子WTK6900H-24SS語音識別芯片:智能語音控制賦能臺燈創(chuàng)新應(yīng)用 | 語音IC廠家

    智能家居快速發(fā)展的今天,語音交互技術(shù)正在深刻改變?nèi)藗兣c家居設(shè)備的互動方式。臺燈作為日常生活中不可或缺的照明工具,其智能化升級已成為行業(yè)發(fā)展的重要趨勢。廣州唯創(chuàng)電子作為國內(nèi)領(lǐng)先的
    的頭像 發(fā)表于 11-05 09:20 ?777次閱讀
    廣州唯創(chuàng)電子WTK6900H-24SS<b class='flag-5'>語音</b>識別芯片:<b class='flag-5'>智能</b><b class='flag-5'>語音</b>控制賦能臺燈創(chuàng)新應(yīng)用 | <b class='flag-5'>語音</b>IC廠家

    語音識別系統(tǒng)的技術(shù)核心:從聲音到文字的智能轉(zhuǎn)換

    ? ? ? 語音識別技術(shù),也稱為自動語音識別(ASR),其核心目標是將人類語音信號轉(zhuǎn)換為對應(yīng)的文本或指令。隨著人工智能的發(fā)展,
    的頭像 發(fā)表于 09-05 14:04 ?836次閱讀

    智能語音交互升級,九芯語音識別芯片來助力

    在科技飛速發(fā)展的當下,智能語音交互已經(jīng)深度融入我們的生活,從智能家居的便捷操控,到車載電子的安全駕駛輔助,再到智能玩具的趣味互動,語音識別
    的頭像 發(fā)表于 08-11 14:08 ?956次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互升級,九芯<b class='flag-5'>語音</b>識別芯片來助力

    意法半導體圖像傳感器的崛起之路

    從Yole提供的數(shù)據(jù)我們可以看到,攝像頭傳感圖像傳感器在未來大有可為。手機、工業(yè)以及汽車等應(yīng)用是目前2D成像所關(guān)注的主要市場,成像技術(shù)也正在圍繞這些市場實現(xiàn)有機增長。與此同時,3D深度感知市場,也迎來了大爆發(fā)。
    的頭像 發(fā)表于 08-01 09:44 ?1505次閱讀

    普強智能語音技術(shù)重新定義車載交互邊界

    普強憑借自主研發(fā)的智能語音技術(shù),為某國內(nèi)頭部車企提供的語音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語、俄語、韓語、日語等多語種的
    的頭像 發(fā)表于 07-11 14:00 ?1165次閱讀

    智能語音交互別再瞎選語音芯片了!NRK3502 才是你的最優(yōu)解!

    在科技飛速發(fā)展的當下,智能產(chǎn)品如潮水般涌入我們的生活,從智能家居到智能醫(yī)療,從智能玩具到工業(yè)控制,語音交互
    的頭像 發(fā)表于 07-10 07:03 ?644次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互別再瞎選<b class='flag-5'>語音</b>芯片了!NRK3502 才是你的最優(yōu)解!

    藍牙語音遙控器:智能家居的智慧控制核心

    和低功耗特性,成為理想選擇。 藍牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進步的縮影。其便捷的操作、智能語音交互和低功耗設(shè)計,為用戶
    發(fā)表于 06-01 20:24

    藍牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621

    系列憑借高集成度和低功耗特性,成為理想選擇 藍牙語音遙控器不僅是智能家居控制的樞紐,更是技術(shù)進步的縮影。其便捷的操作、智能語音交互和低
    發(fā)表于 05-22 15:23

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    在萬物互聯(lián)的智能化時代,語音交互技術(shù)已成為人機交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列語音芯片,持續(xù)為
    的頭像 發(fā)表于 05-21 08:45 ?700次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以<b class='flag-5'>技術(shù)</b>創(chuàng)新賦能<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互

    智能收銀語音交互新標桿—WT3000T8語音合成芯片TTS技術(shù)應(yīng)用解析

    一、行業(yè)應(yīng)用背景在零售業(yè)態(tài)智能化轉(zhuǎn)型的浪潮中,收銀設(shè)備正經(jīng)歷從功能型向服務(wù)型轉(zhuǎn)變的關(guān)鍵階段。WT3000T8語音合成芯片應(yīng)運而生,專為滿足新零售場景下智能收銀終端的語音交互需求而設(shè)計。
    的頭像 發(fā)表于 04-24 08:45 ?994次閱讀
    <b class='flag-5'>智能</b>收銀<b class='flag-5'>語音</b>交互新標桿—WT3000T8<b class='flag-5'>語音</b>合成芯片TTS<b class='flag-5'>技術(shù)</b>應(yīng)用解析

    輕量化、低功耗,邊緣計算芯片在儲能中大有可為

    。 ? 在此背景下,邊緣計算芯片應(yīng)運而生。在一些本地化智能決策場景中,例如電網(wǎng)通信中斷的情況,或者在偏遠地區(qū)(如無基站覆蓋的儲能電站),邊緣計算芯片能夠支持離線自主控制(如虛擬同步機慣量支撐、離網(wǎng)模式切換),確保
    的頭像 發(fā)表于 04-17 00:22 ?3052次閱讀

    智能語音交互方案在客服領(lǐng)域的應(yīng)用

    著客服行業(yè)的面貌,為企業(yè)和用戶帶來了全新的體驗。 語音識別模型優(yōu)化私部署 方案:精準高效,定制專屬服務(wù) 語音識別技術(shù)作為智能語音交互的基礎(chǔ),
    的頭像 發(fā)表于 04-11 14:35 ?793次閱讀

    華為數(shù)字政府商業(yè)市場論壇成功舉辦

    此前,3月20日-21日,以“因聚而生,眾智有為”為主題的華為中國合作伙伴大會2025在深圳隆重舉行。期間,“政府商業(yè)大有可為”——華為數(shù)字政府商業(yè)市場論壇成功舉辦。華為與伙伴齊聚一堂,圍繞行業(yè)政策
    的頭像 發(fā)表于 03-28 13:47 ?1064次閱讀