91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

「揭秘」Speech AI 技術(shù)發(fā)展與前沿應(yīng)用

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:未知 ? 2022-11-10 11:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Speech AI 線上技術(shù)研討會(huì)

精彩議程搶先看



自二十世紀(jì)下半葉第一個(gè)基于計(jì)算機(jī)的語音合成系統(tǒng)誕生,至以隱馬爾可夫模型為代表的統(tǒng)計(jì)機(jī)器學(xué)習(xí)合成語音占據(jù)主流,再到近十年來基于神經(jīng)網(wǎng)絡(luò)的語音合成快速發(fā)展,計(jì)算機(jī)語音合成技術(shù)如今已能媲美真人發(fā)聲,并走向大規(guī)模的商業(yè)化落地階段。


Gartner 技術(shù)成熟度曲線表明,語音識(shí)別和語音合成技術(shù)如今已經(jīng)達(dá)到穩(wěn)步爬升恢復(fù)期和生產(chǎn)成熟期。國(guó)內(nèi)的智能語音市場(chǎng)也形成了比較成熟的格局,智能語音科技企業(yè)和互聯(lián)網(wǎng)企業(yè)成為主導(dǎo)。因此,要實(shí)現(xiàn)差異化競(jìng)爭(zhēng),企業(yè)也在紛紛思考如何從單一的智能語音技術(shù)提供商轉(zhuǎn)型為提供全方位的人工智能技術(shù)和應(yīng)用的服務(wù)商。此外,盡管技術(shù)已經(jīng)趨近成熟,門檻大大降低,開發(fā)和運(yùn)行可落地的語音人工智能服務(wù)仍然是一項(xiàng)復(fù)雜而艱巨的任務(wù),通常需要面臨實(shí)時(shí)性、可理解性、自然性、低資源、魯棒性等挑戰(zhàn)。


在智能語音市場(chǎng)的競(jìng)爭(zhēng)格局中,一大空缺是算法、通用類芯片和云端 AI 芯片。借助以 GPU 為代表的通用類芯片上的技術(shù)優(yōu)勢(shì),NVIDIA 進(jìn)軍了智能語音領(lǐng)域。基于自動(dòng)語音識(shí)別( ASR )和語音合成( TTS ),NVIDIA Riva 簡(jiǎn)化了開發(fā)語音 AI 服務(wù)的端到端流程,并為語音交互提供實(shí)時(shí)性能。此外,包括 NVIDIA TensorRTTriton 推理服務(wù)器在內(nèi)的諸多 NVIDIA 技術(shù)也幫助各種 Speech AI 工作負(fù)載進(jìn)行大幅的降本增效。不論是 AI 呼叫中心、虛擬主力語音接口,還是視頻會(huì)議中的實(shí)時(shí)字幕等應(yīng)用,NVIDIA GPU 及 NVIDIA 加速技術(shù)都在幫助用戶進(jìn)一步為技術(shù)落地降低門檻,為自動(dòng)駕駛、醫(yī)療等場(chǎng)景的智能語音應(yīng)用創(chuàng)新賦能。


2022 年 10 月 25 日和 27 日,NVIDIA 在 DataFun 直播間,舉辦 Speech AI 線上技術(shù)研討會(huì),由資深專家介紹 NVIDIA NeMo / RIVA 構(gòu)建語音應(yīng)用的工作流、GPU 加速和部署 Speech AI 任務(wù)全流程的最佳實(shí)踐,更榮幸邀請(qǐng)到了 WeNet 開源社區(qū)發(fā)起人為我們分享 WeNet 社區(qū)的最新技術(shù)進(jìn)展


議題介紹


NVIDIA NeMo 工具介紹,以及如何利用 NeMo 進(jìn)行語音相關(guān)任務(wù)的訓(xùn)練


NeMo 是 NVIDIA 推出的一款主打GPU 訓(xùn)練的工具,可以支持常見的 Speech AI 相關(guān)的任務(wù),例如ASR、NLP、TTS、Speaker Recognition 等。將以中文語音識(shí)別為例,介紹如何利用 NeMo 快速地完成該任務(wù)的訓(xùn)練。同時(shí)也會(huì)介紹 NeMo 中目前已有的一些功能,例如 VAD、說話人日志等。


通過本次演講您將收獲以下內(nèi)容:


  • 如果利用 NeMo 訓(xùn)練 ASR 模型?


  • NeMo 對(duì)中文語音任務(wù)的支持有哪些?


  • NeMo 支持其他哪些 Speech processing 的任務(wù)?



演講嘉賓


丁文 NVIDIA 解決方案架構(gòu)師

畢業(yè)于上海交通大學(xué),導(dǎo)師為俞凱教授。畢業(yè)后曾就職于頭部互聯(lián)網(wǎng)公司語音交互部門,主要負(fù)責(zé)流式 ASR 的迭代與優(yōu)化、粵語 ASR 等。目前就職于 NVIDIA,負(fù)責(zé) Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地與優(yōu)化等。


使用 NVIDIA Riva 部署企業(yè)級(jí) ASR 服務(wù)


NVIDIA Riva 提供了最先進(jìn)的 GPU 優(yōu)化部署解決方案,用于構(gòu)建和部署完全可定制的實(shí)時(shí)語音識(shí)別服務(wù),用于諸如呼叫中心代理協(xié)助、虛擬助理、數(shù)字化身、品牌語音和視頻會(huì)議轉(zhuǎn)錄等應(yīng)用程序。


本次分享將為大家介紹 NVIDIA Riva 的主要特性,包括高精度的預(yù)訓(xùn)練語音模型,高性能推理模型,以及高可擴(kuò)展的推理服務(wù)。


通過本次演講您將收獲以下內(nèi)容:


  • 如何使用 NVIDIA Riva 在 GPU 上快速部署語音識(shí)別服務(wù)?


  • Riva 是如何針對(duì) GPU 進(jìn)行優(yōu)化加速的?


  • 怎樣進(jìn)行定制化達(dá)到更好的語音識(shí)別精度?



演講嘉賓


齊家興 NVIDIA 解決方案架構(gòu)師

德國(guó)亞琛工業(yè)大學(xué)博士,目前于英偉達(dá)企業(yè)解決方案部門擔(dān)任高級(jí)架構(gòu)師,多年來從事自然語言處理和語音識(shí)別等方向研究,助力多家企業(yè)基于 GPU 平臺(tái)實(shí)現(xiàn)高效易用的訓(xùn)練和推理平臺(tái)。他是英偉達(dá) NeMo,Riva 語音識(shí)別訓(xùn)練推理平臺(tái)的中文模型開發(fā)者之一。


利用 Triton Inference Server 和 TensorRT 加速語音 AI 在云端的運(yùn)行效率


演講將主要介紹云上部署端到端 ASR 服務(wù)最佳實(shí)踐以及云上部署端到端 TTS 服務(wù)最佳實(shí)踐。


通過本次演講您還將收獲以下內(nèi)容:


  • 了解如何加速語音 AI 模型


  • 了解如何節(jié)省語音 AI服務(wù)的部署成本



演講嘉賓


劉川 NVIDIA 資深解決方案架構(gòu)師

NVIDIA 中文語音解決方案主要負(fù)責(zé)人,對(duì)基于 GPU 的語音識(shí)別和語音合成在云上的部署有豐富經(jīng)驗(yàn)。


WeNet 在 Speech AI 的應(yīng)用與探索


演講將主要介紹開源極簡(jiǎn)史、語音開源簡(jiǎn)史、WeNet 開源社區(qū)以及基于 GPU 的語音識(shí)別實(shí)踐。


通過本次演講您將收獲以下內(nèi)容:


  • 了解 WeNet 開源社區(qū)


  • WeNet 社區(qū)中如何支持和使用 GPU



演講嘉賓


張彬彬 WeNet 開源社區(qū)發(fā)起人

碩士畢業(yè)于西北工業(yè)大學(xué)音頻語音與語音處理研究組。WeNet 開源社區(qū)發(fā)起人,主導(dǎo)了業(yè)界領(lǐng)先的開源端到端語音識(shí)別項(xiàng)目 WeNet 和大規(guī)模多領(lǐng)域中文語音識(shí)別開源數(shù)據(jù)集 WenetSpeech 的開發(fā)?,F(xiàn)任地平線語音算法專家,曾先后在微軟、出門問問等公司從事語音識(shí)別算法和產(chǎn)品研發(fā)。



參與方式


精彩連續(xù),點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,馬上注冊(cè)預(yù)約!



原文標(biāo)題:「揭秘」Speech AI 技術(shù)發(fā)展與前沿應(yīng)用

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4091

    瀏覽量

    99250

原文標(biāo)題:「揭秘」Speech AI 技術(shù)發(fā)展與前沿應(yīng)用

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    遠(yuǎn)距離無線通信WiFi技術(shù)技術(shù)發(fā)展、未來趨勢(shì)與挑戰(zhàn)

    探討遠(yuǎn)距離無線通信技術(shù)發(fā)展及應(yīng)用,揭示這一領(lǐng)域的前沿突破以及它將如何改變我們的生活與工作方式。
    的頭像 發(fā)表于 12-04 18:17 ?1299次閱讀

    MediaTek Pentonic平臺(tái)推動(dòng)智能電視顯示技術(shù)發(fā)展

    Mini-LED 技術(shù)憑借更精細(xì)的背光控制、更高的亮度與對(duì)比度表現(xiàn),贏得了眾多智能電視廠商和消費(fèi)者的青睞。在 Mini-LED 電視領(lǐng)域,MediaTek 始終致力于通過強(qiáng)大的芯片算力,推動(dòng)顯示技術(shù)發(fā)展,用先進(jìn)的畫質(zhì)引擎及 AI
    的頭像 發(fā)表于 10-30 15:47 ?825次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    半導(dǎo)體芯片是現(xiàn)在世界的石油,它們推動(dòng)了經(jīng)歷、國(guó)防和整個(gè)科技行業(yè)。-------------帕特里克-基辛格。 AI的核心是一系列最先進(jìn)的半導(dǎo)體芯片。那么AI芯片最新技術(shù)以及創(chuàng)新有哪些呢。 本章節(jié)作者
    發(fā)表于 09-15 14:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    AI芯片:科技探索與AGI愿景》這本書是張臣雄所著,由人民郵電出版社出版,它與《AI芯片:前沿技術(shù)與創(chuàng)新未來》一書是姊妹篇,由此可見作者在AI芯片領(lǐng)域的功力和造詣。 作者畢業(yè)于上海交
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    對(duì)復(fù)雜場(chǎng)景中目標(biāo)檢測(cè)與識(shí)別的速度和精度。在此過程中,對(duì)算法的理解深度、芯片架構(gòu)與算法的協(xié)同能力,都會(huì)成為職稱評(píng)審中的加分項(xiàng)。 除技術(shù)能力外,創(chuàng)新能力同樣不可或缺。AI 芯片行業(yè)發(fā)展日新月異,新
    發(fā)表于 08-19 08:58

    【書籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    的應(yīng)用。 對(duì)半導(dǎo)體芯片產(chǎn)業(yè)前沿技術(shù)的講解也緊密聯(lián)系產(chǎn)業(yè)實(shí)際,為技術(shù)從業(yè)者提供實(shí)踐指導(dǎo),同時(shí)為科研人員指明研究方向,為投資者提供產(chǎn)業(yè)發(fā)展洞察。 ▲精彩書摘 AI和芯片領(lǐng)域的研究人員、工
    發(fā)表于 07-28 13:54

    聲智科技與螞蟻集團(tuán)共探聲學(xué)AI前沿技術(shù)

    當(dāng)聲學(xué)AI遇上金融科技,會(huì)碰撞出怎樣的火花?當(dāng)聲學(xué)AI模型賦能AI硬件產(chǎn)品,又將如何重塑人機(jī)交互的邊界?近日,聲智科技受邀參加螞蟻集團(tuán)《AI圓桌派》內(nèi)部分享會(huì),一場(chǎng)關(guān)于聲學(xué)
    的頭像 發(fā)表于 07-24 10:18 ?1045次閱讀

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】+混合專家

    感謝電子發(fā)燒友提供學(xué)習(xí)Deepseek核心技術(shù)這本書的機(jī)會(huì)。 讀完《Deepseek核心技術(shù)揭秘》,我深受觸動(dòng),對(duì)人工智能領(lǐng)域有了全新的認(rèn)識(shí)。了解Deepseek-R1 、Deepseek-V3
    發(fā)表于 07-22 22:14

    【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】第三章:探索 DeepSeek - V3 技術(shù)架構(gòu)的奧秘

    時(shí)間減少,數(shù)據(jù)處理更流暢。這讓我聯(lián)想到工業(yè)生產(chǎn)中的流水線,AI 訓(xùn)練在此處借鑒類似思路,通過優(yōu)化任務(wù)分配和流程,突破硬件限制,追求更高效率,體現(xiàn)了技術(shù)發(fā)展中持續(xù)優(yōu)化、突破瓶頸的智慧。 三、細(xì)粒度
    發(fā)表于 07-20 15:07

    CES Asia 2025蓄勢(shì)待發(fā),聚焦低空經(jīng)濟(jì)與AI,引領(lǐng)未來產(chǎn)業(yè)新變革

    分享最新的科研成果和技術(shù)發(fā)展趨勢(shì),為行業(yè)發(fā)展提供理論支持。頭部企業(yè)將展示最前沿技術(shù)和產(chǎn)品,分享實(shí)踐經(jīng)驗(yàn),推動(dòng)技術(shù)的商業(yè)化應(yīng)用。創(chuàng)新力量也將
    發(fā)表于 07-09 10:29

    無刷雙饋電機(jī)專利技術(shù)發(fā)展

    ~~~ *附件:無刷雙饋電機(jī)專利技術(shù)發(fā)展.pdf 【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請(qǐng)第一時(shí)間告知,刪除內(nèi)容,謝謝!
    發(fā)表于 06-25 13:10

    鋁電解電容技術(shù)發(fā)展與市場(chǎng)格局分析

    鋁電解電容的技術(shù)發(fā)展,市場(chǎng)需求狀況分析
    的頭像 發(fā)表于 06-23 15:30 ?1076次閱讀

    Kneron耐能前沿AI芯片技術(shù)進(jìn)軍中東市場(chǎng)

    近日,全球領(lǐng)先的邊緣AI計(jì)算解決方案提供商——Kneron(耐能)宣布,公司已正式通過沙特國(guó)家技術(shù)發(fā)展計(jì)劃(NTDP)“RELOCATE”深度科技專項(xiàng)審核,并成功獲得沙特政府非股權(quán)資助。
    的頭像 發(fā)表于 06-23 10:20 ?1209次閱讀

    輪邊驅(qū)動(dòng)電機(jī)專利技術(shù)發(fā)展

    ,具有較高的靈敏度。 本文主要以 DWPI 專利數(shù)據(jù)庫(kù)以及 CNABS 數(shù)據(jù)庫(kù)中的檢索結(jié)果為分析樣本,從專利文獻(xiàn)的視角對(duì)輪邊驅(qū)動(dòng)電機(jī)的技術(shù)發(fā)展進(jìn)行了全面的統(tǒng)計(jì)分析,總結(jié)了與輪邊驅(qū)動(dòng)電機(jī)相關(guān)的國(guó)內(nèi)和國(guó)外
    發(fā)表于 06-10 13:15

    Gartner發(fā)布云技術(shù)發(fā)展的六大趨勢(shì)

    Gartner發(fā)布未來四年云技術(shù)發(fā)展的六大趨勢(shì),包括對(duì)云技術(shù)不滿、人工智能/機(jī)器學(xué)習(xí)(AI/ML)、多云和跨云、可持續(xù)性、數(shù)字主權(quán)以及行業(yè)解決方案。Gartner顧問總監(jiān)JoeRogus表示:“這些
    的頭像 發(fā)表于 05-19 11:40 ?1036次閱讀
    Gartner發(fā)布云<b class='flag-5'>技術(shù)發(fā)展</b>的六大趨勢(shì)