91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

用Riva和NeMo Megatron構建語音AI

星星科技指導員 ? 來源:NVIDIA ? 作者:About Siddharth Sharm ? 2022-03-31 15:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上周, NVIDIA GTC 2022 宣布了對 Riva 的重大更新。 Riva 是一個用于構建語音 AI 應用程序的 SDK ,以及一個付費的 Riva 企業(yè)產(chǎn)品。 NeMo Megatron 是一個用于訓練大型語言模型的框架,它的幾項關鍵更新也已宣布。

Riva 2.0 通用性

Riva 為跨多種語言的實時自動語音識別( ASR )和文本到語音( TTS )技能提供了世界級的準確性,并且可以部署在 prem 上、任何云中。 Snap 、 T-Mobile 、 RingCentral 和 Kore 等行業(yè)領導者。 ai 在客戶服務中心應用程序、轉(zhuǎn)錄和虛擬助理中使用 Riva 。

最新的 Riva 版本包括:

ASR 有多種語言:英語、西班牙語、德語、俄語和普通話。

高質(zhì)量的 TTS 語音可定制獨特的語音字體。

使用 TAO Toolkit 或 NVIDIA NeMo 進行特定于領域的定制,在口音、領域和國家特定術語方面具有無與倫比的準確性。

支持在云端、 prem 和嵌入式平臺上運行。

Riva-Controllable-TTS-Demo-GTC-Spring.gif

Riva-Controllable-TTS-Demo-GTC-Spring.gif

圖 1:NVIDIA Riva 可控文本到語音使得使用 SSML 標簽可以輕松調(diào)整音調(diào)和速度。

手機上嘗試 Riva 自動語音識別 Riva 產(chǎn)品頁面 。

Defined.ai 與 NVIDIA 合作,為希望購買跨語言、域和錄音類型的語音培訓和驗證數(shù)據(jù)的企業(yè)提供一個順暢的工作流程??稍?此處 中找到針對 NVIDIA 開發(fā)人員的 DefinedCrowd 數(shù)據(jù)集示例。

下載 RIVA ,它是免費的NVIDIA 開發(fā)人員的成員從 NGC 免費。

Riva 企業(yè)

NVIDIA 還推出了 Riva Enterprise ,這是一款付費產(chǎn)品,面向在NVIDIA 專家的業(yè)務標準支持下大規(guī)模部署 Riva 的企業(yè)。

好處包括:

在任何云和 prem 平臺上不受限制地使用 ASR 和 TTS 服務。

在當?shù)貭I業(yè)時間與NVIDIA 人工智能專家聯(lián)系,獲取有關配置和性能的指導。

為維護控制和升級計劃提供長期支持。

優(yōu)先訪問新版本和功能。

Riva Enterprise 在 NVIDIA Launchpad 上提供免費試用版,供企業(yè)評估并制作應用程序原型。

Riva launchpad 上的 Enterprise 包括引導實驗室,用于:

與實時語音 AI API 交互。

將語音 AI 功能添加到對話 AI 應用程序中。

在自定義數(shù)據(jù)上微調(diào)語音 AI 管道以獲得更高的準確性。

申請 用于您的 Riva 企業(yè)試用。

通過 對話人工智能解謎 GTC 課程了解有關如何構建、優(yōu)化和部署語音 AI 應用程序的更多信息。

NeMo Megatron

NVIDIA 宣布了新的更新 NVIDIA NeMo Megatron ,這是一個培訓大型語言模型( LLM )的框架,其參數(shù)高達數(shù)萬億?;?Megatron paper 的創(chuàng)新, NeMo Megatron 的研究機構和企業(yè)可以培訓任何 LLM ,以實現(xiàn)融合。 NeMo Megatron 提供數(shù)據(jù)預處理、并行(數(shù)據(jù)、張量和管道)、編排和調(diào)度,以及自動精度自適應。

它包括經(jīng)過徹底測試的配方、流行的 LLM 架構實現(xiàn),以及組織快速開始 LLM 之旅所需的工具。

瑞典,法學博士。 com 、 Naver 和佛羅里達大學是 Nvidia 技術的早期采用者,用于建立大型語言模型。

最新版本包括:

Hyperparameter tuning tool 會根據(jù)客戶需求和基礎設施限制自動創(chuàng)建配方。

T5 和 mT5 車型的參考配方。

支持在云上培訓 LLM ,從 Azure 開始。

分布式數(shù)據(jù)預處理腳本,縮短端到端培訓時間。

關于作者

About Siddharth Sharma:

Siddharth Sharma 是NVIDIA 加速計算的高級技術營銷經(jīng)理。在加入NVIDIA 之前, Siddharth 是 Mathworks Simulink 和 Stateflow 的產(chǎn)品營銷經(jīng)理,與汽車和航空航天公司密切合作,采用基于模型的設計來創(chuàng)建控制軟件。

About Gordana Neskovic:

Gordana Neskovic 是AI/DL產(chǎn)品營銷團隊的成員,負責 NVIDIA Maxine。在加入 NVIDIA 之前,Gordana曾在VMware、Wells Fargo、Pinterest、SFO-ITT和KLA Tencor擔任過各種產(chǎn)品營銷、數(shù)據(jù)科學家、AI架構師和工程職位。她擁有博士學位。圣塔 Clara 大學,塞爾維亞貝爾格萊德大學電氣工程碩士和學士學位。

About Sirisha Rella:

Sirisha Rella 是 NVIDIA 的技術產(chǎn)品營銷經(jīng)理,專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位,是國家科學基金會大學習中心的研究生助理。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5597

    瀏覽量

    109793
  • AI
    AI
    +關注

    關注

    91

    文章

    39820

    瀏覽量

    301502
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一文了解語音AI的運作方式

    語音 AI 是對話式 AI 的一個子集,包括可將人類語音轉(zhuǎn)換為文本的自動語音識別 (ASR) 和文本轉(zhuǎn)
    的頭像 發(fā)表于 02-27 16:10 ?344次閱讀
    一文了解<b class='flag-5'>語音</b><b class='flag-5'>AI</b>的運作方式

    AI語音模組】自制小智管家?安信可Ai-WV01-32S測試體驗

    項目名:默語小智管家 模組支持: 安信可科技 AI語音模組 作者:安信可論壇用戶 molun 這兩年, AI 硬件又卷起來了。 ? 語音助手、AI
    的頭像 發(fā)表于 11-19 16:06 ?620次閱讀
    【<b class='flag-5'>AI</b><b class='flag-5'>語音</b>模組】自制小智管家?安信可<b class='flag-5'>Ai</b>-WV01-32S測試體驗

    教你做“會說話”的小熊貓!AI語音對講DIY教程來啦

    新品預告: Ai-WV01-32S 是由安信可科技設計的一款可接入 小智AI 智能體 的微型語音交互模組,該模組搭載BL602和VB6824芯片作為核心處理器,專為 輕量級智能語音場景
    的頭像 發(fā)表于 09-30 15:24 ?891次閱讀
    教你做“會說話”的小熊貓!<b class='flag-5'>AI</b><b class='flag-5'>語音</b>對講DIY教程來啦

    唯創(chuàng)知音AI語音交互芯片與模組介紹

    AI語音交互已經(jīng)成為智能產(chǎn)品的基礎配置,比如常見的AI玩具、智能家居、帶AI功能的藍牙音響,還有汽車的智能車機和智能穿戴設備等。唯創(chuàng)知音順應市場趨勢推出了WT2606A系列的
    的頭像 發(fā)表于 09-17 15:51 ?758次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b><b class='flag-5'>語音</b>交互芯片與模組介紹

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    靈感的過程中發(fā)揮關鍵作用。五、AI實現(xiàn)諾貝爾獎級別的科學發(fā)現(xiàn) 這想法這能夠大膽的。 1、AI科學家的構建 全自主科學實驗室需要哪些部分: ①自動實驗設備 ②流程管理系統(tǒng) ③數(shù)據(jù)處理和
    發(fā)表于 09-17 11:45

    豆包/DeepSeek/小智AI全接入!這款AI語音開發(fā)板,配網(wǎng)即用超省心!

    AiPi-PalChatV2 可接入小智AI 或 火山引擎 AiPi-PalChatV2 是安信可推出的一款高性能語音交互開發(fā)板,可接入 小智AI 或 火山引擎 ,專為智能語音場景而設
    的頭像 發(fā)表于 09-09 17:21 ?1643次閱讀
    豆包/DeepSeek/小智<b class='flag-5'>AI</b>全接入!這款<b class='flag-5'>AI</b><b class='flag-5'>語音</b>開發(fā)板,配網(wǎng)即用超省心!

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    想到,除了研究大腦的抽象數(shù)學模型外,能否拋棄傳統(tǒng)的芯片實現(xiàn)方式,以化學物質(zhì)和生物組件、材料及相關現(xiàn)象來構建人工神經(jīng)網(wǎng)絡或提取其功能來用于AI處理,甚至直接生物體來實現(xiàn)AI功能,這就是
    發(fā)表于 09-06 19:12

    Votee AI借助NVIDIA技術加速方言小語種LLM開發(fā)

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 數(shù)據(jù)處理軟件、NeMo Framework 模型訓練框架及 Auto Configurator 優(yōu)化工具,高效
    的頭像 發(fā)表于 08-20 14:21 ?865次閱讀

    輕松配置小智AI語音開發(fā)板,安信可IOT小程序功能更新

    安信可科技:安信可發(fā)布的 AI 語音開發(fā)板,可以通過配套的小程序,完成網(wǎng)絡配置、音色選擇等多項配置,無需復雜代碼,輕松實現(xiàn)AI語音體驗。 用戶:COOL!怎么
    的頭像 發(fā)表于 08-19 17:46 ?1318次閱讀
    輕松配置小智<b class='flag-5'>AI</b><b class='flag-5'>語音</b>開發(fā)板,安信可IOT小程序功能更新

    智芯科AI語音芯片賦能智能開關新體驗

    在智能家居不斷革新的浪潮中,真正“可落地、可量產(chǎn)”的語音交互方案仍然稀缺。而我們,一顆自主可控的AI語音芯片,讓智能開關從此告別網(wǎng)絡依賴,做到離線喚醒、毫秒響應、無懼口音。
    的頭像 發(fā)表于 08-04 16:25 ?1234次閱讀

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    端側離線 AI 智能硬件作為 AI 技術的重要載體之一,憑借其無需依賴網(wǎng)絡即可實現(xiàn)智能功能的特性,在一些網(wǎng)絡條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語音
    發(fā)表于 07-04 11:14

    東軟:以數(shù)據(jù)價值化為破局點 AI構建城市新基礎設施

    數(shù)字經(jīng)濟創(chuàng)新生態(tài)的戰(zhàn)略布局與實踐成果。 數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字經(jīng)濟的基礎,是民生改善的基石,是產(chǎn)業(yè)創(chuàng)新的動力,也是城市發(fā)展的關鍵。東軟以數(shù)據(jù)價值化為破局點,將數(shù)字技術創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合, 數(shù)據(jù)和AI構建城市新基礎設施
    的頭像 發(fā)表于 06-18 14:31 ?644次閱讀

    tscircuit - 電路開發(fā)的 React 范式? TypeScript、React和 AI工具構建電子產(chǎn)品

    TypeScript、React 和 AI 工具構建電子產(chǎn)品。
    的頭像 發(fā)表于 04-30 18:18 ?1503次閱讀
    tscircuit - 電路開發(fā)的 React 范式?   <b class='flag-5'>用</b>TypeScript、React和 <b class='flag-5'>AI</b>工具<b class='flag-5'>構建</b>電子產(chǎn)品

    企業(yè)使用NVIDIA NeMo微服務構建AI智能體平臺

    已發(fā)布的 NeMo 微服務可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構建模塊,使用商業(yè)智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務。
    的頭像 發(fā)表于 04-27 15:05 ?1292次閱讀

    90元打造小智AI腕表,語音交互超有趣!

    最近小智AI非?;?,這周給大家分享一個來自開源平臺的小智AI腕表項目。 項目作者@dotnfc,復刻成本90元左右,開源協(xié)議:MIT License 項目簡介 本項目分享了小智AI聊天機器人的一種
    發(fā)表于 04-16 14:26