91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Build 2024發(fā)布多項(xiàng)Azure AI Speech全新多模態(tài)功能

微軟科技 ? 來源:微軟科技 ? 2024-05-28 09:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

客戶們持續(xù)使用 Azure OpenAI 和 Azure AI Speech 進(jìn)行創(chuàng)新,為企業(yè)引入新的效率,并構(gòu)建新的多模態(tài)體驗(yàn)。Azure AI,我們持續(xù)與客戶合作,并將新的創(chuàng)新推向市場(chǎng)——我們看到了各種用例,包括通話分析、醫(yī)療轉(zhuǎn)錄、字幕、聊天機(jī)器人等。

以下是我們?cè)诮衲?Microsoft Build 大會(huì)上宣布的所有多模態(tài)創(chuàng)新,特別是包括語音和文本的創(chuàng)新。

語音分析

今天我們宣布預(yù)覽版的語音分析服務(wù)。語音分析是 Azure AI Studio 中的一項(xiàng)新服務(wù),它結(jié)合了 Azure AI 服務(wù)和 PromptFlow,只需將音頻數(shù)據(jù)上傳到云存儲(chǔ),就可以自動(dòng)處理和分析。

通過語音分析,可以輕松獲取呼叫中心對(duì)話的見解,或使用 Azure OpenAI 和 Azure AI Language 的 AI 模型從 Azure AI Speech 生成的準(zhǔn)確轉(zhuǎn)錄中提取對(duì)話摘要。從呼叫中心對(duì)話中獲取見解可以幫助企業(yè)更好地理解客戶需求、產(chǎn)品反饋和支持趨勢(shì),從而改善客戶體驗(yàn)。

使用我們的post-call 分析模板,客戶可以快速設(shè)置提取常見的見解,如呼叫摘要、客戶情緒和關(guān)鍵主題??蛻暨€可以輕松修改默認(rèn)提示,以提取更多見解,甚至修改完整的提示流程,以全面定制分析,提取廣泛的信息,如討論要點(diǎn),甚至預(yù)測(cè)可能的對(duì)話流程。語音分析還可以輕松支持多種語言、口音、領(lǐng)域和場(chǎng)景,并擴(kuò)展到大規(guī)模生產(chǎn)使用。語音分析幫助我們的客戶獲取客戶對(duì)話的見解,改善客戶體驗(yàn)、銷售和營銷策略。這也是多模態(tài)數(shù)據(jù)分析的一個(gè)基礎(chǔ),未來將能夠從不同類型的數(shù)據(jù)中獲得更豐富和更深入的見解。

以下是Speech Processing Solutions(飛利浦聽寫)使用 Azure AI 服務(wù)(包括語音分析)構(gòu)建的一套示例技術(shù):

634be6cc-1c86-11ef-b74b-92fbcf53809c.png

語音分析將于 6 月供開發(fā)者試用。想了解更多信息,請(qǐng)?jiān)?strong>Azure AI Studio中試用。

快速轉(zhuǎn)錄

今天我們還宣布預(yù)覽版的快速轉(zhuǎn)錄API。該 API 是 Azure AI Speech 系列的一部分,通過簡(jiǎn)單的 REST 調(diào)用,可以在幾秒鐘內(nèi)轉(zhuǎn)錄大小達(dá) 200MB 的音頻文件。

客戶希望在獲取轉(zhuǎn)錄結(jié)果的速度至關(guān)重要的場(chǎng)景中使用該 API,例如在面試結(jié)束或電話結(jié)束后立即獲得轉(zhuǎn)錄結(jié)果。該 API 是轉(zhuǎn)錄領(lǐng)域的一次變革,可以以高達(dá)實(shí)時(shí) 40 倍的速度轉(zhuǎn)錄音頻文件,例如在 15 秒內(nèi)轉(zhuǎn)錄 10 分鐘的音頻文件,而不會(huì)犧牲準(zhǔn)確性。API 提供了一種簡(jiǎn)單而強(qiáng)大的轉(zhuǎn)錄音頻的方式,并打開了一組新的場(chǎng)景,其中之一是呼叫中心內(nèi)的“代理筆記記錄”。

高效筆記記錄

一個(gè)典型的呼叫中心代理在每次通話后花費(fèi) 3 到 5 分鐘創(chuàng)建筆記??焖俎D(zhuǎn)錄 API 結(jié)合 Azure OpenAI 服務(wù)可以自動(dòng)執(zhí)行此任務(wù),為呼叫中心節(jié)省數(shù)千小時(shí)的工作時(shí)間。醫(yī)療從業(yè)者記錄與患者的對(duì)話后,可以在幾秒鐘內(nèi)分析這些記錄。類似地,媒體和內(nèi)容創(chuàng)作者可以在播客或采訪完成后立即分析并提取見解。

IntelePeer通過高級(jí) AI 驅(qū)動(dòng)的解決方案簡(jiǎn)化通信自動(dòng)化,幫助企業(yè)和聯(lián)系中心降低成本并豐富客戶體驗(yàn)。

微軟的快速 API 在離線轉(zhuǎn)錄方面的性能遠(yuǎn)遠(yuǎn)超過了競(jìng)爭(zhēng)對(duì)手。在比較相同的樣本語料庫時(shí),快速 API 在低質(zhì)量音頻轉(zhuǎn)錄方面表現(xiàn)最好,結(jié)果比其他供應(yīng)商好70%

Parloa是一家為企業(yè)下一代客戶服務(wù)構(gòu)建聯(lián)系中心 AI 平臺(tái)的軟件開發(fā)公司,一直在預(yù)覽版中使用快速轉(zhuǎn)錄API。

快讀轉(zhuǎn)錄 API 提供了市場(chǎng)上最快、最準(zhǔn)確和最具成本效益的轉(zhuǎn)錄選項(xiàng)。

OPPO是一家全球技術(shù)品牌,以其創(chuàng)新的智能手機(jī)和智能設(shè)備聞名,正在使用 Azure AI 語音轉(zhuǎn)文本快速轉(zhuǎn)錄和 Azure AI 文本轉(zhuǎn)語音來試驗(yàn)其新 AI 手機(jī)上的新客戶體驗(yàn)。

快速轉(zhuǎn)錄 API將于 2024 年 6 月供開發(fā)者使用,敬請(qǐng)期待更多信息。

視頻翻譯服務(wù)

視頻翻譯服務(wù)已經(jīng)推出預(yù)覽版,這是一項(xiàng)開創(chuàng)性的服務(wù),旨在改變企業(yè)本地化視頻內(nèi)容的方式。這項(xiàng)新服務(wù)為開發(fā)人員提供了一種高效而無縫的解決方案,以滿足對(duì)翻譯視頻內(nèi)容和克服語言障礙不斷增長的需求,讓內(nèi)容所有者能夠觸達(dá)更廣泛的受眾。無論是用于教育視頻、營銷活動(dòng)還是娛樂內(nèi)容,視頻翻譯都能確保您的信息以任何支持的語言被傳達(dá)出去。

該服務(wù)使開發(fā)者能夠使用預(yù)構(gòu)建的神經(jīng)語音和內(nèi)容編輯功能,或通過個(gè)人語音功能(一種限制訪問功能)將內(nèi)容翻譯成 10 種語言。您可以在Speech Studio中了解更多關(guān)于視頻翻譯服務(wù)的信息,并試用您自己的視頻。

Vimeo 致力于簡(jiǎn)化制作、管理和分享視頻所需的一切——所有這些都在一個(gè)易于使用的平臺(tái)中。

Vimeo 正在與微軟視頻翻譯服務(wù)密切合作,對(duì)其為全球客戶解鎖的用例感到興奮。

多語言語音翻譯

我們宣布對(duì)我們的多語言語音翻譯能力進(jìn)行了新的增強(qiáng)。我們引入了多語言檢測(cè)功能,能夠在同一音頻流中檢測(cè)語言切換,并自動(dòng)語言檢測(cè),消除了開發(fā)者指定輸入語言的需求,以及集成的自定義翻譯功能,以適應(yīng)您的領(lǐng)域特定詞匯。

有了這些功能,開發(fā)者不再需要指定輸入語言,可以在同一會(huì)話中處理語言切換,并支持實(shí)時(shí)流翻譯到目標(biāo)語言。

此功能對(duì)于字幕使用場(chǎng)景特別有幫助。字幕是為音頻或視頻內(nèi)容添加文本,以便讓聽力困難或說不同語言的人更容易訪問和理解。在許多國家,字幕不僅是法律義務(wù),也是社會(huì)責(zé)任和包容的良好實(shí)踐。內(nèi)容創(chuàng)作者現(xiàn)在可以吸引更廣泛和更多樣化的受眾,并輕松提高用戶體驗(yàn)和參與度。

宣布個(gè)人語音的全面可用性

我們的語音服務(wù)還提供了自然語音的功能??蛻艨梢岳迷撈脚_(tái)為頭像、聊天機(jī)器人和 IVR 創(chuàng)建逼真且自然的語音。通過 Azure AI 語音,您可以選擇使用現(xiàn)有的語音模型,選擇多種不同的語音和風(fēng)格,也可以使用您自己的數(shù)據(jù)和錄音創(chuàng)建自定義的語音。

我們還宣布 Azure AI 語音推出了新的個(gè)人化語音功能。該功能目前以有限的訪問權(quán)限推出,以確保適當(dāng)?shù)谋U洗胧┎⒈苊鉃E用。該功能允許用戶僅通過提供簡(jiǎn)短的語音樣本作為音頻提示,在幾秒鐘內(nèi)創(chuàng)建 AI 語音。該功能可用于各種用例,例如為聊天機(jī)器人個(gè)性化語音體驗(yàn),或者利用演員的母語聲音將視頻內(nèi)容翻譯成不同的語言。

總之,我們強(qiáng)大而多功能的平臺(tái)幫助客戶將語音輸入和輸出與其他 AI 功能結(jié)合起來。這使得開發(fā)者能夠?yàn)樾聢?chǎng)景創(chuàng)建高質(zhì)量的工作負(fù)載。無論您是需要人類對(duì)話的見解、實(shí)時(shí)或錄制的字幕,還是為您的虛擬形象、聊天機(jī)器人或 IVR 創(chuàng)建逼真和自然的語音,Azure AI 都能幫助客戶提供快速、可靠和可定制的解決方案。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18692

    瀏覽量

    186100
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31092

    瀏覽量

    222346
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10093

原文標(biāo)題:Build 2024發(fā)布多項(xiàng) Azure AI Speech 全新多模態(tài)功能

文章出處:【微信號(hào):mstech2014,微信公眾號(hào):微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    格靈深瞳模態(tài)大模型榮登InfoQ 2025中國技術(shù)力量年度榜單

    靈感實(shí)驗(yàn)室聯(lián)合LLaVA社區(qū)發(fā)布模態(tài)大模型LLaVA-OneVision-1.5,實(shí)現(xiàn)了訓(xùn)練數(shù)據(jù)、代碼和模型權(quán)重的全鏈路開源,在多項(xiàng)公開
    的頭像 發(fā)表于 01-05 10:05 ?514次閱讀

    涂鴉Omni AI Foundation V2.6發(fā)布:低代碼+模態(tài),重塑AI硬件創(chuàng)新體驗(yàn)

    硬件產(chǎn)品的落地。今天,我們非常高興地宣布:面向模態(tài)AI硬件的基座平臺(tái)OmniAIFoundation正式發(fā)布V2.6版本。本次升級(jí)不僅顯著提升了端到端
    的頭像 發(fā)表于 12-24 18:58 ?442次閱讀
    涂鴉Omni <b class='flag-5'>AI</b> Foundation V2.6<b class='flag-5'>發(fā)布</b>:低代碼+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>,重塑<b class='flag-5'>AI</b>硬件創(chuàng)新體驗(yàn)

    微軟全新AI超級(jí)工廠Fairwater在亞特蘭大落成

    微軟正式發(fā)布位于美國喬治亞州亞特蘭大的 Azure AI 數(shù)據(jù)中心 Fairwater 站點(diǎn)。全新的數(shù)據(jù)中心將與威斯康星州的首個(gè) Fairwater 站點(diǎn)、前幾代
    的頭像 發(fā)表于 12-09 17:31 ?740次閱讀

    商湯科技正式發(fā)布并開源全新模態(tài)模型架構(gòu)NEO

    商湯科技正式發(fā)布并開源了與南洋理工大學(xué)S-Lab合作研發(fā)的全新模態(tài)模型架構(gòu) —— NEO,為日日新SenseNova
    的頭像 發(fā)表于 12-08 11:19 ?1023次閱讀
    商湯科技正式<b class='flag-5'>發(fā)布</b>并開源<b class='flag-5'>全新</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>模型架構(gòu)NEO

    全新升級(jí) | 匠芯創(chuàng)AiUIBuilder V2.0.0發(fā)布

    近日,匠芯創(chuàng)自主研發(fā)的GUI開發(fā)工具AiUIBuilderV2.0.0發(fā)布。作為一款基于LVGL的UI設(shè)計(jì)工具,AiUIBuilder致力于通過拖拽式操作,加速基于匠芯創(chuàng)嵌入式平臺(tái)的圖形應(yīng)用開發(fā)
    的頭像 發(fā)表于 10-29 10:03 ?906次閱讀
    <b class='flag-5'>全新</b>升級(jí) | 匠芯創(chuàng)AiUIBuilder V2.0.0<b class='flag-5'>發(fā)布</b>

    OpenAI Sora 2模型上線微軟Azure AI Foundry國際版

    我們非常激動(dòng)地宣布,OpenAI 的新一代模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國際版)上線,進(jìn)入公共預(yù)覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?782次閱讀
    OpenAI Sora 2模型上線微軟<b class='flag-5'>Azure</b> <b class='flag-5'>AI</b> Foundry國際版

    “端云+模態(tài)”新范式:《移遠(yuǎn)通信AI大模型技術(shù)方案白皮書》正式發(fā)布

    7月28日,移遠(yuǎn)通信聯(lián)合智次方研究院正式發(fā)布AI大模型技術(shù)方案白皮書》(以下簡(jiǎn)稱“白皮書”)。這份白皮書系統(tǒng)梳理了AI大模型的技術(shù)特點(diǎn)、產(chǎn)業(yè)發(fā)展態(tài)勢(shì)與多元應(yīng)用場(chǎng)景,以及移遠(yuǎn)通信“端云+
    的頭像 發(fā)表于 07-28 13:08 ?1237次閱讀
    “端云+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>”新范式:《移遠(yuǎn)通信<b class='flag-5'>AI</b>大模型技術(shù)方案白皮書》正式<b class='flag-5'>發(fā)布</b>

    模態(tài)+空間智能:盾華以AI+智慧路燈桿,點(diǎn)亮城市治理新方式

    模態(tài)+空間智能:盾華以AI+智慧路燈桿,點(diǎn)亮城市治理新方式
    的頭像 發(fā)表于 06-12 10:17 ?648次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>+空間智能:盾華以<b class='flag-5'>AI</b>+智慧路燈桿,點(diǎn)亮城市治理新方式

    微軟推出多項(xiàng)革新性AI工具

    在今年Microsoft Build大會(huì)上,微軟推出了多項(xiàng)革新性Al工具:智能Microsoft 365 Copilot副駕駛Tuning支持企業(yè)通過低代碼方式,結(jié)合自有數(shù)據(jù)與業(yè)務(wù)邏輯定制高精度AI
    的頭像 發(fā)表于 05-26 09:47 ?1164次閱讀

    XMOS為普及AI應(yīng)用推出基于軟件定義SoC的模態(tài)AI傳感器融合接口

    模態(tài)傳感信號(hào)AI處理為智算中心和邊緣智能開啟感知智能的新篇章
    的頭像 發(fā)表于 05-12 17:51 ?536次閱讀
    XMOS為普及<b class='flag-5'>AI</b>應(yīng)用推出基于軟件定義SoC的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>傳感器融合接口

    設(shè)備預(yù)測(cè)性維護(hù)進(jìn)入2.0時(shí)代:模態(tài)AI如何突破誤報(bào)困局

    三號(hào)生產(chǎn)線傳感器報(bào)警頻發(fā)模態(tài) AI 技術(shù)為解決難題提供新思路。工廠升級(jí)數(shù)據(jù)層、決策層、應(yīng)用層,實(shí)現(xiàn)故障預(yù)測(cè),系統(tǒng)上線后立即顯現(xiàn)強(qiáng)大能力,解決設(shè)備問題。
    的頭像 發(fā)表于 04-22 09:24 ?829次閱讀
    設(shè)備預(yù)測(cè)性維護(hù)進(jìn)入2.0時(shí)代:<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>如何突破誤報(bào)困局

    海康威視發(fā)布模態(tài)大模型AI融合巡檢超腦

    基于海康觀瀾大模型技術(shù)體系,??低曂瞥鲂乱淮?b class='flag-5'>多模態(tài)大模型AI融合巡檢超腦,全面升級(jí)人、車、行為、事件等算法,為行業(yè)帶來全新
    的頭像 發(fā)表于 04-17 17:12 ?1626次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    正式提出“智能體化用戶體驗(yàn)”方向,并啟動(dòng)“天璣智能體化體驗(yàn)領(lǐng)航計(jì)劃”。更值得注意的是,其三大AI工具鏈的發(fā)布——天璣開發(fā)工具集、AI開發(fā)套件2.0,以及升級(jí)的天璣星速引擎與旗艦芯片天璣9400+,標(biāo)志著聯(lián)
    發(fā)表于 04-13 19:52

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    全系智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無縫融合模態(tài)
    發(fā)表于 03-21 14:12 ?537次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型,重塑智能交互新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    智能模組產(chǎn)品已全面接入火山引擎豆包VLM(視覺語言)模態(tài)AI大模型。這一突破性進(jìn)展表明,搭載移遠(yuǎn)任意智能模組的終端設(shè)備,均可無縫融合模態(tài)
    的頭像 發(fā)表于 03-20 19:03 ?840次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型,重塑智能交互新體驗(yàn)