91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

科大訊飛引領(lǐng)語音識別技術(shù)新篇章

訊飛開放平臺 ? 來源:訊飛開放平臺 ? 2024-10-14 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無論是《2011太空漫游》中的 HAL 還是《星球大戰(zhàn)》中的 C-3PO,人們長期以來一直幻想著能夠與機器對話。

智能手機助手到智能家居系統(tǒng),再到車載語音控制系統(tǒng),語音識別技術(shù)如今似乎已成為生活中不可或缺的一部分。但在某些場景,表現(xiàn)得并不如人意?!凹∪狻焙汀半u肉”、“北麓”和“北路”,語言的歧義性、語境的依賴性,以及溝通雙方所需的共同知識背景,都是當(dāng)前需要克服的難題。

美國學(xué)者愛德華·霍爾在1976年的著作《超越文化》中,提出了“高語境文化”與“低語境文化”的概念。高語境文化,被認為是一種注重細節(jié)、強調(diào)推斷和推理、強調(diào)群體認同和文化多樣性的文化。中文,是其中典型的代表。因此,在電影《流浪地球》中我們可以看到這樣的場景,MOSS與劉培強的交流中,多次強調(diào)避免使用比喻、反問和暗示,以減少理解上的誤差。

不僅是中文,不同語言之間在語音、語法、詞匯上的差異,以及個體獨特的口音和發(fā)音習(xí)慣,都為語音識別技術(shù)帶來了額外的挑戰(zhàn)。

在語音識別技術(shù)的應(yīng)用已相當(dāng)成熟、跨文化交流增多的今天,如何進一步提高語音識別的準(zhǔn)確率,改善人機交互體驗,為人與人之間交流打破國界、地域的阻礙?

深耕語音技術(shù)領(lǐng)域25年,在AI技術(shù)飛速躍遷的今天,科大訊飛發(fā)布了語音識別大模型,將語音識別的準(zhǔn)確率和多語種識別的效果,提升到了一個新的高度。

01無處不在,語音識別持續(xù)進化

技術(shù)角度來看,語音識別是一項融合多學(xué)科知識的前沿技術(shù),覆蓋了數(shù)學(xué)與統(tǒng)計學(xué)、聲學(xué)與語言學(xué)、計算機與人工智能等基礎(chǔ)學(xué)科和前沿學(xué)科。簡而言之,它的核心任務(wù)是將輸入的語音信號轉(zhuǎn)換為與之匹配度最高的文字序列。

1952年,貝爾實驗室研制出世界上第一個能識別10個英文數(shù)字發(fā)音的實驗系統(tǒng),揭開了人類使用計算機識別語音的序幕。進入90年代,伴隨個人電腦和互聯(lián)網(wǎng)普及,語音識別逐漸走出實驗室,走進公眾視野。2009年之后,深度神經(jīng)網(wǎng)絡(luò)(DNN)的引入,使得語音識別的準(zhǔn)確率顯著提升,相關(guān)產(chǎn)品開始大規(guī)模普及,技術(shù)進入新的發(fā)展階段,深入到我們?nèi)粘I畹姆椒矫婷妗?/p>

大模型技術(shù)引爆的人工智能新一輪應(yīng)用熱潮,其感知能力、認知能力、生成能力正重構(gòu)人機交互方式,不斷刷新用戶期待,在千行百業(yè)落地應(yīng)用。語音識別作為最早落地的人工智能技術(shù)之一,也悄然發(fā)生著變革。

經(jīng)過海量數(shù)據(jù)訓(xùn)練、擁有強大自然語言理解能力的大模型,給語音研究帶來了新的技術(shù)邏輯,創(chuàng)造了語音技術(shù)發(fā)展的全新機會。

通過學(xué)習(xí)更多的語言知識和上下文信息,大模型能實現(xiàn)更精準(zhǔn)的語義理解,準(zhǔn)確識別出語音內(nèi)容;同時,基于更統(tǒng)一的多任務(wù)建模能力,通過在中文、英文和其他語種的語料上進行訓(xùn)練,有助于提升語料稀缺小語種的效果。

科大訊飛作為語音領(lǐng)域的佼佼者,如今正在引領(lǐng)著語音識別技術(shù)的未來發(fā)展。

02語音行業(yè)翹楚,首發(fā)星火語音大模型

智能語音是萬物互聯(lián)機器溝通的入口,也是人工智能賦能千行萬業(yè)、浸潤千家萬戶的秘鑰。

25年前創(chuàng)業(yè)之初,科大訊飛的夢想和使命就是要實現(xiàn)人機信息溝通無障礙,并始終保持初心,長期致力于智能語音技術(shù)的源頭創(chuàng)新及產(chǎn)業(yè)化應(yīng)用。

從2010年國內(nèi)首批開展深度神經(jīng)網(wǎng)絡(luò)語音識別研究,到全球首個中文語音識別深度神經(jīng)網(wǎng)絡(luò)(DNN)上線、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)語音識別全面升級、全球首創(chuàng)基于全序列卷積神經(jīng)網(wǎng)絡(luò)(DFCNN)的語音識別,再到近幾年持續(xù)探索無監(jiān)督預(yù)訓(xùn)練、多模態(tài)在語音識別上的應(yīng)用,訊飛不斷挑戰(zhàn)語音識別實際應(yīng)用中的技術(shù)難題。

2023年,在有“最難語音識別任務(wù)”之稱的語音領(lǐng)域權(quán)威賽事——國際多通道語音分離和識別大賽CHiME中,訊飛在大牛如云的參賽隊伍中,力壓群雄,第四次拿下冠軍。

除中英以外,科大訊飛已具備其他69種語言的語音識別能力,其中有35個語種準(zhǔn)確率超過90%(數(shù)據(jù)來源于實際應(yīng)用)。同時,訊飛開放平臺還在新加坡、俄羅斯、印度、日本等國家部署了海外站點,將語音識別、語音合成等技術(shù),開放給海內(nèi)外開發(fā)者。

大模型時代浪潮下,科大訊飛基于深厚的技術(shù)積累,2024年1月31日正式推出星火語音大模型,引領(lǐng)萬物互聯(lián)時代的人機交互革命。在語音識別方面,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3。其中,13個重點語種識別率達94%,24個主要語種識別率達90%。

03高準(zhǔn)確率+高識別率 語音識別大模型上線

讓更多人能享受到新技術(shù)帶來的便利,近期,基于星火語音大模型的語音識別大模型已在訊飛開放平臺上線,面向開發(fā)者開放調(diào)用,可以將短音頻(≤60秒)精準(zhǔn)識別成文字,除中文普通話和英文外,支持37個語種自動判別,說話過程中可以無縫切換語種,實時返回對應(yīng)語種的文字結(jié)果,并提供公有云接口及私有化部署方案。

與傳統(tǒng)的語音識別產(chǎn)品相比,語音識別大模型有著獨特的優(yōu)勢:

高識別率,高準(zhǔn)確率

基于統(tǒng)一建模的星火多語種語音識別大模型,極大提升了語音識別準(zhǔn)確度,真實還原語音內(nèi)容,提高信息獲取效率

多語種自動判別

支持中文、英語、日語、韓語、俄語、法語等37個語種的自動判別,在說話過程中可以無縫切換語種,助力跨文化交流更自由

指定語種準(zhǔn)確率更高

對于已明確語種的場景,也可以指定語種進行識別,進一步提升正確率

智能標(biāo)點

數(shù)字、標(biāo)點、大小寫和識別結(jié)果同步預(yù)測,使口語表達變規(guī)整,帶來更流暢的閱讀體驗

在開發(fā)者資源方面,除了基礎(chǔ)的WebAPI,訊飛開放平臺還提供了不同平臺的SDK,包括Android、Linux、iOS、Windows,幫助開發(fā)者將語音識別大模型能力快速集成到產(chǎn)品中。

目前,語音識別大模型能力已搭載在訊飛星火APP和訊飛翻譯機等產(chǎn)品中。

打開訊飛星火APP,用語音與星火進行對話,你所說的語音會快速被識別為精準(zhǔn)的文字,讓你直觀感受到語音識別大模型帶來的高準(zhǔn)確率和高識別率。

持續(xù)進步的語音識別技術(shù)正進一步拓展人機交互的場景邊界,在客戶服務(wù)、語音搜索、游戲娛樂、會議記錄、教育培訓(xùn)等領(lǐng)域,為人類帶來更加便捷、高效和智能的生活方式。

正如梅拉妮·米歇爾在《AI 3.0》書中強調(diào),自動語音識別是深度學(xué)習(xí)在自然語言處理中的第一個重大成就,也是迄今為止人工智能在所有領(lǐng)域中取得的最重要的成就。這不僅是對語音識別技術(shù)的認可,更是對未來人機交互無限可能的預(yù)示。

點擊閱讀原文,免費領(lǐng)取語音識別大模型試用包,至高20萬次服務(wù)量(中文)。

文末彩蛋

2023年,科大訊飛與統(tǒng)信軟件宣布達成戰(zhàn)略合作,充分發(fā)揮各自技術(shù)和產(chǎn)品優(yōu)勢,共同探索新的商業(yè)模式,推動AI技術(shù)在各行各業(yè)的深度應(yīng)用。

統(tǒng)信軟件是全球主流操作系統(tǒng)產(chǎn)品與服務(wù)提供商,統(tǒng)信UOS桌面版發(fā)貨量累計超過600萬,服務(wù)器版發(fā)貨量增速更是位列行業(yè)前列。

近日,訊飛星火、訊飛智文已正式上架統(tǒng)信應(yīng)用商店,讓全球用戶可通過統(tǒng)信應(yīng)用商店一鍵輕松暢享AI樂趣,感受前所未有的便捷應(yīng)用與服務(wù)體驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39756

    瀏覽量

    301366
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1812

    瀏覽量

    116047
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    860

    瀏覽量

    63715

原文標(biāo)題:對標(biāo)Open AI Whisper,語音識別進入下一個 level

文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    國資入主聯(lián)創(chuàng)電子開啟企業(yè)發(fā)展嶄新篇章

    冬日暖陽耀贛江,聯(lián)創(chuàng)電子譜新章。2025年12月25日,聯(lián)創(chuàng)電子科技股份有限公司(證券簡稱:聯(lián)創(chuàng)電子,股票代碼:002036)股票復(fù)牌,正式書寫企業(yè)發(fā)展歷程中的嶄新篇章。
    的頭像 發(fā)表于 01-09 14:47 ?548次閱讀

    科大設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局

    ,經(jīng)營范圍涵蓋人工智能公共服務(wù)平臺技術(shù)咨詢服務(wù)、集成電路設(shè)計、人工智能基礎(chǔ)軟件開發(fā)等業(yè)務(wù),由科大全資持股。此次新設(shè)子公司是科大
    發(fā)表于 12-29 08:53 ?972次閱讀

    迅為Hi3403開發(fā)板驅(qū)動教程全面上線,開啟嵌入式Linux開發(fā)新篇章!

    迅為iTOP-Hi3403開發(fā)板linux驅(qū)動教程全面上線,開啟嵌入式Linux開發(fā)新篇章
    的頭像 發(fā)表于 12-18 14:23 ?677次閱讀
    迅為Hi3403開發(fā)板驅(qū)動教程全面上線,開啟嵌入式Linux開發(fā)<b class='flag-5'>新篇章</b>!

    2025科大全球1024開發(fā)者節(jié)精彩回顧

    當(dāng)全球產(chǎn)業(yè)格局和競爭形態(tài)重塑之時,AI將如何發(fā)展?11月6日,在第八屆世界聲博會暨2025科大全球1024開發(fā)者節(jié)發(fā)布會上,科大
    的頭像 發(fā)表于 11-10 11:51 ?882次閱讀
    2025<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>全球1024開發(fā)者節(jié)精彩回顧

    科大發(fā)布星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會暨2025科大全球1024開發(fā)者節(jié)發(fā)布會上,科大以《更懂你的
    的頭像 發(fā)表于 11-10 11:49 ?920次閱讀

    西班牙工程與技術(shù)公司攜手FLIR開啟高溫檢測新篇章

    在鋼鐵制造這一傳統(tǒng)而充滿挑戰(zhàn)的領(lǐng)域,高溫與惡劣環(huán)境如同兩道難以逾越的鴻溝,橫亙在提升生產(chǎn)效率與質(zhì)量的道路上。然而,西班牙工程與技術(shù)先鋒BcB Informatica y Control攜手Flir公司,構(gòu)建了創(chuàng)新的技術(shù)解決方案,正為這一行業(yè)注入智能化升級的新動力,開啟高溫
    的頭像 發(fā)表于 11-02 11:37 ?920次閱讀

    云臺電機驅(qū)動:開啟智能化時代的新篇章

    在科技飛速發(fā)展的今天,智能化已經(jīng)滲透到我們生活的方方面面。而在眾多科技領(lǐng)域中,云臺電機驅(qū)動技術(shù)正以其獨特的魅力,開啟著智能化時代的新篇章。
    的頭像 發(fā)表于 07-23 18:16 ?970次閱讀

    編碼器線:精準(zhǔn)連接,高效傳動,引領(lǐng)科技新篇章

    在日新月異的科技時代,每一個微小的進步都可能成為推動行業(yè)變革的關(guān)鍵。編碼器線,這一看似不起眼的組件,卻在自動化、智能制造、機器人技術(shù)等眾多高科技領(lǐng)域中扮演著至關(guān)重要的角色。今天,就讓我們一起走進編碼器線的世界,探索它如何以精準(zhǔn)連接和高效傳動,引領(lǐng)科技
    的頭像 發(fā)表于 06-27 16:57 ?966次閱讀

    打破交互困局:科大這樣出手

    十年深耕,科大智能交互如何引領(lǐng)未來
    的頭像 發(fā)表于 06-17 11:50 ?1166次閱讀
    打破交互困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>這樣出手

    回顧科大26周年慶精彩瞬間

    近日,科大26周年司慶上,董事長劉慶峰對這個作文題感觸很深:“從1999年創(chuàng)業(yè)時在“中國被人扼住了咽喉”背景下以語音合成系統(tǒng)破局,到這些年智能
    的頭像 發(fā)表于 06-13 14:08 ?989次閱讀

    科大加速東南亞企業(yè)的人工智能應(yīng)用

    日前,科大飛在新加坡成功舉辦合作伙伴峰會暨創(chuàng)新產(chǎn)品發(fā)布會。這場匯聚關(guān)鍵合作伙伴、行業(yè)先驅(qū)和技術(shù)領(lǐng)袖的盛會,不僅集中展示了科大
    的頭像 發(fā)表于 05-06 09:39 ?906次閱讀

    科大亮相第137屆廣交會

    今天,第137屆中國進出口商品交易會(廣交會)在廣州開幕。科大又一年參展,集中展示了星火大模型的最新
    的頭像 發(fā)表于 04-17 09:30 ?1132次閱讀

    國產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。

    國產(chǎn)首款量產(chǎn)型七位半萬用表!青島漢泰開啟國產(chǎn)高精度測量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數(shù)字萬用表。HDM3075系列是國產(chǎn)首款實現(xiàn)量產(chǎn)的七位半萬用表產(chǎn)品,它
    發(fā)表于 04-01 13:15

    智造未來,工業(yè)互聯(lián)網(wǎng)mes系統(tǒng)開啟“工業(yè)4.0”新篇章

    的生產(chǎn)方式,更開啟了“工業(yè)4.0”的新篇章引領(lǐng)制造業(yè)邁向更加智能化、高效化的未來?!I(yè)互聯(lián)網(wǎng)mes系統(tǒng):智能制造的超級大腦工業(yè)互聯(lián)網(wǎng)mes系統(tǒng),作為連接企業(yè)資
    的頭像 發(fā)表于 03-21 10:32 ?889次閱讀
    智造未來,工業(yè)互聯(lián)網(wǎng)mes系統(tǒng)開啟“工業(yè)4.0”<b class='flag-5'>新篇章</b>

    科大攜手西安鐵路局打造人工智能平臺

    近日,科大攜手中國鐵路西安局集團有限公司(以下簡稱“西安鐵路局”)打造的人工智能平臺正式上線啟用。該人工智能平臺集成星火大模型
    的頭像 發(fā)表于 03-17 16:14 ?1019次閱讀