91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全球AI音樂會,第一次聽見中國聲音

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-04-19 11:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盛夏將至,各條AI賽道也熱烈了起來。如果評選一下,近段時間哪個領(lǐng)域的AI應(yīng)用最為火爆,那么AI音樂創(chuàng)作絕對名列前茅。

一個月之前,海外初創(chuàng)企業(yè)Suno發(fā)布新版AI音樂生成大模型Suno V3,它可以根據(jù)用戶自然語言快速生成相關(guān)風(fēng)格音樂,在全球范圍內(nèi)引發(fā)熱議。而就在不久前,來自前DeepMind團隊成員的Udio音樂大模型發(fā)布。這款模型可以帶來非常逼真的音樂制作效果,并且可以完成多段式、長音樂作品的生成。

AI音樂生成大模型賽道,競爭突然激烈了起來。加上OpenAI的MuseNet、谷歌的MusicLM、Meta的MusicGen等項目,我們似乎在今年迎來了一場全球AI音樂會。一時間異彩紛呈,好不熱鬧。

但在這場AI音樂會中,有一個現(xiàn)象非常值得重視:這一次,中國科技與全球前沿AI趨勢之間沒有時差,無縫銜接。我們不再是跟隨者與追趕者,而是第一時間加入了這場音樂與AI的盛宴,奏響了屬于自己的旋律。

4月2日,由昆侖萬維打造的AI音樂生成大模型“天工SkyMusic”開啟免費邀測,4月17日更是正式發(fā)布。

天工SkyMusic是國內(nèi)唯一公開可用的AI音樂生成大模型,也是中國首個音樂SOTA模型。

它與震撼全球科技與音樂產(chǎn)業(yè)的Suno、Udio保持了時間線上的高度同步,同時多個領(lǐng)域的技術(shù)能力更加出色。在與Suno V3的橫向測評中,天工SkyMusic在人聲&BGM音質(zhì)、人聲自然度、發(fā)音可懂度等領(lǐng)域顯著領(lǐng)先對手,并以6.65分的綜合得分超越Suno V3,成為全球AI音樂最新SOTA模型。

wKgaomYh3oqAOsQ-AAFs-iXnfDE192.jpg

“中國AI不缺席”,是一段我們期待了很久的旋律。究竟是什么讓昆侖萬維能夠完成這次演奏?天工SkyMusic,以及背后的天工3.0有著怎樣的產(chǎn)業(yè)與社會價值?

讓我們打開這場全球AI音樂會,聽懂一首關(guān)于“中國AI不缺席”的盛夏奏鳴曲。

天工SkyMusic:東方的AI音樂會

不缺席的中國AI音樂大模型,不僅需要第一時間躋身行業(yè)一線,更需要在能力上拿出足夠有說服力的答案。

天工SkyMusic在發(fā)布之后,獲得了各方非常積極的反饋。來自媒體、音樂人與行業(yè)專家以及廣大用戶的聲音,證明了其具備加入全球AI音樂大模型競逐的底氣。AI音樂會不僅發(fā)生在歐美,同時也奏響在東方。

首先,我們可以具體來看一下天工SkyMusic在技術(shù)能力上的特色。

通過采用音樂音頻領(lǐng)域類Sora的DiT模型架構(gòu),天工SkyMusic在AI音樂大模型的幾個核心能力指標上都有不俗的表現(xiàn)。

其中包括高質(zhì)量的音樂生成能力、高逼真的人聲模擬能力、高豐富度的歌詞段落控制能力、高規(guī)模的音樂風(fēng)格掌握,以及高靈活的音樂表達。

舉例而言,歐美AI音樂風(fēng)格多以“器”見長,更偏重樂器豐富度參數(shù),但在人聲擬合方面往往表現(xiàn)一般。

相較而言,昆侖萬維天工SkyMusic則專門在人聲自然度、發(fā)音可懂度上進行了模型專門訓(xùn)練,使得AI發(fā)音清晰、無異響,讓大模型生成的音樂足以“以假亂真”。

此外,天工SkyMusic所能夠創(chuàng)作的音樂,展現(xiàn)出了對多種不同音樂風(fēng)格,不同生成訴求的把握。比如神曲改造對流行音樂的把握,古詩詞改編對中國傳統(tǒng)文化與格律的把握等。

透過廣泛的生成案例,我們可以發(fā)現(xiàn)天工SkyMusic具有豐富的使用場景與廣泛的需求人群,例如:

1.音樂從業(yè)者可以借助天工SkyMusic尋找靈感,輔助音樂創(chuàng)作。比如說,創(chuàng)作者可以輸入一些“母題”,包括親情、愛情等。通過天工SkyMusic生成的歌詞與旋律來尋找靈感,探索創(chuàng)作邊界。

2.短視頻創(chuàng)作者和UP主可以通過音樂生成來拓展創(chuàng)作邊界,降低音樂方案的創(chuàng)作門檻。比如說,UP主可以用天工SkyMusic改編“網(wǎng)絡(luò)神曲”,獲得新的視頻BGM。下面這首神曲,天工SkyMusic就可以為你帶來完全不一樣的感受。


3.音樂愛好者與粉絲可以獲得更多樣的音樂樂趣,與自己喜歡的音樂類型、音樂風(fēng)格進行更加多樣性、深層次的互動。比如我們可以換一個聲音,把我們喜歡的音樂進行重新演繹。

4.在教育教學(xué)場景中,天工SkyMusic可以用來輔助音樂教育,讓學(xué)習(xí)者感受到音樂創(chuàng)作的內(nèi)在邏輯與豐富技巧。同時還能夠助力傳統(tǒng)文化、樂器演奏等方面的教育教學(xué)。比如說,天工SkyMusic可以基于古詩詞生成音樂,讓學(xué)生更生動準確掌握古典文化的精髓。

在這樣的應(yīng)用價值基礎(chǔ)上,我們還必須看到天工SkyMusic作為國內(nèi)最早,也是目前唯一的AI音樂大模型,在填補產(chǎn)業(yè)空白方面的價值是巨大的。它的出現(xiàn),意味著中國用戶有了更加符合華語音樂創(chuàng)作習(xí)慣的AI模型,對中文有了更好的支持。同時它完全免費,不限使用次數(shù),無需額外的使用門檻,這都是國外同類AI音樂模型所無法實現(xiàn)的。

而從技術(shù)角度上看,天工SkyMusic對比MuseNet、MusicLM、MusicGen等項目也具備獨特的技術(shù)優(yōu)勢。

除了上文提到的人聲合成演唱能力外,在音樂風(fēng)格上天工SkyMusic更加精巧且多元。它能夠通過歌詞控制情緒變化,實現(xiàn)如顫音、歌劇、吟唱等多種歌唱技巧,并且可以使生成的音樂作品情感更加豐富且貼合情境。在此基礎(chǔ)上,天工SkyMusic支持創(chuàng)作說唱、民謠、放克、古風(fēng)、電子等多種音樂風(fēng)格,用戶可以根據(jù)個人喜好定制音樂風(fēng)格。

總體來看,天工SkyMusic開創(chuàng)了中國AI音樂大模型的先河,成為中國首個音樂AIGC SOTA,并且大幅提高了AI大模型音樂生成在人聲領(lǐng)域的技術(shù)表現(xiàn)。

天工 3.0:全球最大規(guī)模的開源MOE大模型

天工SkyMusic能夠與全球AI音樂會同頻奏響,背后必然離不開兩點:一是戰(zhàn)略方向的敏銳把握,二是技術(shù)底座的基石打造。

而天工SkyMusic背后的技術(shù)基石,則是剛剛發(fā)布的“天工3.0”

天工3.0采用了4000億級參數(shù)MoE混合專家模型,是目前全球模型參數(shù)最大、性能最強的MoE模型之一。相較于上一代天工2.0MoE大模型,其在模型語義理解、邏輯推理,以及通用性、泛化性、不確定性知識、學(xué)習(xí)能力等領(lǐng)域都有著大幅的性能提升,其模型技術(shù)知識能力提升超過20%,數(shù)學(xué)/推理/代碼/文創(chuàng)能力提升超過30%。

具體來看,天工3.0在四個方向帶來了全面升級:

首次是邏輯推理能力的增強。天工3.0強大的邏輯推理能力使其能夠在實際應(yīng)用中更加準確和高效地處理信息。例如,在天工3.0AI搜索的研究模式中,能夠圍繞用戶的某個簡單指令進行相關(guān)問題的延伸,并實時判斷該段落信息是否需要聯(lián)網(wǎng)搜索。在分析某個具體行業(yè)的信息時,能夠?qū)崿F(xiàn)總結(jié)相關(guān)事件、拆解產(chǎn)業(yè)鏈地圖等復(fù)雜功能,并以結(jié)構(gòu)化或思維導(dǎo)圖的形式進行最終展示,讓AIGC能力與行業(yè)應(yīng)用更緊密融合。

其次,是語義理解能力的增強。天工3.0能夠更好地理解和處理用戶自然語言Query中的復(fù)雜語義信息,包括隱喻、多義詞等。比如說,天工3.0可以對用戶Query進行拆解、細化,甚至對用戶進行追問,從而在面對不確定知識時表現(xiàn)更好,能夠滿足用戶多樣化的需求。

此外,天工3.0新增了專項Agent訓(xùn)練能力。天工3.0可以針對模型獨立規(guī)劃、調(diào)用、組合外部工具及信息的能力進行了專項訓(xùn)練,使其能夠獨立生成并調(diào)用代碼,完成包括產(chǎn)業(yè)研究、產(chǎn)品橫評、信息分析、圖片生成、圖表繪制等多種復(fù)雜用戶需求。

針對B端產(chǎn)業(yè)用戶的需求,天工3.0也在知識庫能力、任意工具調(diào)用能力、復(fù)雜角色指令追尋能力等領(lǐng)域進行了升級,企業(yè)用戶可以通過上傳知識文檔構(gòu)建專屬知識庫及Agent,并實現(xiàn)自動調(diào)用制定工具、完成復(fù)雜指令遵循Agent構(gòu)建等實用能力。

最后,天工3.0的內(nèi)容生成能力也得到了全面升級。對比天工2.0,天工3.0群星了全面的內(nèi)容創(chuàng)作能力增強,能夠完成AI音樂生成、AI語音、AI對話、AI二次元漫畫生成等內(nèi)容創(chuàng)作。還可以通過專項Agent訓(xùn)練實現(xiàn)在對話中結(jié)合文本需求實時生成圖片、結(jié)合文本需求實時內(nèi)容分析及圖表構(gòu)建等能力。

總結(jié)天工3.0的技術(shù)特點,最為關(guān)鍵的一點就是:獨立思考。

天工3.0可以將復(fù)雜任務(wù)進行拆解優(yōu)化,并在每一步都獨立思考,判斷每一步是否需要調(diào)用不同的工具。也是基于獨立思考能力,天工3.0新增了聯(lián)網(wǎng)能力、文生圖、代碼能力等優(yōu)勢應(yīng)用能力,同時增強了AI搜索等能力的表現(xiàn)。

更為值得注意的是,性能強大,技術(shù)獨創(chuàng)性極強的天工3.0,選擇了開源開放的策略。在全球開源大模型極速發(fā)展,基于開源生態(tài)的AI應(yīng)用百花齊放的大背景下,天工3.0的開源無疑是給中國AI開源事業(yè)注入了強心劑。全面提升了中國開源大模型的整體技術(shù)水平與產(chǎn)業(yè)底座厚度。

在選擇開源開放的同時,天工3.0還搭建了智能體廣場,幫助開發(fā)者定制化打造智能體。更好的中文適配度,也讓天工3.0與中文開發(fā)需求更加契合。

全面增強的能力,更加豐富的功能,以及與開發(fā)者更緊密地契合,讓天工3.0成為一塊基石——“中國AI不缺席”的基石。

這一次,中國AI不缺席

過去AI行業(yè)內(nèi)部總是認為,我們與歐美頂級AI企業(yè)之間存在著時間差。在新模型、新技術(shù)火熱之后,中國AI行業(yè)才開始跟隨和學(xué)習(xí)。

但在AI音樂大模型的熱潮里,情況顯然并非如此。為什么我們這次可以不跟隨,不焦慮,而是第一時間抵達這個舞臺,開始自己的演奏?

事實上,在AI音樂生成這個方向上,昆侖萬維一直保持著高度關(guān)注。早在2022年12月昆侖萬維發(fā)布的“昆侖天工”AIGC全系列開源算法與模型中,就包括多模態(tài)音樂內(nèi)容生成大模型。此后,昆侖萬維還打造了多個基于AI音樂大模型的合作項目,掌握了豐富的實踐經(jīng)驗。昆侖萬維關(guān)注并且重視AI音樂生成,是天工SkyMusic的戰(zhàn)略牽引。

天工3.0與天工SkyMusic的發(fā)布展現(xiàn)出來了這樣一個價值邏輯:在AI大模型快速發(fā)展的產(chǎn)業(yè)紀元里,想要提升創(chuàng)新效率,把握戰(zhàn)略機遇,需要首先孕育一個底座。這個底座可以融合各種先進的AI技術(shù)能力。

wKgZomYh3oqAHuwZAABV3EHqUIw366.jpg

昆侖萬維集團董事長兼CEO方漢認為,SOTA指的是當前技術(shù)在本領(lǐng)域技術(shù)指標全球第一。OpenAI是文本大模型和視頻生成大模型的SOTA,而昆侖萬維目前實現(xiàn)了音樂AIGC的SOTA。

之所以能夠?qū)崿F(xiàn)這一點,有賴于天工3.0提供了底座級別的AI能力,進而實現(xiàn)發(fā)展效率與發(fā)展質(zhì)量的統(tǒng)一。

昆侖萬維創(chuàng)始人周亞輝認為:“未來三十年,人類社會很大的一個變化,是人類要從感知線,變成表達線,整個人類社會在自我表達側(cè)要翻1000倍;創(chuàng)作和自我表達是未來30年在整個社交和文化領(lǐng)域增長最快的曲線,會有越來越多人表達自我,表達對世界的理解、對社會事物的態(tài)度,表達越來越藝術(shù)化和趣味化;這種表達在過去很困難,因為工具門檻高,而未來30年是自我表達的30年,我們要用AI把人類創(chuàng)作的門檻降得足夠低,讓人們更充分地實現(xiàn)自我表達。”

基于昆侖萬維“All in AGI 和 AIGC”的戰(zhàn)略布局,天工3.0成為集自然語言處理、計算機視覺、多模態(tài)、AI搜索、AI智能體等多項前沿技術(shù)為一身的AI大模型。基于天工3.0提供的底座能力,昆侖萬維可以敏銳步驟發(fā)展機會,抓住諸如AI音樂創(chuàng)作這樣的產(chǎn)業(yè)風(fēng)口。而廣大開發(fā)者則可以獲得多元且豐富的AI能力,將AI帶到千行百業(yè)的每個角落。

以超級模型蘊育種種AI技術(shù),包容千行百業(yè),這才是全球AI音樂會中,那道獨特且悅耳的東方旋律。

在起步階段的天工SkyMusic,已經(jīng)為用戶帶來了豐厚的音樂創(chuàng)作樂趣。隨著未來的持續(xù)優(yōu)化升級,我們會得到一個專業(yè)且易用的音樂創(chuàng)作平臺。圍繞天工SkyMusic,將可能出現(xiàn)AI音樂創(chuàng)作者生態(tài),新的音樂明星。進而影響音樂行業(yè)的發(fā)展。

在全球AI音樂的熱潮背后,我們可以看到從“中國AI不缺席”到“中國AI如何引領(lǐng)”的深刻變革。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39847

    瀏覽量

    301506
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10101
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3652

    瀏覽量

    5195
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    GD32 usbcdc單片機從機只發(fā)送,串口打開第一次自動發(fā)最后一次測量的值

    { usb_txfifo_flush(IN端口1) usbd_ep_send(data,size) } 然后就是進cdc_acm_in回調(diào)函數(shù),packet_sent = 1 串口打開時候,明顯第一次多發(fā)一次值,或者說如果先
    發(fā)表于 02-04 10:24

    新思科技分享實現(xiàn)AI芯片一次流片成功的十大策略

    由于 AI 芯片的硬件與軟件之間存在高度復(fù)雜且相互依賴的關(guān)系,定制 AI 芯片已成為當今半導(dǎo)體行業(yè)中資金投入最高、風(fēng)險最大的研發(fā)項目之。旦設(shè)計需要重新設(shè)計進行二
    的頭像 發(fā)表于 01-19 11:08 ?668次閱讀

    思必馳出席江蘇省語言計算及應(yīng)用重點實驗室學(xué)術(shù)委員第一次會議

    12月28日,江蘇省語言計算及應(yīng)用重點實驗室(以下簡稱:實驗室)學(xué)術(shù)委員第一次會議順利召開。實驗室主任、上海交通大學(xué)特聘教授、思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱向委員匯報實驗室研究方向和建設(shè)進展
    的頭像 發(fā)表于 01-06 16:35 ?482次閱讀

    中軟國際加入全球計算聯(lián)盟CloudDevice專業(yè)委員

    今日,華為全聯(lián)接大會2025在上海啟幕。期間,全球計算聯(lián)盟(GCC)CloudDevice專業(yè)委員(以下簡稱“專委會”)第一次全體會議召開,華為與中國信通院、中科院、中移互聯(lián)、中軟國
    的頭像 發(fā)表于 09-19 14:18 ?708次閱讀

    濕法去膠第一次去不干凈怎么樣

    在半導(dǎo)體制造過程中,若濕法去膠第一次未能完全去除干凈,可能引發(fā)系列連鎖反應(yīng),對后續(xù)工藝和產(chǎn)品質(zhì)量造成顯著影響。以下是具體后果及分析:殘留物導(dǎo)致后續(xù)工藝缺陷薄膜沉積異常:未清除的光刻膠殘留作為異物
    的頭像 發(fā)表于 09-16 13:42 ?647次閱讀
    濕法去膠<b class='flag-5'>第一次</b>去不干凈<b class='flag-5'>會</b>怎么樣

    智能客服驅(qū)動效率和體驗升級,上海電信+昇騰AI一次民生應(yīng)用實踐

    上海電信+昇騰AI一次民生應(yīng)用實踐
    的頭像 發(fā)表于 07-30 23:44 ?2955次閱讀
    智能客服驅(qū)動效率和體驗升級,上海電信+昇騰<b class='flag-5'>AI</b>的<b class='flag-5'>一次</b>民生應(yīng)用實踐

    暑假班第一次直播回放 | 新能源汽車的基礎(chǔ)知識及RK3576芯片功能模塊介紹

    感謝大家的支持,由李增老師主講的RK3576汽車視覺智能座艙系統(tǒng)設(shè)計暑假班正式開課啦!掃描下方二維碼觀看第一次直播回放視頻。觀看回放1.前沿實戰(zhàn),開啟汽車座艙新征程今年的暑假班中,李老師以全程實例
    的頭像 發(fā)表于 07-11 16:31 ?681次閱讀
    暑假班<b class='flag-5'>第一次</b>直播回放 | 新能源汽車的基礎(chǔ)知識及RK3576芯片功能模塊介紹

    STM32H747 USB接口,插拔第一次連接的上,之后就再也連接不上,為什么?

    狀態(tài) :STM32H747 全新板子,沒有燒任何程序,boot0 拉高。上電 USB口強制進入DUF模式。 操作及現(xiàn)象 1、第一次上電,通過USB連接電腦 ??梢宰R別成 DFU in FSmode
    發(fā)表于 07-10 06:08

    航盛電子出席東風(fēng)日產(chǎn)第一次供應(yīng)鏈顧問委員

    近日,以“共創(chuàng)、共贏”為主題的東風(fēng)日產(chǎn)第一次供應(yīng)鏈顧問委員會在廣州召開。39家戰(zhàn)略供應(yīng)商齊聚東風(fēng)日產(chǎn)企業(yè)大學(xué),結(jié)合時代機遇與挑戰(zhàn),共商共享發(fā)展方針。航盛集團董事長、總裁楊洪作為東風(fēng)日產(chǎn)供應(yīng)鏈顧問代表,受邀出席本次會議。
    的頭像 發(fā)表于 07-01 16:58 ?971次閱讀

    福田特來電2025年第一次股東及董事順利召開

    近日,北京福田特來電微電網(wǎng)科技有限公司(以下簡稱“福田特來電”)2025年第一次股東及董事會在福田汽車北京總部召開。福田汽車副總經(jīng)理、福田特來電董事長崔士朋、福田汽車金融副總裁張雪薇、福田汽車Z
    的頭像 發(fā)表于 06-18 17:32 ?1170次閱讀

    看門狗存在問題,設(shè)備第一次設(shè)置后正常,再次運行提示ValueError: WDT id is used,怎么解決?

    看門狗存在問題,設(shè)備第一次設(shè)置后正常,再次運行提示ValueError: WDT id is used,重啟也無法恢復(fù)
    發(fā)表于 04-29 07:17

    ADXL355從停止模式進入測量模式后,第一次讀取加速度數(shù)據(jù)值為0是怎么回事?

    出的值為全為0,但讀取數(shù)據(jù)前先讀取0x04狀態(tài)寄存器,顯示DATA_RDY位的值為1。怎樣操作才能保證退出停止模式進入測量模式后,第一次讀取的數(shù)據(jù)為正常值呢?
    發(fā)表于 04-16 07:01

    PCM2912APJTR設(shè)計的USB聲卡播放聲音有噠噠的聲音的原因有哪些

    最近學(xué)習(xí)PCB設(shè)計設(shè)計了個USB聲卡,電路圖參考了官方demo模塊的原理圖,但是設(shè)計出來的板子發(fā)現(xiàn)播放音樂會有噠噠的聲音。本人由于是初學(xué)者,所以有點不懂是PCB不對的問題還是原理圖設(shè)計的問題了。 希望有人能夠給點修改建議。 下
    發(fā)表于 03-21 11:54

    第一次給本科生講課,從孩子們身上我看到了祖國未來希望

    第一次給本科生代課,我感覺是件很有意義的事情,孩子們也讓我倍加感動,記錄到公眾號,分享給大家。 下圖是課程結(jié)束后,學(xué)生們自己非常自覺地整理實驗材料,注意:是自覺整理,這體現(xiàn)出孩子們對器材和設(shè)備
    的頭像 發(fā)表于 03-12 12:21 ?1289次閱讀
    <b class='flag-5'>第一次</b>給本科生講課,從孩子們身上我看到了祖國未來希望

    STM32L496RG第一次燒寫程序后需要重新上下電才能正常執(zhí)行程序,為什么?

    項目中使用板子第一次下程序后必須得重新上下電才能下程序,期間什么復(fù)位都不起作用,只有第一次會有這種情況 觀察第一次對應(yīng)的PC指向0X1FFF5236,該區(qū)域?qū)?yīng)SYSTEM區(qū),以為是啟動選項字節(jié)問題,發(fā)現(xiàn)燒寫完和未燒寫的選型字
    發(fā)表于 03-11 07:41