91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 助力火山引擎開源多媒體處理框架 BMF,將抖音、西瓜視頻的先進(jìn)技術(shù)推向千行百業(yè)

NVIDIA英偉達(dá) ? 來源:未知 ? 2023-09-19 11:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例介紹

火山引擎通過與 NVIDIA 團(tuán)隊(duì)合作開發(fā)了 BMF(Babit Media Framework,多媒體處理框架),提供了豐富的 GPU 即用模塊,低門檻的擴(kuò)展方式,多語言接口以及各類主流框架 SDK 的簡單接入,方便用戶快速打造高效的全 GPU 視頻處理流水線,有效解決開發(fā)效率低,鏈路缺乏整體優(yōu)化的問題,使得 GPU 能夠充分發(fā)揮其強(qiáng)大的并行計(jì)算能力,應(yīng)用于各類視頻 AI 場景。

視頻成為企業(yè)數(shù)字化增長新動(dòng)力

在當(dāng)今人們的生活中,視頻化場景已經(jīng)滲透到了方方面面。QuestMobile 數(shù)據(jù)顯示,截止到 2023 年 5 月,中國移動(dòng)視頻行業(yè)整體用戶規(guī)模達(dá)到 10.76 億,月人均時(shí)長達(dá)到 64.2 小時(shí)[1]。在艾瑞研究院報(bào)告的數(shù)據(jù)中也顯示,目前中國用戶量排名前 100 的 APP 中,有 69% 搭載了視頻類功能,65% 搭載了點(diǎn)播功能,51% 有直播類功能,32% 有實(shí)時(shí)音視頻類功能[2]。視頻應(yīng)用正在從內(nèi)容、娛樂行業(yè)拓展至泛互聯(lián)網(wǎng)和大量傳統(tǒng)行業(yè)。

2016 年抖音上線,同年全民直播和短視頻時(shí)代正式開啟。2018 年,業(yè)界已經(jīng)廣泛地使用 AI 進(jìn)行內(nèi)容理解,視頻增強(qiáng)。2019 年則是云游戲的元年,這一年,低延遲成為業(yè)務(wù)關(guān)注焦點(diǎn)。進(jìn)入 2021 年,市面上已經(jīng)有大量的基于 AI 的視頻增強(qiáng),特效貼紙,AI 視頻編輯的產(chǎn)品出現(xiàn)。如今,以 Stable Diffusion 和大語言模型(LLM) 掀起的生成式 AI 浪潮,正席卷整個(gè)行業(yè)進(jìn)入另一個(gè)全新時(shí)代。GPU 不斷增強(qiáng)的計(jì)算能力和視頻圖像處理能力,正好和業(yè)界的發(fā)展完全契合。與圖文內(nèi)容相比,企業(yè)自建視頻應(yīng)用對技術(shù)積累和資金成本要求較高。為此,火山引擎與 NVIDIA 團(tuán)隊(duì)合作,開源了 BMF(Babit Media Framework)多媒體處理框架。該框架是視頻化部署的“底座”,可為企業(yè)提供從視頻生產(chǎn)到消費(fèi)的全鏈路場景支持,并能協(xié)助幫助開發(fā)者低成本構(gòu)建視頻應(yīng)用。

從 GPU 加速圖像處理,

到 GPU 上部署生成式 AI 業(yè)務(wù)

NVIDIA 自 1999 年發(fā)明 GPU 驅(qū)動(dòng)了 PC 游戲市場的增長,并重新定義了現(xiàn)代計(jì)算機(jī)圖形,開啟了現(xiàn)代 AI 時(shí)代。2012 年,NVIDIA 在 Kepler 架構(gòu)上添加了硬件視頻編解碼器,能更好地支持視頻串流和直播,也就是現(xiàn)在云游戲和游戲直播的原型。到了 2016 年,以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)技術(shù)為整個(gè)圖像處理和計(jì)算機(jī)視覺領(lǐng)域帶來革命,NVIDIA 也順勢推出了用于模型推理的 TensorRT,加速深度學(xué)習(xí)圖像處理。2019 年,為了配合深度學(xué)習(xí)的發(fā)展,NVIDIA 發(fā)布了 nvJPEG,使得 GPU 可以進(jìn)行圖片編解碼。2022 年,NVIDIA 和字節(jié)跳動(dòng)聯(lián)合開源了 CV-CUDA,把加速進(jìn)一步推進(jìn)到前后處理。

wKgaomULIY6ALtoTAACciOLcXDc870.jpg

圖 1. GPU 加速圖像處理發(fā)展歷程

但是從圖像處理到視頻內(nèi)容生成,并非一蹴而就。

理想情況下,我們以 ControlNet 為例,它可以配合 Stable Diffusion 進(jìn)行更精細(xì)的文生圖。如果單純向 Stable Diffusion 提供 cute dog 作為 prompt,Stable Diffusion 會(huì)生成形態(tài)各異的小狗。但是如果用戶想要某一個(gè)特定姿勢的小狗圖片,就需要用更加精細(xì)的方式控制生成過程。ControlNet 就可以做到這一點(diǎn)。以下圖為例,使用 Canny edge detector 生成輸入圖片的輪廓圖,檢測出的輪廓會(huì)和 prompt 一起被輸入 ControlNet 和 Stable Diffusion,即可生成姿勢樣貌相同,但其他細(xì)節(jié)不同的可愛小狗了。實(shí)際上,在其他場景下我們也可以將 Canny edge detector 替換成其他的傳統(tǒng)圖像處理或者 AI 算法,比如使用 pose detector 提取人體姿勢。類似的技術(shù)還可用于文生圖、圖生圖、image inpainting 等。

wKgaomUO1eOAWPhdAAFy4JCafos095.png

圖 2. ControlNet + Stable Diffusion

部署這樣一個(gè)業(yè)務(wù)具體涉及到哪些模塊和環(huán)節(jié)呢?首先,需要圖片和視頻的編解碼,模型的推理(ControlNet/Stable Diffusion),還有前后處理(Canny edge detector)。GPU 有編解碼器,可以運(yùn)行 TensorRT 和 CV-CUDA,能夠?qū)⑦@些模塊一一加速。理想情況下,開發(fā)者應(yīng)當(dāng)充分利用 GPU 各種的硬件單元,減少 GPU 和 CPU 之間的拷貝,讓視頻和圖片存留在 GPU;如果涉及跨界點(diǎn)通信,如將處理前后的視頻在網(wǎng)絡(luò)和 GPU 之間傳輸,還需要結(jié)合 GPU Direct RDMA,簡化通信鏈路,大幅降低延遲、提升吞吐。并且開發(fā)過程遵循阿姆達(dá)爾定律(Amdahl's law),將盡可能多的環(huán)節(jié)加速,整體的性能才能最優(yōu)。

但實(shí)際上,火山引擎視頻團(tuán)隊(duì)遇到了不同模塊之間通信不暢,整體性能不高等諸多問題。本質(zhì)上是因?yàn)橐曨l處理變得越來越復(fù)雜,環(huán)節(jié)越來越多。2000 年 FFmpeg 剛出現(xiàn)的時(shí)候,需要面對的編解碼需求是非常簡單的,單機(jī)、個(gè)人用戶、簡單處理、容錯(cuò)要求低、用戶耐心強(qiáng)。但是用戶對于視頻處理的要求已經(jīng)今非昔比,算法和應(yīng)用的復(fù)雜度越來越高,用戶體驗(yàn)要求也越來越高。以前用戶在電腦前長時(shí)間等待編解碼完成的耐心,已經(jīng)被短視頻的秒級(jí)延遲,甚至 VR/AR、云游戲這樣的毫秒級(jí)延遲所取代。視頻處理涉及的技術(shù)棧也越來越多,包括編解碼、圖像處理、深度學(xué)習(xí)甚至圖像渲染。

NVIDIA 加速火山引擎為視頻云

提供更理想的處理框架:BMF

面對這些挑戰(zhàn),NVIDIA 和火山引擎緊密合作開發(fā)了 BMF,旨在幫助企業(yè)和開發(fā)者將各類視頻的原子能力與方案做到優(yōu)勢互補(bǔ)、協(xié)同工作和快速落地。多媒體處理框架 BMF 的整體架構(gòu)分為應(yīng)用層、框架層、模塊層和異構(gòu)層,共 4 個(gè)部分:

  1. 應(yīng)用層:即頂層,為用戶提供多語言的 API,包括 Python、Go、C++,方便用戶根據(jù)不同的項(xiàng)目需求進(jìn)行開發(fā)集成。

  2. 框架層:即中間層,包括框架對 graph / pipeline 的調(diào)度、跨數(shù)據(jù)類型跨設(shè)備的數(shù)據(jù)流轉(zhuǎn) ackend、以及常用的跨設(shè)備 reformat、color space conversion、tensor 算子等 SDK。

  3. 模塊層:包含了具備各種原子能力的模塊,提供多種語言的模塊開發(fā)機(jī)制,用戶可根據(jù)自身需要將算法/處理實(shí)現(xiàn)為 Python、Go、C++ 語言的任意一種。

  4. 異構(gòu)層:負(fù)責(zé)提供高效的視頻處理算力,包括火山引擎自研的視頻編解碼芯片 ASIC 。

wKgaomULIY6AN0b4AAG4wQdQyPo493.jpg

圖 3. BMF 架構(gòu)圖(綠色高亮表示支持 GPU 加速)

火山引擎通過與 NVIDIA 團(tuán)隊(duì)深入合作,針對 GPU 相關(guān)的框架層能力、處理能力進(jìn)行了深度優(yōu)化,從框架層和模塊層對 BMF 都進(jìn)行了深入改造,針對各種場景進(jìn)行了開發(fā)和測試,并且貢獻(xiàn)了多種應(yīng)用層示例。BMF 提供了豐富的 GPU 即用模塊,低門檻的擴(kuò)展方式,多語言接口以及各類主流框架 SDK 的簡單接入,方便用戶快速打造高效的全 GPU 視頻處理流水線,有效解決前文所述的開發(fā)效率低,鏈路缺乏整體優(yōu)化的問題。這一系列的工作,使得 GPU 能夠充分發(fā)揮其強(qiáng)大的并行計(jì)算能力,應(yīng)用于各類視頻 AI 場景。

比如在大型活動(dòng)直播、電商直播間等場景中,通過“極致超清”技術(shù),能夠有效提升畫質(zhì)體驗(yàn);針對不同損傷情況的經(jīng)典影片,通過“AI 修復(fù)”技術(shù),能夠?qū)p傷后的影片進(jìn)行全面的畫質(zhì)提升;在 VR/AR 等復(fù)雜圖像場景中,通過“ VR 360° 全景圖像技術(shù)”幫助圖像實(shí)現(xiàn)更加高清的效果。

火山引擎總裁譚待表示:在營銷、空間、商業(yè)和知識(shí)的交互體驗(yàn)都在發(fā)生變化的視頻化時(shí)代,視頻云技術(shù)因其從視頻生產(chǎn),處理、傳輸至消費(fèi)的全鏈路技術(shù)能力被賦予了重要使命。隨著 AIGC、XR 等技術(shù)的興起,新技術(shù)與視頻云的融合將帶來更多創(chuàng)新和價(jià)值。

字節(jié)跳動(dòng)視頻架構(gòu)負(fù)責(zé)人、火山引擎視頻云架構(gòu)技術(shù)總監(jiān)王悅表示:“BMF 框架是基于抖音多年實(shí)踐打磨出來的,火山引擎又?jǐn)y手 NVIDIA 針對 GPU 相關(guān)能力進(jìn)行了深度優(yōu)化,使其能夠發(fā)揮更強(qiáng)大的并行計(jì)算能力。“

目前,BMF 已經(jīng)全面開源,包含 BMF 框架層整體開源、9 個(gè)開箱即用案例、20+ API 調(diào)用范例,旨在幫助開發(fā)者低成本地構(gòu)建視頻應(yīng)用。

歡迎訪問BMF Githubhttps://github.com/BabitMF/bmf)頁面,了解更多信息。

數(shù)據(jù)來源:

[1] 資料來源于 QuestMobile 研究院《2023 內(nèi)容視頻化與商業(yè)化洞察報(bào)告》:https://www.questmobile.com.cn/research/report/1678658723797635073 。[2] 資料來源于艾瑞咨詢《2022 年中國視頻云服務(wù)行業(yè)研究報(bào)告》:https://report.iresearch.cn/report/202207/4038.shtml。 GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會(huì)議中心舉行,線上大會(huì)也將同期開放。點(diǎn)擊“閱讀原文”掃描下方海報(bào)二維碼,關(guān)注更多會(huì)議及活動(dòng)信息。

wKgaomULIY-AfE8NAAFtccdApf0231.jpg


原文標(biāo)題:NVIDIA 助力火山引擎開源多媒體處理框架 BMF,將抖音、西瓜視頻的先進(jìn)技術(shù)推向千行百業(yè)

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4087

    瀏覽量

    99197

原文標(biāo)題:NVIDIA 助力火山引擎開源多媒體處理框架 BMF,將抖音、西瓜視頻的先進(jìn)技術(shù)推向千行百業(yè)

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    思必馳亮相2025 AI Partner百業(yè)大會(huì)

    AI浪潮席卷千行百業(yè),“中國式方案”正在無聲地改寫著全球科技產(chǎn)業(yè)版圖,實(shí)現(xiàn)“AI+”與千行百業(yè)的深度賦能。
    的頭像 發(fā)表于 09-03 09:13 ?1105次閱讀

    南方智能SmartDBase數(shù)字孿生底座平臺(tái)賦能千行百業(yè)智慧升級(jí)

    表達(dá)、時(shí)空計(jì)算和場景推演六大能力于一體,實(shí)現(xiàn)了時(shí)空信息生產(chǎn)、治理、應(yīng)用全鏈條服務(wù)能力躍遷,賦能千行百業(yè)邁向數(shù)字化未來。
    的頭像 發(fā)表于 08-25 11:39 ?1731次閱讀

    匯川技術(shù)助力土耳其電梯廠商突破技術(shù)瓶頸

    土耳其Top 3電梯廠商Yükseli?沖擊高端市場,卻受困于高速梯核心技術(shù)瓶頸與海外方案落地難,項(xiàng)目一度擱淺。如何破局?本期《千行百業(yè)有匯川》走進(jìn)土耳其,看匯川技術(shù)如何以自研13m/
    的頭像 發(fā)表于 08-14 13:01 ?1124次閱讀

    開源鴻蒙在千行百業(yè)中的最佳實(shí)踐

    此前,7月23日-24日,開放原子開源生態(tài)大會(huì)在北京國家會(huì)議中心二期盛大舉辦。開源鴻蒙主題演講作為本次大會(huì)的核心分論壇之一,聚焦開源鴻蒙生態(tài)構(gòu)建、技術(shù)創(chuàng)新與行業(yè)賦能等核心議題,深度剖析
    的頭像 發(fā)表于 08-05 16:43 ?1285次閱讀

    潤和軟件亮相2025開放原子開源生態(tài)大會(huì)

    7月23-24日,2025開放原子開源生態(tài)大會(huì)在北京國家會(huì)議中心盛大舉辦。作為由開放原子開源基金會(huì)主辦的年度開源盛會(huì),本屆大會(huì)以“開源賦能產(chǎn)業(yè),生態(tài)共筑未來”為主題,匯聚政府領(lǐng)導(dǎo)、專家
    的頭像 發(fā)表于 08-01 17:49 ?2030次閱讀

    龍芯產(chǎn)品賦能千行百業(yè)的突破性進(jìn)展

    近日,2025龍芯產(chǎn)品發(fā)布暨用戶大會(huì)在北京成功舉辦。本次大會(huì)集中展示了龍芯從基礎(chǔ)民生到國防安全、從石油化工到航空航天、從智慧農(nóng)業(yè)到軌道交通等領(lǐng)域的全棧創(chuàng)新應(yīng)用成果,多角度、全方位呈現(xiàn)了龍芯用科技賦能千行百業(yè)的突破性進(jìn)展,為與會(huì)嘉賓帶來了一場高水平的科技盛宴。
    的頭像 發(fā)表于 07-11 09:48 ?1133次閱讀

    騰視科技TS-NV-P100系列AI邊緣算力盒子綜合算力高達(dá)157TOPS:重新定義AI邊緣算力,賦能千行百業(yè)智能化升級(jí)

    視科技正通過持續(xù)的技術(shù)創(chuàng)新,為千行百業(yè)的智能化轉(zhuǎn)型提供堅(jiān)實(shí)的邊緣算力底座,讓AI真正成為驅(qū)動(dòng)產(chǎn)業(yè)升級(jí)的核心動(dòng)能。
    的頭像 發(fā)表于 07-02 10:24 ?1746次閱讀
    騰視科技TS-NV-P100系列AI邊緣算力盒子綜合算力高達(dá)157TOPS:重新定義AI邊緣算力,賦能<b class='flag-5'>千行</b><b class='flag-5'>百業(yè)</b>智能化升級(jí)

    騰視科技TS-NV-P100系列AI邊緣算力盒子綜合算力高達(dá)157TOPS:重新定義AI邊緣算力,賦能千行百業(yè)智能化升級(jí)

    視科技正通過持續(xù)的技術(shù)創(chuàng)新,為千行百業(yè)的智能化轉(zhuǎn)型提供堅(jiān)實(shí)的邊緣算力底座,讓AI真正成為驅(qū)動(dòng)產(chǎn)業(yè)升級(jí)的核心動(dòng)能。
    的頭像 發(fā)表于 07-02 10:16 ?1088次閱讀

    中興通訊推動(dòng)千行百業(yè)數(shù)智進(jìn)階的創(chuàng)新實(shí)踐

    近日,2025 MWC 上海正式啟幕,中興通訊首席發(fā)展官崔麗應(yīng)邀出席在同日舉行的“科技企業(yè)轉(zhuǎn)型:引領(lǐng)創(chuàng)新新時(shí)代”主旨演講和以“預(yù)見未來,從5G-A到6G”為主題的2025 GTI上海國際產(chǎn)業(yè)大會(huì),分享中興通訊在AI大模型驅(qū)動(dòng)的智能革命浪潮中,推動(dòng)千行百業(yè)數(shù)智進(jìn)階的創(chuàng)新實(shí)踐
    的頭像 發(fā)表于 06-23 15:00 ?1209次閱讀

    開源鴻蒙項(xiàng)目群捐贈(zèng)人授牌儀式成功舉行

    近日,開源鴻蒙開發(fā)者大會(huì)2025(OHDC.2025,以下簡稱“大會(huì)”)在深圳隆重召開。開源鴻蒙共建單位、生態(tài)伙伴齊聚一堂,共同展現(xiàn)了開源鴻蒙在千行
    的頭像 發(fā)表于 06-05 14:30 ?1028次閱讀

    華為全光網(wǎng)加速AI普惠千行業(yè)

    近日,在“華為中國合作伙伴大會(huì)2025”期間,華為光產(chǎn)品線總裁陳幫華發(fā)表了“無光不AI,全光網(wǎng)加速AI普惠千行業(yè)”主題演講。他表示,各行各業(yè)都在積極擁抱AI,AI普及迫切需要光技術(shù)的廣泛應(yīng)用,光
    的頭像 發(fā)表于 04-01 15:32 ?1054次閱讀

    賽思×火山引擎 | 高精度同步時(shí)鐘助力字節(jié)跳動(dòng)華東地區(qū)首個(gè)算力中心落地

    賽思同步時(shí)鐘全方位賦能火山引擎長三角算力中心,助力字節(jié)跳動(dòng)火山引擎打造“云上新宇宙”。
    的頭像 發(fā)表于 03-31 14:44 ?1125次閱讀
    賽思×<b class='flag-5'>火山</b><b class='flag-5'>引擎</b> | 高精度同步時(shí)鐘<b class='flag-5'>助力</b>字節(jié)跳動(dòng)華東地區(qū)首個(gè)算力中心落地

    華為與柳州市人民政府簽署全面合作框架協(xié)議,推動(dòng)“人工智能+”賦能柳州千行百業(yè)

    2025年3月25日柳州市人民政府與華為技術(shù)有限公司(以下簡稱“華為”)在深圳簽署全面合作框架協(xié)議。根據(jù)協(xié)議,雙方重點(diǎn)圍繞“人工智能+制造”、人工智能賦能千行
    的頭像 發(fā)表于 03-26 19:52 ?2734次閱讀

    潤和軟件攜全棧星閃產(chǎn)品亮相第三屆中國數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展大會(huì),共繪“AI+千行百業(yè)”新圖景

    2025年3月22日,由中國計(jì)算機(jī)學(xué)會(huì)(CCF)主辦的第三屆中國數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展大會(huì)(CCDE2025)在蘇州舉行。本屆大會(huì)以“人工智能賦能千行百業(yè)”為主題,匯聚行業(yè)大咖,碰撞思想花火。作為全球領(lǐng)先
    的頭像 發(fā)表于 03-26 09:55 ?1657次閱讀
    潤和軟件攜全棧星閃產(chǎn)品亮相第三屆中國數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展大會(huì),共繪“AI+<b class='flag-5'>千行</b><b class='flag-5'>百業(yè)</b>”新圖景

    華勝天成與中科曙光簽署合作協(xié)議

    近日,華勝天成集團(tuán)與中科曙光在北京簽署合作協(xié)議。雙方圍繞存儲(chǔ)技術(shù)創(chuàng)新、AI全棧解決方案及數(shù)據(jù)中心建設(shè)展開深度協(xié)同,以自主可控的先進(jìn)存力賦能千行百業(yè)
    的頭像 發(fā)表于 03-20 15:38 ?1227次閱讀