91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成

甲子光年 ? 來源:甲子發(fā)現(xiàn) ? 2024-02-22 13:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

獨(dú)家獲悉,谷歌高級(jí)科學(xué)家、卡內(nèi)基梅隆大學(xué)(CMU)計(jì)算機(jī)學(xué)院兼職教授蔣路,已經(jīng)加入TikTok。

蔣路是谷歌 VideoPoet 項(xiàng)目負(fù)責(zé)人,VideoPoet 是谷歌在 2023 年 12 月推出的視頻生成大模型,類似 OpenAI 剛剛發(fā)布的 Sora。

近期,昆侖萬維創(chuàng)始人周亞輝在朋友圈表示,有個(gè)論文的作者加入字節(jié)北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》論文的作者蔣路。

資料顯示,蔣路先后在西安交通大學(xué)、布魯塞爾自由大學(xué)、卡內(nèi)基梅隆大學(xué)學(xué)習(xí)計(jì)算機(jī),并先后進(jìn)入微軟亞洲研究院、谷歌研究院、雅虎研究院實(shí)習(xí)。

2017 年,蔣路畢業(yè)后加入谷歌。他是谷歌云 AI 的創(chuàng)始成員,也是李佳博士和李飛飛博士首次聘請(qǐng)的研究員。此后,蔣路進(jìn)入谷歌研究院工作。

蔣路的研究曾被應(yīng)用到谷歌多個(gè)產(chǎn)品,如 YouTube、云服務(wù)、云 AutoML、廣告、Waymo 和翻譯服務(wù),影響了全球數(shù)十億用戶的日常生活。

蔣路的工作在自然語言處理(ACL)和計(jì)算機(jī)視覺(CVPR)的頂級(jí)會(huì)議上被提名為最佳論文。他是研究社區(qū)的活躍成員,擔(dān)任美國國家種子基金(NSF SBIR)的 AI 評(píng)審專家,并定期擔(dān)任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名會(huì)議的領(lǐng)域主席。

蔣路的研究興趣主要在多媒體交叉領(lǐng)域,他專注于生成式 AI 和視頻創(chuàng)作。2019 年起,他就開始嘗試將 Transformer 用在圖像、視頻生成研究上。

與 Sora 采用的 Diffusion + Transformer 架構(gòu)不同,蔣路負(fù)責(zé)的 VideoPoet 視頻生成模型采用了單 Transformer 架構(gòu),可以將任何自回歸語言模型或大型語言模型轉(zhuǎn)換為高質(zhì)量的視頻生成器,支持生成方形或縱向視頻,以針對(duì)短格式內(nèi)容定制生成視頻,并支持視頻輸入生成音頻。

VideoPoet 采用了名為 Tokenizer 的數(shù)據(jù)處理技術(shù),可以將視頻和音頻片段編碼為離散標(biāo)記序列(discrete tokens),這些標(biāo)記也可以被轉(zhuǎn)換回原始表示。其中,視頻和圖像數(shù)據(jù)使用名為 MAGVIT V2 的技術(shù),音頻數(shù)據(jù)使用 SoundStream 的技術(shù)。

VideoPoet 通過使用多個(gè) Tokenizer 訓(xùn)練一個(gè)自回歸語言模型,以學(xué)習(xí)跨視頻、圖像、音頻和文本模態(tài)。一旦模型根據(jù)某些上下文生成了標(biāo)記,這些標(biāo)記就可以通過分詞器解碼器轉(zhuǎn)換回可查看的表示。

fe1ad37c-d143-11ee-a297-92fbcf53809c.png

3 周前,蔣路本人在職場社交平臺(tái)宣布了自己在谷歌的 Last Day,并特別表示對(duì)在谷歌所做的視頻生成項(xiàng)目(VideoPoet,MAGVIT,WALT等)感到自豪。

蔣路表示自己將繼續(xù)留在灣區(qū),開始視頻生成領(lǐng)域的新旅程?,F(xiàn)在來看,新的旅程就是 TikTok。

值得一提的是,字節(jié)跳動(dòng)已經(jīng)在大模型領(lǐng)域全面布局,模型層推出了自研的「云雀大模型」以及類 ChatGPT 對(duì)話機(jī)器人產(chǎn)品豆包。2023 年底,字節(jié)跳動(dòng)成立新的 AI 應(yīng)用部門 Flow,并在海外推出了 Coze 等多款產(chǎn)品。抖音集團(tuán) CEO 張楠也于近期卸任,專注于 AI 工具剪映的發(fā)展。

字節(jié)跳動(dòng)近期辟謠了推出中文版 Sora,并表示:“還無法完善產(chǎn)品落地,距離國外模型有很大差距?!钡硪环矫?,字節(jié)跳動(dòng)正在大力招攬人才。

大模型戰(zhàn)場,字節(jié)跳動(dòng)將會(huì)如何攪局?




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31125

    瀏覽量

    222452
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47648
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10135
  • TikTok
    +關(guān)注

    關(guān)注

    2

    文章

    226

    瀏覽量

    8285

原文標(biāo)題:獨(dú)家:TikTok引入前谷歌VideoPoet負(fù)責(zé)人蔣路,發(fā)力AI視頻生成|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    谷歌AI霸主歸來!多線反擊OpenAI,開啟安卓Gemini時(shí)代

    Pro、擴(kuò)散語言模型Gemini Diffusion、視頻生成模型Veo 3+ Flow應(yīng)用、圖像生成模型Imagen 4等。在硬件端,分別與三星、Xreal發(fā)布了Android XR頭顯、AR智能眼鏡
    的頭像 發(fā)表于 05-22 09:01 ?6658次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>AI</b>霸主歸來!多線反擊OpenAI,開啟安卓Gemini時(shí)代

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    檢索。 這一組合帶來了高達(dá)176TOPS的整型AI(INT8)。在AI硬件行業(yè)中,算決定了應(yīng)用的天花板: 算區(qū)間 典型應(yīng)用場景 設(shè)備
    發(fā)表于 03-10 14:19

    放棄 14 億天價(jià)合同!前蘋果 AI 負(fù)責(zé)人龐若鳴棄 Meta 轉(zhuǎn)投 OpenAI

    電子發(fā)燒友網(wǎng)綜合報(bào)道 2 月 26 日,一則震撼硅谷的消息在 AI 圈迅速傳開:據(jù)多家權(quán)威媒體報(bào)道,前蘋果 AI 基礎(chǔ)模型團(tuán)隊(duì)負(fù)責(zé)人、上海交大校友龐若鳴(Ruoming Pang)在加盟 Meta
    的頭像 發(fā)表于 02-27 09:35 ?2408次閱讀

    三星電子相關(guān)業(yè)務(wù)負(fù)責(zé)人一行到訪谷東智能參觀交流

    12月23日,三星電子相關(guān)業(yè)務(wù)負(fù)責(zé)人一行到訪谷東智能,圍繞增強(qiáng)現(xiàn)實(shí)(AR)近眼顯示核心光學(xué)技術(shù)及整機(jī)解決方案展開深入交流。來訪團(tuán)隊(duì)包括三星電子CSS 部門長Richard Hwang、LEDoS中國負(fù)責(zé)人 Hang Wang等。
    的頭像 發(fā)表于 12-29 15:44 ?367次閱讀

    OpenAI Sora 2模型上線微軟Azure AI Foundry國際版

    我們非常激動(dòng)地宣布,OpenAI 的新一代多模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國際版)上線,進(jìn)入公共預(yù)覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?792次閱讀
    OpenAI Sora 2模型上線微軟Azure <b class='flag-5'>AI</b> Foundry國際版

    看點(diǎn):谷歌Veo 3.1迎來重大更新硬剛Sora 2 12英寸硅片國產(chǎn)龍頭西安奕材今日申購

    給大家?guī)硪恍I(yè)界資訊: 谷歌Veo 3.1迎來重大更新硬剛Sora 2 據(jù)外媒報(bào)道,在10月16日,谷歌發(fā)布了AI視頻生成模型Veo 3.1,升級(jí)音頻集成與敘事控制能力;以及更逼真的
    的頭像 發(fā)表于 10-16 16:00 ?1035次閱讀

    中科創(chuàng)達(dá)亮相2025低空經(jīng)濟(jì)無人機(jī)行業(yè)應(yīng)用技術(shù)交流會(huì)

    亞馬遜云科技合作伙伴業(yè)務(wù)發(fā)展負(fù)責(zé)人唐曉萍提到,低空經(jīng)濟(jì)的規(guī)?;l(fā)展離不開云端算AI技術(shù)的支撐,亞馬遜云科技將依托全球領(lǐng)先的云計(jì)算能力,與中科創(chuàng)達(dá)等伙伴深化協(xié)同,為無人機(jī)行業(yè)提供從數(shù)據(jù)處理到智能決策的全鏈
    的頭像 發(fā)表于 09-26 10:55 ?937次閱讀

    全球首個(gè)動(dòng)漫專屬AI視頻生成平臺(tái)Animon,國內(nèi)版&quot;萌動(dòng)AI&quot;正式發(fā)布

    Animon國內(nèi)版——"萌動(dòng)AI"首秀:AI動(dòng)漫創(chuàng)作進(jìn)入全民時(shí)代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個(gè)專注于動(dòng)漫的AI視頻
    的頭像 發(fā)表于 09-25 12:33 ?980次閱讀

    FF任命李雋擔(dān)任全球供應(yīng)鏈負(fù)責(zé)人

    “公司”)今日宣布, 任命李雋為FF與FX全球供應(yīng)鏈負(fù)責(zé)人。李雋將對(duì)供應(yīng)鏈業(yè)務(wù)全面負(fù)責(zé),并與各區(qū)域和各職能團(tuán)隊(duì)緊密合作,強(qiáng)化供應(yīng)商合作關(guān)系、提升運(yùn)營韌性、提升價(jià)值鏈效率。此次任命也體現(xiàn)了公司持續(xù)打造世界級(jí)供應(yīng)鏈組織、支持創(chuàng)新與增長的長期承諾。
    的頭像 發(fā)表于 09-03 14:47 ?1031次閱讀

    RK3576助力智慧安防:8高清采集與AI識(shí)別

    全屏/分屏切換,4G、Wi-Fi、雙千兆以太網(wǎng)實(shí)現(xiàn)實(shí)時(shí)推流。3. 米爾RK3576核心板平臺(tái)優(yōu)勢強(qiáng)大的算:6TOPS NPU高性能:8視頻+AI識(shí)別同時(shí)運(yùn)行,CPU占用率僅34%低
    發(fā)表于 08-22 17:41

    美國AI事務(wù)負(fù)責(zé)人警告:中國半導(dǎo)體設(shè)計(jì)能力最多只落后兩年!

    白宮掌管加密貨幣和AI事務(wù)的負(fù)責(zé)人薩克斯(David Sacks)接受媒體訪問時(shí)警告,中國半導(dǎo)體設(shè)計(jì)能力最多只落后美國兩年。 薩克斯受訪時(shí)指出,從DeepSeek年初推出突破性的AI模型,證明即使
    的頭像 發(fā)表于 06-20 16:37 ?796次閱讀

    4K、多模態(tài)、長視頻AI視頻生成的下一個(gè)戰(zhàn)場,誰在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?7315次閱讀

    人形機(jī)器人遇阻?特斯拉“擎天柱”項(xiàng)目負(fù)責(zé)人離職

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)特斯拉“擎天柱”(Optimus)人形機(jī)器人項(xiàng)目負(fù)責(zé)人米蘭·科瓦奇(Milan Kovac)周五表示,他將離開公司。 ? 科瓦奇在X平臺(tái)上發(fā)文稱,“我不得不做出一生中
    的頭像 發(fā)表于 06-10 00:07 ?6478次閱讀
    人形機(jī)器人遇阻?特斯拉“擎天柱”項(xiàng)目<b class='flag-5'>負(fù)責(zé)人</b>離職

    AKOOL發(fā)布全球首款實(shí)時(shí)攝像頭

    近日,硅谷新銳公司AKOOL發(fā)布全球首款實(shí)時(shí)攝像頭Akool Live Camera,集虛擬數(shù)字人、AI視頻翻譯、實(shí)時(shí)換臉、實(shí)時(shí)AI視頻生成四大功能于一身,重新定義了
    的頭像 發(fā)表于 06-09 16:30 ?2245次閱讀

    安森美最新消息:安森美中國區(qū)汽車解決方案負(fù)責(zé)人吳桐博士出任I.S.I.G.中國區(qū)主席

    會(huì)員之夜”慶典上正式揭曉,這是I.S.I.G.對(duì)安森美在半導(dǎo)體領(lǐng)域技術(shù)領(lǐng)導(dǎo)的充分肯定,也為安森美進(jìn)一步推動(dòng)產(chǎn)業(yè)協(xié)同創(chuàng)新、共建繁榮生態(tài)提供了重要平臺(tái)。 ? 安森美中國區(qū)汽車解決方案負(fù)責(zé)人吳桐博士 作為專為半導(dǎo)體行業(yè)決策者打造的專屬協(xié)會(huì),國際半導(dǎo)體行業(yè)協(xié)會(huì)(I.S.I.G.
    的頭像 發(fā)表于 03-31 19:24 ?1416次閱讀
    安森美最新消息:安森美中國區(qū)汽車解決方案<b class='flag-5'>負(fù)責(zé)人</b>吳桐博士出任I.S.I.G.中國區(qū)主席