91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI識別親吻動作,也搞起浪漫來

Hf1h_BigDataDig ? 來源:YXQ ? 2019-07-10 15:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

7月6日,這可能是一年中最適合親吻的日子——國際接吻日(International Kissing Day)。

這個節(jié)日最早起源于英國。1991年這個節(jié)日得到了聯(lián)合國的承認,也希望讓更多人知道,親吻的美好,這也是人類表達愛意最自然的一種方式。

那么,人工智能可以通過訓練了解親吻嗎?

來自Netflix的一位高級數(shù)據(jù)科學家就對“kiss”鏡頭情有獨鐘,并且通過上百部電影接吻情節(jié)的定位,成功訓練出了可以準確識別電影親吻橋段的AI模型——模型的獨創(chuàng)性在于可以區(qū)別親吻與性行為。

大千世界,無所不能,AI也能檢測到"kiss"?

讓AI區(qū)別kiss和sex

作為愛情片的代表情節(jié),“親吻”一直是很多觀眾最愛反復觀看的鏡頭。不管是《人鬼情未了》中Swayze和Demi Moore的經(jīng)典接吻橋段,還是《泰坦尼克號》中Rose和Jack的臨別一吻,都造就了經(jīng)典中的經(jīng)典。

而在電影觀看過程中,尋找kiss鏡頭,就成為了不少娛樂視頻場景下的一個真實需求。

這項基于人工智能識別接吻的研究由出自Netflix高級數(shù)據(jù)科學家Amir Ziai之手——此時他正在斯坦福大學攻讀人工智能研究生學位。

Ziai在上世紀好萊塢電影中挑選了100部有代表性的作品,并為電影片段手動標注“親吻”或“非親吻”標簽,用靜態(tài)畫面和聲音片段來訓練深度學習算法,以實現(xiàn)對親吻場景的畫面和聲音的識別。

為了避免任何人得到錯誤的印象,目前還不能確定親吻識別算法能否用于***場景。Ziai說到,“在我的訓練集中,我盡量避免出現(xiàn)***場景,這樣就能確保我的模型不會混淆接吻和***?!?/p>

Ziai目前的雇主Netflix并沒有參與到斯坦福大學的這個項目上,但該項目在arXiv中有詳細記載;另外,即使Ziai還沒去調(diào)研這項研究在Netflix上的應用,但是不難想象,Netflix或其他公司(如YouTube,F(xiàn)acebook,Instagram和TikTok等處理大量流媒體或存儲視頻的公司)可能會對這一技術的商業(yè)應用場景感興趣。

該圖是1990年的電影《人鬼情未了》中Swayze和Demi Moore的經(jīng)典接吻橋段,數(shù)據(jù)科學家便是用了近百部類似的電影橋段來訓練AI模型識別親吻的行為。

感興趣的讀者可以閱讀論文原文,附上地址:

https://arxiv.org/pdf/1906.01843.pdf

“雙管齊下”:不僅視頻識別,還有kiss的音頻識別

應用于接吻場景視覺識別最成功的深度學習模型是ResNet-18,這是一種圖像分類算法,且該算法經(jīng)來自ImageNet數(shù)據(jù)庫超過一百萬張圖像的預訓練;而為了識別接吻場景的聲音,研究人員采用了名為VGGish的深度學習模型,通過每個以秒分段的場景的后960毫秒音頻訓練。這種雙管齊下對接吻的圖像和音頻同時處理的AI方法使得訓練出的模型獲得了驚人的F1分(算法精度和準度的加權平均值,度量模型的一種指標)——0.95。

ResNet-18模型結構圖

在模型結構中,采用"shortcut connection”方式,也就是上圖中的弧線來減少卷積網(wǎng)絡傳播過程中的計算和參數(shù)量,感興趣的讀者可以研究下,VGGish是是產(chǎn)生音頻數(shù)據(jù)集的工具,一般用于音頻分類。

github網(wǎng)址如下:

https://github.com/tensorflow/models/tree/master/research/audioset

不過在面對電影場景中一些棘手的片段或某些拍攝機視角時,該模型還是略顯吃力。例如,遠景或廣角的接吻鏡頭會使算法產(chǎn)生混淆,因為此類視頻片段中包含了太多背景畫面。此外,一些快節(jié)奏的視頻片段和不同時包含兩個演員的鏡頭對模型來講也都是極大的挑戰(zhàn)。

電影《Titanic》中Jack和Rose在郵輪甲板上擁吻圖片

深度學習是一個“黑盒子”,我們很難弄清楚深度學習模型實現(xiàn)預測時所使用的的具體數(shù)據(jù)模式。為了嘗試理解AI的邏輯,人們通常采用的一種方法是使用顯著地形圖來可視化分析過程中受到AI關注最多的數(shù)據(jù)。在好萊塢影片識別接吻場景的項目中,深度學習模型似乎更加關注與演員面部相關的圖像像素點。

Ziai表示,即使是在少量有限的實驗中也可以看出,人工智能更依賴視覺特征而不是音頻特征來識別接吻場景。他發(fā)現(xiàn)“精心挑選的數(shù)據(jù)集”對于訓練接吻檢測系統(tǒng)有很大幫助,這類數(shù)據(jù)可以讓該系統(tǒng)利用更多的上下文信息來檢測接吻,而不僅僅是通過靜態(tài)圖像。

AI“kiss”之原理

AI模型是如何習得這種能力呢?

和初吻尚在的人類學習基本親吻知識的途徑一樣,AI模型基于已經(jīng)成熟的深度學習算法,觀看各式各樣的好萊塢明星上演的浪漫擁吻片段,通過這種大量的訓練來識別影片中人物的面部表情和定位嘴唇,數(shù)據(jù)科學家說明了AI系統(tǒng)如何能夠更深入地了解最親密的人類活動的原理。

讓AI識別kiss有什么用?

早在2019年4月,谷歌宣布其智能手機Pixel已更新其Photobooth功能,這項功能可以在你面部表情發(fā)生變化的時候自動拍照,比如說微笑、親吻、嘟嘴、伸舌頭等等,該功能可是使智能手機從手機拍攝的視頻中識別出接吻畫面。

具體來說,當你按下Photobooth功能的拍攝按鍵之后,手機的AI就會自動分析你的臉部表情。根據(jù)不同狀態(tài),手機會自動判定「最佳時刻」,并將這一刻記錄下來。同樣,Ziai研發(fā)的應用端視頻接吻識別技術使我們看到了視頻內(nèi)容自動分類,用戶個性化視頻推薦,甚至視頻在線內(nèi)容審核的未來。

Pixel手機Photobooth功能拍攝的靜態(tài)圖片

OpenAI的策略和傳播主管Jack Clark在他的文章《Import AI newsletter》中重點強調(diào)了這項研究的意義:“現(xiàn)代計算機視覺技術已經(jīng)使得開發(fā)特定的'感知和響應類'軟件變得相當容易,諸如識別定性或非結構化的東西,識別電影中的接吻場景就是一個極佳的例子,但此類AI對個人軟件的應用能力明顯被低估?!?/p>

AI“kiss”之未來

好萊塢影片數(shù)據(jù)集和計算資源由斯坦福大學計算機科學助理教授Kayvon Fatahalian的實驗室提供。

目前,這個用100部好萊塢影片(如《安娜·卡列尼娜》(1935),《人鬼情未了》(1990)和《007:大戰(zhàn)皇家賭場》(2006)等)訓練的AI模型在面對更大規(guī)模的影片時性能尚不清楚。但Ziai表示,在經(jīng)超過80個影片進行訓練后,該模型只看到了“邊際改善”。

另一個值得關注的問題是這種AI模型在檢測來自社交媒體的不同類型接吻場景視頻時否能達到相似的準確度。這是個極大的挑戰(zhàn),可能需要模型對更多的視頻數(shù)據(jù)集進行額外訓練,而且訓練集中不能僅包含那些出現(xiàn)在電影銀幕上諸如Patrick Swayze和Demi Moore的好萊塢明星。盡管如此,從一些非常初步的測試中能看出,這種基于AI的接吻測技術會有很好的的應用前景。

“未來研究將盡量使用更多樣化的數(shù)據(jù)集,以確保模型不會對于某種類型的電影過擬合,”Ziai說道,“不過有趣的是,該模型在我所選的YouTube視頻上性能表現(xiàn)得相當好?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40627

    瀏覽量

    302290
  • 深度學習
    +關注

    關注

    73

    文章

    5602

    瀏覽量

    124567

原文標題:Netflix一位數(shù)據(jù)科學家剪出了上百部愛情片,想教AI認識“親吻” | 國際接吻日

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用NORDIC AI的好處

    ,時延更低,系統(tǒng)在網(wǎng)絡不穩(wěn)定甚至離線時能繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數(shù)據(jù)(如運動、生理信號等)可以留在本地,只上傳推理結果,有利于隱私與數(shù)據(jù)安全。 本地決策
    發(fā)表于 01-31 23:16

    語音識別IC分類,語音識別芯片的工作原理

    語音識別芯片,叫語音識別集成電路,是一種集聲音存儲、播放、錄音及語音識別功能于一體的專用芯片。語音識別IC的核心功能在于實現(xiàn)語音
    的頭像 發(fā)表于 01-14 15:22 ?340次閱讀
    語音<b class='flag-5'>識別</b>IC分類,語音<b class='flag-5'>識別</b>芯片的工作原理

    VS680 HDMI AI分析解決方案 #目標識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導體
    發(fā)布于 :2025年11月12日 10:29:33

    【飛凌OK-MX9596-C開發(fā)板試用】③云端AI拍照識別

    。 本篇基于此,開發(fā)云端AI拍照識別。 簡單來說,就是拍照,并調(diào)用云端AI工具,進行圖像文本識別,再將識別的文本的文本顯示出來。 這里的云端
    發(fā)表于 11-01 22:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    、步態(tài)識別和跌倒檢測等,可以通過檢測門的打開、關閉預防犯罪。 三、具身智能系統(tǒng)與芯片 具身智能匯集了跨學科領域的技術。是為一臺進行AI運算的計算機提供了有形或可見的形式,即機上感知
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    和靈感與諾貝爾獎和重大科學發(fā)現(xiàn) 科學發(fā)現(xiàn)中,直覺是重要的起點。是基于經(jīng)驗情感及知識的模式識別和類比能力,而不是基于邏輯和推理。 靈感通常是新的、有創(chuàng)意的想法或者突破性的思維,是突然的、意外的提示。 直覺
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    想到,除了研究大腦的抽象數(shù)學模型外,能否拋棄傳統(tǒng)的芯片實現(xiàn)方式,以化學物質和生物組件、材料及相關現(xiàn)象構建人工神經(jīng)網(wǎng)絡或提取其功能來用于AI處理,甚至直接用生物體實現(xiàn)AI功能,這就是
    發(fā)表于 09-06 19:12

    RK3576助力智慧安防:8路高清采集與AI識別

    在智慧城市和數(shù)字化園區(qū)的建設過程中,安防監(jiān)控系統(tǒng)正從“被動記錄”走向“主動識別與分析”。隨著AI算法的成熟和高清視頻處理能力的提升,市場對多路視頻采集、實時拼接、智能識別的需求日益增強。 米爾電子
    發(fā)表于 08-22 17:41

    工地要增加AI識別功能?高性能邊緣計算設備解決方案助力

    今年4月,廣州市住建局就發(fā)布了《廣州市住房和城鄉(xiāng)建設局關于房屋建筑工程領域考勤設備優(yōu)化升級的通知》,最新提出了要“增加AI識別功能模塊。為實現(xiàn)人員實名登記、實時考勤和自動監(jiān)測數(shù)據(jù)互相比對驗證”,自
    的頭像 發(fā)表于 08-05 10:18 ?1085次閱讀
    工地要增加<b class='flag-5'>AI</b><b class='flag-5'>識別</b>功能?高性能邊緣計算設備解決方案<b class='flag-5'>來</b>助力

    最新人工智能硬件培訓AI基礎入門學習課程參考2025版(離線AI語音視覺識別篇)

    視覺開發(fā)板開箱即用的離線AI能力,分類列出學習課程知識點和實操參考,希望能夠幫助大家快速掌握離線 AI 智能硬件的基礎知識與實戰(zhàn)技能,同時了解相關AI技術在實際場景的應用情況。正文按入下框架展開,相關理論和實操除了參考官方文檔,
    發(fā)表于 07-04 11:14

    端側OCR文字識別實現(xiàn) -- Core Vision Kit ##HarmonyOS SDK AI##

    獲取圖片url,把這個url和token再發(fā)給百度的ocr接口獲取識別數(shù)據(jù)……或者圖片轉base64以后把這個base64發(fā)給接口,然而鴻蒙這里,目前我不知道啥原因(可能是發(fā)送請求的數(shù)據(jù)長度有限
    發(fā)表于 06-30 18:07

    AI視覺識別收銀稱:水果生鮮店的“智能店員”

    在水果生鮮店中,采用AI視覺識別收銀稱不僅提升了顧客的購物體驗,為商家?guī)砹酥T多便利和效益。本文將詳細介紹這一技術的好處。一、提升收銀效率傳統(tǒng)的收銀方式需要人工逐一識別商品并進行稱重
    的頭像 發(fā)表于 06-07 10:19 ?866次閱讀
    <b class='flag-5'>AI</b>視覺<b class='flag-5'>識別</b>收銀稱:水果生鮮店的“智能店員”

    工地AI行為識別系統(tǒng)作用

    工地AI行為識別系統(tǒng)作用 工地AI行為識別系統(tǒng)是什么? 工地AI行為識別系統(tǒng)是一種基于人工智能技
    的頭像 發(fā)表于 05-08 12:00 ?1044次閱讀

    景區(qū)AI行為識別系統(tǒng)作用

    景區(qū)AI行為識別系統(tǒng)作用 景區(qū)AI行為識別系統(tǒng)是什么? 景區(qū)AI行為識別系統(tǒng)是利用人工智能技術(
    的頭像 發(fā)表于 05-07 15:32 ?1123次閱讀
    景區(qū)<b class='flag-5'>AI</b>行為<b class='flag-5'>識別</b>系統(tǒng)作用

    工廠園區(qū)AI行為識別系統(tǒng)作用

    工廠園區(qū)AI行為識別系統(tǒng)作用 工廠園區(qū)AI行為識別系統(tǒng)是什么? 工廠園區(qū)AI行為識別系統(tǒng)是基于人
    的頭像 發(fā)表于 05-06 17:49 ?953次閱讀