av基地免费在线观看,heyzo在线国产高清a,亚洲欧美日本理论片

7月6日，這可能是一年中最適合親吻的日子——國際接吻日（International Kissing Day）。

這個節(jié)日最早起源于英國。1991年這個節(jié)日得到了聯(lián)合國的承認，也希望讓更多人知道，親吻的美好，這也是人類表達愛意最自然的一種方式。

那么，人工智能可以通過訓練了解親吻嗎？

來自Netflix的一位高級數(shù)據(jù)科學家就對“kiss”鏡頭情有獨鐘，并且通過上百部電影接吻情節(jié)的定位，成功訓練出了可以準確識別電影親吻橋段的AI模型——模型的獨創(chuàng)性在于可以區(qū)別親吻與性行為。

大千世界，無所不能，AI也能檢測到"kiss"？

讓AI區(qū)別kiss和sex

作為愛情片的代表情節(jié)，“親吻”一直是很多觀眾最愛反復觀看的鏡頭。不管是《人鬼情未了》中Swayze和Demi Moore的經(jīng)典接吻橋段，還是《泰坦尼克號》中Rose和Jack的臨別一吻，都造就了經(jīng)典中的經(jīng)典。

而在電影觀看過程中，尋找kiss鏡頭，就成為了不少娛樂視頻場景下的一個真實需求。

這項基于人工智能識別接吻的研究由出自Netflix高級數(shù)據(jù)科學家Amir Ziai之手——此時他正在斯坦福大學攻讀人工智能研究生學位。

Ziai在上世紀好萊塢電影中挑選了100部有代表性的作品，并為電影片段手動標注“親吻”或“非親吻”標簽，用靜態(tài)畫面和聲音片段來訓練深度學習算法，以實現(xiàn)對親吻場景的畫面和聲音的識別。

為了避免任何人得到錯誤的印象，目前還不能確定親吻識別算法能否用于***場景。Ziai說到，“在我的訓練集中，我盡量避免出現(xiàn)***場景，這樣就能確保我的模型不會混淆接吻和***?！?/p>

Ziai目前的雇主Netflix并沒有參與到斯坦福大學的這個項目上，但該項目在arXiv中有詳細記載；另外，即使Ziai還沒去調(diào)研這項研究在Netflix上的應用，但是不難想象，Netflix或其他公司（如YouTube，F(xiàn)acebook，Instagram和TikTok等處理大量流媒體或存儲視頻的公司）可能會對這一技術的商業(yè)應用場景感興趣。

該圖是1990年的電影《人鬼情未了》中Swayze和Demi Moore的經(jīng)典接吻橋段，數(shù)據(jù)科學家便是用了近百部類似的電影橋段來訓練AI模型識別親吻的行為。

感興趣的讀者可以閱讀論文原文，附上地址：

https://arxiv.org/pdf/1906.01843.pdf

“雙管齊下”：不僅視頻識別，還有kiss的音頻識別

應用于接吻場景視覺識別最成功的深度學習模型是ResNet-18，這是一種圖像分類算法，且該算法經(jīng)來自ImageNet數(shù)據(jù)庫超過一百萬張圖像的預訓練；而為了識別接吻場景的聲音，研究人員采用了名為VGGish的深度學習模型，通過每個以秒分段的場景的后960毫秒音頻訓練。這種雙管齊下對接吻的圖像和音頻同時處理的AI方法使得訓練出的模型獲得了驚人的F1分（算法精度和準度的加權平均值，度量模型的一種指標）——0.95。

ResNet-18模型結構圖

在模型結構中，采用"shortcut connection”方式，也就是上圖中的弧線來減少卷積網(wǎng)絡傳播過程中的計算和參數(shù)量，感興趣的讀者可以研究下，VGGish是是產(chǎn)生音頻數(shù)據(jù)集的工具,一般用于音頻分類。

github網(wǎng)址如下：

https://github.com/tensorflow/models/tree/master/research/audioset

不過在面對電影場景中一些棘手的片段或某些拍攝機視角時，該模型還是略顯吃力。例如，遠景或廣角的接吻鏡頭會使算法產(chǎn)生混淆，因為此類視頻片段中包含了太多背景畫面。此外，一些快節(jié)奏的視頻片段和不同時包含兩個演員的鏡頭對模型來講也都是極大的挑戰(zhàn)。

電影《Titanic》中Jack和Rose在郵輪甲板上擁吻圖片

深度學習是一個“黑盒子”，我們很難弄清楚深度學習模型實現(xiàn)預測時所使用的的具體數(shù)據(jù)模式。為了嘗試理解AI的邏輯，人們通常采用的一種方法是使用顯著地形圖來可視化分析過程中受到AI關注最多的數(shù)據(jù)。在好萊塢影片識別接吻場景的項目中，深度學習模型似乎更加關注與演員面部相關的圖像像素點。

Ziai表示，即使是在少量有限的實驗中也可以看出，人工智能更依賴視覺特征而不是音頻特征來識別接吻場景。他發(fā)現(xiàn)“精心挑選的數(shù)據(jù)集”對于訓練接吻檢測系統(tǒng)有很大幫助，這類數(shù)據(jù)可以讓該系統(tǒng)利用更多的上下文信息來檢測接吻，而不僅僅是通過靜態(tài)圖像。

AI“kiss”之原理

AI模型是如何習得這種能力呢？

和初吻尚在的人類學習基本親吻知識的途徑一樣，AI模型基于已經(jīng)成熟的深度學習算法，觀看各式各樣的好萊塢明星上演的浪漫擁吻片段，通過這種大量的訓練來識別影片中人物的面部表情和定位嘴唇，數(shù)據(jù)科學家說明了AI系統(tǒng)如何能夠更深入地了解最親密的人類活動的原理。

讓AI識別kiss有什么用？

早在2019年4月，谷歌宣布其智能手機 Pixel已更新其Photobooth功能，這項功能可以在你面部表情發(fā)生變化的時候自動拍照，比如說微笑、親吻、嘟嘴、伸舌頭等等，該功能可是使智能手機從手機拍攝的視頻中識別出接吻畫面。

具體來說，當你按下Photobooth功能的拍攝按鍵之后，手機的AI就會自動分析你的臉部表情。根據(jù)不同狀態(tài)，手機會自動判定「最佳時刻」，并將這一刻記錄下來。同樣，Ziai研發(fā)的應用端視頻接吻識別技術使我們看到了視頻內(nèi)容自動分類，用戶個性化視頻推薦，甚至視頻在線內(nèi)容審核的未來。

Pixel手機Photobooth功能拍攝的靜態(tài)圖片

OpenAI的策略和傳播主管Jack Clark在他的文章《Import AI newsletter》中重點強調(diào)了這項研究的意義：“現(xiàn)代計算機視覺技術已經(jīng)使得開發(fā)特定的'感知和響應類'軟件變得相當容易，諸如識別定性或非結構化的東西，識別電影中的接吻場景就是一個極佳的例子，但此類AI對個人軟件的應用能力明顯被低估?！?/p>

AI“kiss”之未來

好萊塢影片數(shù)據(jù)集和計算資源由斯坦福大學計算機科學助理教授Kayvon Fatahalian的實驗室提供。

目前，這個用100部好萊塢影片（如《安娜·卡列尼娜》（1935），《人鬼情未了》（1990）和《007：大戰(zhàn)皇家賭場》（2006）等）訓練的AI模型在面對更大規(guī)模的影片時性能尚不清楚。但Ziai表示，在經(jīng)超過80個影片進行訓練后，該模型只看到了“邊際改善”。

另一個值得關注的問題是這種AI模型在檢測來自社交媒體的不同類型接吻場景視頻時否能達到相似的準確度。這是個極大的挑戰(zhàn)，可能需要模型對更多的視頻數(shù)據(jù)集進行額外訓練，而且訓練集中不能僅包含那些出現(xiàn)在電影銀幕上諸如Patrick Swayze和Demi Moore的好萊塢明星。盡管如此，從一些非常初步的測試中能看出，這種基于AI的接吻測技術會有很好的的應用前景。

“未來研究將盡量使用更多樣化的數(shù)據(jù)集，以確保模型不會對于某種類型的電影過擬合，”Ziai說道，“不過有趣的是，該模型在我所選的YouTube視頻上性能表現(xiàn)得相當好?！?/p>

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴