91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌教你用"注意力"提升產(chǎn)品體驗(yàn)

CVer ? 來源:新智元 ? 2023-06-27 14:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導(dǎo)讀】讓用戶在體驗(yàn)過程中關(guān)注主要部分,得先抓住用戶的眼球。

人每時(shí)每刻都在接收海量的信息,例如每秒進(jìn)入視網(wǎng)膜的數(shù)據(jù)量就達(dá)到了10的10次方比特,但人類會(huì)選擇性地關(guān)注一些任務(wù)相關(guān)或感興趣的區(qū)域以進(jìn)一步處理,比如記憶、理解和采取行動(dòng)等。

如何將人類的注意力進(jìn)行建模,即顯著性模型(saliency model)在神經(jīng)科學(xué)、心理學(xué)、人機(jī)交互(HCI)和計(jì)算機(jī)視覺等領(lǐng)域開始得到廣泛關(guān)注。

預(yù)測(cè)「哪些區(qū)域可能吸引注意力」的能力在圖形、攝影、圖像壓縮和處理以及視覺質(zhì)量測(cè)量等領(lǐng)域具有許多重要應(yīng)用。

不過,使用機(jī)器學(xué)習(xí)和基于智能手機(jī)的凝視估計(jì)來加速眼動(dòng)研究需要專門的硬件,每臺(tái)成本高達(dá)三萬美元,并不具備廣泛推廣的條件。

最近,谷歌的研究人員介紹了兩篇相關(guān)領(lǐng)域的研究論文,分別發(fā)表在CVPR 2022和CVPR 2023上,主要研究了如何利用「人類注意力的預(yù)測(cè)模型」來實(shí)現(xiàn)更好的用戶體驗(yàn),例如用圖像編輯操作以最大限度地減少視覺混亂、分心或偽影等問題,使用圖像壓縮來更快地加載網(wǎng)頁或應(yīng)用程序,并引導(dǎo)機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)更直觀的類人解釋和模型性能。

這兩篇論文主要關(guān)注圖像編輯和圖像壓縮,并討論了在具體應(yīng)用場(chǎng)景下,對(duì)注意力建模的相關(guān)最新進(jìn)展。

注意力引導(dǎo)的圖像編輯

對(duì)人體注意力進(jìn)行建模,通常需要把眼睛看到的圖像作為輸入,如自然圖像或網(wǎng)頁的屏幕截圖等,并將預(yù)測(cè)的熱力圖作為輸出。

預(yù)測(cè)得到的熱力圖會(huì)根據(jù)「眼球跟蹤器」或「鼠標(biāo)懸停/點(diǎn)擊」等收集到的實(shí)時(shí)注意力近似值進(jìn)行評(píng)估。

之前的模型大多利用手工制作的視覺線索特征,如顏色/亮度對(duì)比度、邊緣和形狀等,最近也有一些方法轉(zhuǎn)向基于深度神經(jīng)網(wǎng)絡(luò)來自動(dòng)學(xué)習(xí)判別特征,使用的模型包括卷積、遞歸神經(jīng)網(wǎng)絡(luò)以及視覺Transformer網(wǎng)絡(luò)等。

谷歌在CVPR2022上發(fā)表的一篇論文中,利用深度顯著性模型(deep saliency models)進(jìn)行視覺逼真的編輯(visually realistic edits),可以顯著改變觀察者對(duì)不同圖像區(qū)域的注意力。

c4709a24-14a8-11ee-962d-dac502259ad0.png

論文鏈接:https://openaccess.thecvf.com/content/CVPR2022/papers/Aberman_Deep_Saliency_Prior_for_Reducing_Visual_Distraction_CVPR_2022_paper.pdf

比如移除背景中分散注意力的物體可以降低照片中的雜亂程度,從而提高用戶滿意度;同樣,在視頻會(huì)議中,減少背景中的混亂度也可以增加對(duì)主要發(fā)言者的關(guān)注度。

為了探索哪些類型的編輯效果是可實(shí)現(xiàn)的,以及這些效果如何影響觀眾的注意力,研究人員開發(fā)了一個(gè)優(yōu)化框架,以用于使用可區(qū)分的預(yù)測(cè)顯著性模型來引導(dǎo)圖像中的視覺注意力。

c49b203c-14a8-11ee-962d-dac502259ad0.png

給定輸入圖像和表示干擾物區(qū)域的二元遮罩,使用顯著性預(yù)測(cè)模型對(duì)遮罩內(nèi)的像素提供指導(dǎo)并編輯圖像,降低遮罩區(qū)域內(nèi)的顯著性。

為了確保編輯后的圖像自然且逼真,研究人員精心選擇了四種圖像編輯操作符,其中包括兩個(gè)標(biāo)準(zhǔn)圖像編輯操作(即重新著色和圖像扭曲);以及及兩個(gè)可學(xué)習(xí)的操作符,即多層卷積濾波器和生成模型(GAN)。

利用這些操作符,該框架可以產(chǎn)生各種強(qiáng)大的效果,包括重新著色、修復(fù)、偽裝、對(duì)象編輯、插入以及面部屬性編輯,并且所有這些效果都是由單個(gè)預(yù)訓(xùn)練的顯著性模型驅(qū)動(dòng)的,沒有任何額外的監(jiān)督或訓(xùn)練。

c4a70bf4-14a8-11ee-962d-dac502259ad0.png

減少視覺干擾的例子,由顯著性模型與幾個(gè)操作符引導(dǎo),干擾物區(qū)域被標(biāo)記在顯著性圖(紅色邊框)的頂部

需要注意的是,研究人員的目標(biāo)不是與產(chǎn)生每種效果的專用方法競(jìng)爭(zhēng),只是演示如何通過嵌入在深度顯著性模型中的知識(shí)來指導(dǎo)多個(gè)編輯操作。

個(gè)性化的顯著性建模

之前的研究假定單個(gè)顯著性模型即可完成對(duì)全部人群的預(yù)測(cè)任務(wù),不過人類的注意力在個(gè)體之間是不同的:雖然對(duì)顯著線索的檢測(cè)是一致的,但具體的順序、解釋和注視分布可以有很大的區(qū)別,這一問題也提供了為個(gè)人或團(tuán)體創(chuàng)建個(gè)性化用戶體驗(yàn)的機(jī)會(huì)。

在CVPR2023的一篇論文中,谷歌的研究人員引入了一個(gè)用戶感知的顯著性模型,也是首個(gè)僅用單模型就可以完成預(yù)測(cè)某個(gè)用戶、一組用戶和通用人群注意力的框架。

c4bc6b5c-14a8-11ee-962d-dac502259ad0.png

論文鏈接:https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_Learning_From_Unique_Perspectives_User-Aware_Saliency_Modeling_CVPR_2023_paper.pdf

該框架的核心是將每個(gè)參與者的視覺偏好與每個(gè)用戶的注意力熱力圖和自適應(yīng)用戶遮罩進(jìn)行組合,需要每個(gè)用戶的注意力標(biāo)注在訓(xùn)練過程中都是可用的,可用的數(shù)據(jù)集包括用于自然圖像的OSIE移動(dòng)的凝視數(shù)據(jù)集、網(wǎng)頁的FiWI和WebSaliency數(shù)據(jù)集。

c4e4ee1a-14a8-11ee-962d-dac502259ad0.png

該模型并沒有預(yù)測(cè)表示所有用戶的注意力的單個(gè)顯著性熱力圖,而是預(yù)測(cè)每個(gè)用戶的注意力圖以編碼個(gè)體的注意力模式。

此外,該模型采用用戶掩碼(大小等于參與者數(shù)量的二進(jìn)制向量)來指示當(dāng)前樣本中參與者的存在,使得模型可以選擇一組參與者,并將偏好組合成單個(gè)熱力圖。

c517e1ee-14a8-11ee-962d-dac502259ad0.png

預(yù)測(cè)注意力與GT值,EML-Net是最先進(jìn)模型的預(yù)測(cè),對(duì)于兩個(gè)參與者/組具有相同的預(yù)測(cè);Ours提出的用戶感知顯著性模型的預(yù)測(cè),可以正確預(yù)測(cè)每個(gè)參與者/組的獨(dú)特偏好。第一個(gè)圖像來自O(shè)SIE圖像集,第二個(gè)圖像來自FiWI。

以顯著特征為中心的漸進(jìn)式圖像解碼

除了圖像編輯,人類注意力模型也可以改善用戶的瀏覽體驗(yàn)。

在上網(wǎng)時(shí),最讓人感到不舒服的用戶體驗(yàn)之一就是等待加載帶有圖像的網(wǎng)頁,特別是在網(wǎng)速很慢的情況下,一種改善用戶體驗(yàn)的方式是圖像的漸進(jìn)式解碼,可以隨著數(shù)據(jù)逐漸下載再解碼,并顯示越來越高分辨率的圖像,直到全分辨率圖像準(zhǔn)備就緒。

漸進(jìn)式解碼通常按順序進(jìn)行(例如,從左到右、從上到下),使用預(yù)測(cè)注意力模型,就可以基于顯著性對(duì)圖像進(jìn)行解碼,從而可以首先發(fā)送顯示最顯著區(qū)域的細(xì)節(jié)所需的數(shù)據(jù)。

例如,在肖像中,用于面部的字節(jié)可以優(yōu)先于用于失焦背景的字節(jié),因此用戶更早地感知到更好的圖像質(zhì)量,并體驗(yàn)到顯著減少的等待時(shí)間。

基于這個(gè)想法,預(yù)測(cè)注意力模型可以幫助圖像壓縮和更快地加載具有圖像的網(wǎng)頁,改善大型圖像和流媒體/VR應(yīng)用的渲染。

結(jié)論

上面兩篇論文展示了人類注意力的預(yù)測(cè)模型如何通過具體的應(yīng)用場(chǎng)景實(shí)現(xiàn)令人愉快的用戶體驗(yàn),例如圖像編輯操作,可以減少用戶圖像或照片中的混亂、分心或偽影,以及漸進(jìn)式圖像解碼,可以大大減少用戶在圖像完全渲染時(shí)的感知等待時(shí)間。

文中提出的用戶感知顯著性模型可以進(jìn)一步為個(gè)人用戶或群體個(gè)性化上述應(yīng)用程序,從而實(shí)現(xiàn)更豐富、更獨(dú)特的體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111608
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4839

    瀏覽量

    107950
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42365

原文標(biāo)題:CVPR 2023 | 谷歌教你用"注意力"提升產(chǎn)品體驗(yàn)

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從"替代人力"到"智能協(xié)同":履帶式巡檢機(jī)器人的產(chǎn)業(yè)躍遷

    2026年的工業(yè)智能化轉(zhuǎn)型浪潮中,一個(gè)顯著的趨勢(shì)正在形成——工業(yè)巡檢機(jī)器人正從單純的"人力替代工具"升級(jí)為具備感知、決策與協(xié)同能力的"智能體"。
    的頭像 發(fā)表于 02-05 10:42 ?302次閱讀

    選EtherCAT模塊,別只看價(jià)格,先看"體檢報(bào)告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運(yùn)動(dòng),而是DPort-ECT模塊的出廠"必修課"。本文詳解工業(yè)級(jí)EtherCAT從站如何通過嚴(yán)苛測(cè)試關(guān)
    的頭像 發(fā)表于 02-04 11:46 ?313次閱讀
    選EtherCAT模塊,別只看價(jià)格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報(bào)告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    機(jī)械臂越復(fù)雜越&amp;amp;quot;卡頓&amp;amp;quot;?別讓控制器拖了后腿

    工業(yè)機(jī)器人動(dòng)作越復(fù)雜,傳統(tǒng)控制器越&quot;卡頓&quot;?ZMC900E4核A55跑Linux算軌跡,3核R5F硬件級(jí)專管EtherCAT通信,實(shí)現(xiàn)±1.5μs微秒級(jí)抖動(dòng),破解高算
    的頭像 發(fā)表于 02-02 11:40 ?624次閱讀
    機(jī)械臂越復(fù)雜越&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;卡頓&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?別讓控制器拖了后腿

    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&amp;amp;quot;隱形守護(hù)者&amp;amp;quot;?

    當(dāng)長(zhǎng)安汽車與北汽極狐拿到中國(guó)首批L3級(jí)自動(dòng)駕駛準(zhǔn)入許可的那一刻,整個(gè)產(chǎn)業(yè)鏈等待多年的&quot;靴子&quot;終于落地。在這個(gè)責(zé)任主體從駕駛員轉(zhuǎn)向車企的關(guān)鍵轉(zhuǎn)折下,系統(tǒng)可靠性成為真正的&quot
    的頭像 發(fā)表于 01-04 12:03 ?587次閱讀
    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護(hù)者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    Vishay Vitramon Touch &amp;quot;N&amp;quot; Tune? MLCC套件技術(shù)分析

    Vishay / Vitramon Touch &quot;N&quot; Tune? 套件是專為RF工程師設(shè)計(jì)的專用套件,用于利用高頻多層陶瓷電容器 (MLCC) 進(jìn)行電路調(diào)諧。電容器可臨時(shí)接觸
    的頭像 發(fā)表于 11-09 17:46 ?1497次閱讀

    &amp;quot;Access violation&amp;quot; 錯(cuò)誤,復(fù)位位置,重新打印

    &quot;Access violation&quot; 錯(cuò)誤
    的頭像 發(fā)表于 11-08 07:16 ?592次閱讀

    光耦合器:電子世界的 &amp;quot;光橋梁&amp;quot;

    在現(xiàn)代電子設(shè)備的復(fù)雜電路中,信號(hào)的傳輸與隔離至關(guān)重要。就像城市交通中需要橋梁來跨越障礙、連接不同區(qū)域一樣,電子電路里也需要一座 &quot;橋梁&quot; 來實(shí)現(xiàn)信號(hào)的安全、高效傳輸,同時(shí)避免
    的頭像 發(fā)表于 08-22 16:58 ?1062次閱讀

    精密設(shè)備的&amp;amp;quot;電力保鏢&amp;amp;quot;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    一、用戶痛點(diǎn):精密設(shè)備的&quot;斷電恐懼癥&quot;在數(shù)據(jù)中心、醫(yī)療實(shí)驗(yàn)室、工業(yè)控制等場(chǎng)景中,精密電子設(shè)備對(duì)電源的依賴已達(dá)到&quot;零容忍&quot;級(jí)別:數(shù)據(jù)安全危機(jī):服務(wù)
    的頭像 發(fā)表于 07-25 09:00 ?929次閱讀
    精密設(shè)備的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力保鏢&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    Modbus RTU通訊協(xié)議:瑞銀電能表的&amp;quot;普通話&amp;quot;指南

    Modbus RTU協(xié)議就像工業(yè)設(shè)備間的&quot;普通話&quot;,讓不同品牌的電能表、傳感器等設(shè)備能夠順暢&quot;交流&quot;。
    的頭像 發(fā)表于 07-18 18:30 ?1931次閱讀
    Modbus RTU通訊協(xié)議:瑞銀電能表的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;普通話&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;指南

    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在&quot;雙碳&quot;目標(biāo)驅(qū)動(dòng)下,地?zé)岚l(fā)電作為穩(wěn)定基荷電源,其電網(wǎng)接入設(shè)備的可靠性至關(guān)重要。環(huán)網(wǎng)柜作為地?zé)犭娬九c主網(wǎng)連接的關(guān)鍵節(jié)點(diǎn),其內(nèi)部絕緣缺陷可能引發(fā)
    的頭像 發(fā)表于 07-16 10:15 ?607次閱讀
    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測(cè)設(shè)備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    在導(dǎo)航技術(shù)領(lǐng)域,GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))和INS(慣性導(dǎo)航系統(tǒng))的結(jié)合,一直被業(yè)界譽(yù)為&quot;黃金搭檔&quot;。它們優(yōu)勢(shì)互補(bǔ),克服了單一系統(tǒng)的局限性,為高精度、高可靠性的導(dǎo)航提供了完美
    的頭像 發(fā)表于 07-09 17:12 ?1019次閱讀
    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的&amp;quot;千面需求&amp;quot;

    核心洞察:標(biāo)準(zhǔn)化機(jī)器人難以破解工業(yè)場(chǎng)景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構(gòu)+零代碼中樞&quot;?,為?人形機(jī)器人為什么要定制?提供了
    的頭像 發(fā)表于 06-10 17:19 ?1343次閱讀
    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場(chǎng)景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉儲(chǔ)界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    實(shí)戰(zhàn)案例,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān),倉儲(chǔ)界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?814次閱讀
    倉儲(chǔ)界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的&amp;amp;quot;黑科技&amp;amp;quot;

    運(yùn)行的命脈。而在這場(chǎng)與時(shí)間的賽跑中,電纜局部放電在線監(jiān)測(cè)技術(shù)正扮演著&quot;安全衛(wèi)士&quot;的角色,科技力量將隱患扼殺于萌芽狀態(tài)。一、看不見的&quot;定時(shí)炸彈&
    的頭像 發(fā)表于 04-14 18:12 ?1013次閱讀
    電纜局部放電在線監(jiān)測(cè):守護(hù)電網(wǎng)安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監(jiān)測(cè):為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽診器

    文章由山東華科信息技術(shù)有限公司提供在城市的地下脈絡(luò)中,隧道管廊承載著電網(wǎng)的&quot;主動(dòng)脈&quot;,而變壓器堪稱其中的&quot;動(dòng)力心臟&quot;。這個(gè)封閉而潮濕的環(huán)境中,變
    的頭像 發(fā)表于 04-09 16:37 ?916次閱讀
    隧道管廊變壓器局放在線監(jiān)測(cè):為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上智能聽診器