91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)成圖像!

CVer ? 來(lái)源:量子位 ? 2023-03-06 10:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“現(xiàn)在Stable Diffusion已經(jīng)能重建大腦視覺(jué)信號(hào)了!”

就在昨晚,一個(gè)聽(tīng)起來(lái)細(xì)思極恐的“AI讀腦術(shù)”研究,在網(wǎng)上掀起軒然大波:

5669e49c-bb5f-11ed-bfe3-dac502259ad0.png

這項(xiàng)研究聲稱,只需用fMRI(功能磁共振成像技術(shù),相比sMRI更關(guān)注功能性信息,如腦皮層激活情況等)掃描大腦特定部位獲取信號(hào),AI就能重建出我們看到的圖像!

58061578-bb5f-11ed-bfe3-dac502259ad0.png

例如這是一系列人眼看到的圖像,包括戴著蝴蝶結(jié)的小熊、飛機(jī)和白色鐘樓:

58365594-bb5f-11ed-bfe3-dac502259ad0.png

AI看了眼人腦信號(hào)后,立馬就給出這樣的結(jié)果,屬實(shí)把該抓的重點(diǎn)全都抓住了:

58ef8e38-bb5f-11ed-bfe3-dac502259ad0.gif

再發(fā)展一步,這不就約等于哈利波特里的讀心術(shù)了嗎??

5b13639c-bb5f-11ed-bfe3-dac502259ad0.png

更有網(wǎng)友感到驚嘆:如果說(shuō)ChatGPT開(kāi)放API是件大事,那這簡(jiǎn)直稱得上瘋狂。

5b5c7f82-bb5f-11ed-bfe3-dac502259ad0.png

所以,這究竟是怎么一回事?

用Stable Diffusion可視化人腦信號(hào)

這項(xiàng)研究來(lái)自日本大阪大學(xué),目前已經(jīng)被CVPR 2023收錄:

5b73ba26-bb5f-11ed-bfe3-dac502259ad0.png

High-resolution image reconstruction with latent diffusion models from human brain activity

研究希望能從人類大腦活動(dòng)中,重建高保真的真實(shí)感圖像,來(lái)理解大腦、并解讀計(jì)算機(jī)視覺(jué)模型和人類視覺(jué)系統(tǒng)之間的聯(lián)系。

要知道,此前雖然有不少腦機(jī)接口研究,致力于從人類大腦活動(dòng)中讀取并重建信號(hào),如意念打字等。

然而,從人類大腦活動(dòng)中重建視覺(jué)信號(hào)——具有真實(shí)感的圖像,仍然挑戰(zhàn)極大。

例如這是此前UC伯克利做過(guò)的一項(xiàng)類似研究,復(fù)現(xiàn)一張人眼看到的飛機(jī)片段,但計(jì)算機(jī)重建出來(lái)的圖像卻幾乎看不出飛機(jī)的特征:

5bde0c96-bb5f-11ed-bfe3-dac502259ad0.png

△圖源UC伯克利研究Reconstructing Visual Experiences from Brain Activity Evoked by Natural Movies

這次,研究人員重建信號(hào)選用的AI模型,是這一年多在圖像生成領(lǐng)域地位飛升的擴(kuò)散模型。

當(dāng)然,更準(zhǔn)確地說(shuō)是基于潛在擴(kuò)散模型(LDM)——Stable Diffusion。

整體研究的思路,則是基于Stable Diffusion,打造一種以人腦活動(dòng)信號(hào)為條件的去噪過(guò)程的可視化技術(shù)。

它不需要在復(fù)雜的深度學(xué)習(xí)模型上進(jìn)行訓(xùn)練或做精細(xì)的微調(diào),只需要做好fMRI(功能磁共振成像技術(shù))成像到Stable Diffusion中潛在表征的簡(jiǎn)單線性映射關(guān)系就行。

它的概覽框架是這樣的,看起來(lái)也非常簡(jiǎn)單:

僅由1個(gè)圖像編碼器、1個(gè)圖像解碼器,外加1個(gè)語(yǔ)義解碼器組成。

5c6acb86-bb5f-11ed-bfe3-dac502259ad0.png

具體怎么work?

如下圖所示,第一部分為本研究用到的LDM示意圖。

其中ε代表圖像編碼器,D代表圖像解碼器,而τ是一個(gè)文本編碼器(CLIP)。

5d81b124-bb5f-11ed-bfe3-dac502259ad0.png

重點(diǎn)是解碼分析,如下圖所示,模型依次從大腦早期(藍(lán)色)和較高(黃色)視覺(jué)皮層內(nèi)的fMRI信號(hào)中,解碼出重建圖像(z)和相關(guān)文本c的潛在表征。

然后將這些潛在表征當(dāng)作輸入,就可以得到模型最終復(fù)現(xiàn)出來(lái)的圖像Xzc。

5da3fd88-bb5f-11ed-bfe3-dac502259ad0.png

最后還沒(méi)有完,如編碼分析示意圖,作者還構(gòu)建了一個(gè)編碼模型,用來(lái)預(yù)測(cè)LDM不同組件(包括圖像z、文本c和zc)所對(duì)應(yīng)的fMRI信號(hào),它可以用來(lái)理解Stable Diffusion的內(nèi)部過(guò)程。

5dff944a-bb5f-11ed-bfe3-dac502259ad0.png

可以看到,采用了zc的編碼模型在大腦后部視覺(jué)皮層產(chǎn)生的預(yù)測(cè)精確度是最高的。(zc是與c進(jìn)行交叉注意的反向擴(kuò)散后,z再添加噪聲的潛在表征)

5e8b3586-bb5f-11ed-bfe3-dac502259ad0.png

相比其它兩者,它生成的圖像既具有高語(yǔ)義保真度,分辨率也很高。

5f3857d4-bb5f-11ed-bfe3-dac502259ad0.png

還有用GAN重建人臉圖像的

看完這項(xiàng)研究,已經(jīng)有網(wǎng)友想到了細(xì)思極恐的東西:

這個(gè)AI雖然只是復(fù)制了“眼睛”所看到的東西。

但是否會(huì)有一天,AI能直接從人腦的思維、甚至是記憶中重建出圖像或文字?

5f824506-bb5f-11ed-bfe3-dac502259ad0.png

“語(yǔ)言的用處不再存在了”

5fe2c048-bb5f-11ed-bfe3-dac502259ad0.png

于是有網(wǎng)友進(jìn)一步想到,如果能讀取記憶的話,那么目擊證人的證詞似乎也會(huì)變得更可靠了:

6010ead6-bb5f-11ed-bfe3-dac502259ad0.png

還別說(shuō),就在去年真有一項(xiàng)研究基于GAN,通過(guò)fMRI收集到的大腦信號(hào)重建看到的人臉圖像:

60299bb2-bb5f-11ed-bfe3-dac502259ad0.png

不過(guò),重建出來(lái)的效果似乎不怎么樣……

604c0dfa-bb5f-11ed-bfe3-dac502259ad0.png

顯然,在人臉這種比較精細(xì)的圖像生成上,AI“讀腦術(shù)”還有很長(zhǎng)一段路要走。

對(duì)于這種大腦信號(hào)重建的研究,也有網(wǎng)友提出了質(zhì)疑。

例如,是否只是AI從訓(xùn)練數(shù)據(jù)集中提取出了相似的數(shù)據(jù)?

6065a292-bb5f-11ed-bfe3-dac502259ad0.png

對(duì)此有網(wǎng)友回復(fù)表示,論文中的訓(xùn)練數(shù)據(jù)集和測(cè)試集是分開(kāi)的:

61890740-bb5f-11ed-bfe3-dac502259ad0.png

作者們也在項(xiàng)目主頁(yè)中表示,代碼很快會(huì)開(kāi)源。可以先期待一下~

6228f7b4-bb5f-11ed-bfe3-dac502259ad0.png

作者介紹

本研究?jī)H兩位作者。

一位是2021年才剛剛成為大阪大學(xué)助理教授的Yu Takagi,他主要從事計(jì)算神經(jīng)科學(xué)和人工智能的交叉研究。

最近,他同時(shí)在牛津大學(xué)人腦活動(dòng)中心和東京大學(xué)心理學(xué)系利用機(jī)器學(xué)習(xí)技術(shù),來(lái)研究復(fù)雜決策任務(wù)中的動(dòng)態(tài)計(jì)算。

另一位是大阪大學(xué)教授Shinji Nishimoto,他也是日本腦信息通信融合研究中心的首席研究員。

研究方向?yàn)槎坷斫獯竽X中的視覺(jué)和認(rèn)知處理,谷歌學(xué)術(shù)引用3000+次。

那么,你覺(jué)得這波AI重建圖像的效果如何?

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 成像技術(shù)
    +關(guān)注

    關(guān)注

    4

    文章

    309

    瀏覽量

    32226
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265395

原文標(biāo)題:CVPR 2023 | 大腦視覺(jué)信號(hào)被Stable Diffusion復(fù)現(xiàn)成圖像!"AI讀腦術(shù)"來(lái)了!

文章出處:【微信號(hào):CVer,微信公眾號(hào):CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像采集卡:機(jī)器視覺(jué)系統(tǒng)的“數(shù)據(jù)中樞”,解鎖精準(zhǔn)成像新可能

    信號(hào)轉(zhuǎn)換、數(shù)據(jù)傳輸、同步控制的核心使命,如同系統(tǒng)的“數(shù)據(jù)中樞”,直接決定了圖像采集的效率、精度與穩(wěn)定性,其重要性往往低估,卻貫穿了視覺(jué)應(yīng)用的全流程。
    的頭像 發(fā)表于 02-25 15:59 ?683次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器<b class='flag-5'>視覺(jué)</b>系統(tǒng)的“數(shù)據(jù)中樞”,解鎖精準(zhǔn)成像新可能

    從炫技到量產(chǎn),具身智能要突破哪些瓶頸?

    LingBot-VLA 開(kāi)源,具身智能的 Stable Diffusion 來(lái)了?
    的頭像 發(fā)表于 01-28 17:12 ?8962次閱讀
    從炫技到量產(chǎn),具身智能要突破哪些瓶頸?

    工業(yè)機(jī)器視覺(jué)中的關(guān)鍵組件:圖像采集卡選型與應(yīng)用

    在工業(yè)自動(dòng)化升級(jí)浪潮中,機(jī)器視覺(jué)系統(tǒng)作為“生產(chǎn)之眼”,承擔(dān)著產(chǎn)品質(zhì)檢、精確定位、尺寸測(cè)量等重要任務(wù),而圖像采集卡便是這套系統(tǒng)中不可或缺的關(guān)鍵組件。它不僅是連接工業(yè)相機(jī)與后端處理單元的信號(hào)樞紐,更直
    的頭像 發(fā)表于 01-19 16:02 ?213次閱讀
    工業(yè)機(jī)器<b class='flag-5'>視覺(jué)</b>中的關(guān)鍵組件:<b class='flag-5'>圖像</b>采集卡選型與應(yīng)用

    從模擬到AI集成:圖像采集卡的技術(shù)演進(jìn)與未來(lái)三大趨勢(shì)

    作為機(jī)器視覺(jué)系統(tǒng)連接物理視界與數(shù)字大腦的核心樞紐,圖像采集卡始終以“信號(hào)翻譯官”的身份,推動(dòng)著視覺(jué)信息處理技術(shù)的迭代升級(jí)。從早期簡(jiǎn)單的模擬
    的頭像 發(fā)表于 12-15 16:30 ?981次閱讀
    從模擬到AI集成:<b class='flag-5'>圖像</b>采集卡的技術(shù)演進(jìn)與未來(lái)三大趨勢(shì)

    本地部署Stable Diffusion實(shí)現(xiàn)AI文字生成高質(zhì)量矢量圖片應(yīng)用于電子商務(wù)

    本地部署Stable Diffusion
    的頭像 發(fā)表于 11-28 07:19 ?745次閱讀

    工業(yè)4.0的“數(shù)據(jù)橋梁”:圖像采集卡如何撐起智能制造的視覺(jué)核心

    工業(yè)4.0的本質(zhì)是數(shù)據(jù)驅(qū)動(dòng)的智能制造。在這個(gè)由物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能構(gòu)成的智慧工廠里,機(jī)器視覺(jué)系統(tǒng)扮演著“火眼金睛”的角色,而圖像采集卡,正是連接這雙“眼睛”與“大腦”(中央處理系統(tǒng))不可或缺
    的頭像 發(fā)表于 11-17 16:01 ?1068次閱讀
    工業(yè)4.0的“數(shù)據(jù)橋梁”:<b class='flag-5'>圖像</b>采集卡如何撐起智能制造的<b class='flag-5'>視覺(jué)</b>核心

    圖像采集卡:機(jī)器視覺(jué)時(shí)代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號(hào)到數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機(jī)器視覺(jué)系統(tǒng)的核心硬件組件,本質(zhì)是通過(guò)專用芯片(如FPGA、ASIC)實(shí)
    的頭像 發(fā)表于 11-12 15:15 ?629次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器<b class='flag-5'>視覺(jué)</b>時(shí)代的<b class='flag-5'>圖像</b>數(shù)據(jù)核心樞紐

    工業(yè)圖像采集卡:機(jī)器視覺(jué)的“信號(hào)中樞”

    一、定位:連接物理視界與數(shù)字大腦的重要樞紐在工業(yè)自動(dòng)化生產(chǎn)線的精密檢測(cè)工位上,當(dāng)高速相機(jī)捕捉到PCB板的微米級(jí)紋路時(shí),一個(gè)常被忽視卻至關(guān)重要的硬件正在完成關(guān)鍵轉(zhuǎn)換——工業(yè)圖像采集卡如同“信號(hào)翻譯官
    的頭像 發(fā)表于 11-06 15:09 ?320次閱讀
    工業(yè)<b class='flag-5'>圖像</b>采集卡:機(jī)器<b class='flag-5'>視覺(jué)</b>的“<b class='flag-5'>信號(hào)</b>中樞”

    圖像信號(hào)分析處理卡設(shè)計(jì)原理圖:536-基于FMC接口的XCZU7EV 通用PCIe卡 視覺(jué)處理卡 工業(yè)控制卡

    XCZU7EV 通用PCIe卡 , 圖像信號(hào)分析處理卡 , 視覺(jué)處理卡 , 工業(yè)控制卡 , 存儲(chǔ)擴(kuò)展卡
    的頭像 發(fā)表于 07-08 10:47 ?1265次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>信號(hào)</b>分析處理卡設(shè)計(jì)原理圖:536-基于FMC接口的XCZU7EV 通用PCIe卡 <b class='flag-5'>視覺(jué)</b>處理卡 工業(yè)控制卡

    是德N5173B信號(hào)發(fā)生器在EMC測(cè)試中的干擾信號(hào)精準(zhǔn)復(fù)現(xiàn)技巧

    具備寬頻段覆蓋、高精度調(diào)制和靈活的信號(hào)生成能力,成為EMC實(shí)驗(yàn)室中復(fù)現(xiàn)干擾信號(hào)的重要工具。掌握其使用技巧,可有效提升測(cè)試的精準(zhǔn)性和效率。 ? 二、干擾信號(hào)精準(zhǔn)
    的頭像 發(fā)表于 06-03 16:09 ?834次閱讀
    是德N5173B<b class='flag-5'>信號(hào)</b>發(fā)生器在EMC測(cè)試中的干擾<b class='flag-5'>信號(hào)</b>精準(zhǔn)<b class='flag-5'>復(fù)現(xiàn)</b>技巧

    工業(yè)相機(jī)圖像采集卡:機(jī)器視覺(jué)的核心樞紐

    工業(yè)相機(jī)圖像采集卡是用于連接工業(yè)相機(jī)與計(jì)算機(jī)的關(guān)鍵硬件設(shè)備,主要負(fù)責(zé)將相機(jī)輸出的圖像信號(hào)轉(zhuǎn)換為計(jì)算機(jī)可處理的數(shù)字信號(hào),并實(shí)現(xiàn)高速、穩(wěn)定的數(shù)據(jù)傳輸。它在工業(yè)自動(dòng)化、機(jī)器
    的頭像 發(fā)表于 05-21 12:13 ?857次閱讀
    工業(yè)相機(jī)<b class='flag-5'>圖像</b>采集卡:機(jī)器<b class='flag-5'>視覺(jué)</b>的核心樞紐

    基于LockAI視覺(jué)識(shí)別模塊:C++圖像的基本運(yùn)算

    圖像處理中,理解圖像的基本操作是掌握計(jì)算機(jī)視覺(jué)技術(shù)的關(guān)鍵。本文章將介紹基于LockAI視覺(jué)識(shí)別模塊下OpenCV中圖像的基本運(yùn)算方法,包括
    的頭像 發(fā)表于 05-06 16:20 ?712次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b>識(shí)別模塊:C++<b class='flag-5'>圖像</b>的基本運(yùn)算

    基于LockAI視覺(jué)識(shí)別模塊:C++圖像采集例程

    本文主要演示如何使用LockAI視覺(jué)識(shí)別模塊進(jìn)行視頻流的讀取,同時(shí)使用Edit模塊進(jìn)行圖像傳輸?;A(chǔ)知識(shí)講解1.1OpenCV簡(jiǎn)介OpenCV(OpenSourceComputerVisionLibra
    的頭像 發(fā)表于 04-30 18:23 ?755次閱讀
    基于LockAI<b class='flag-5'>視覺(jué)</b>識(shí)別模塊:C++<b class='flag-5'>圖像</b>采集例程

    ?Diffusion生成式動(dòng)作引擎技術(shù)解析

    Diffusion生成式動(dòng)作引擎 Diffusion生成式動(dòng)作引擎是一種基于擴(kuò)散模型(Diffusion Models)的生成式人工智能技術(shù),專注于生成連續(xù)、逼真的人類動(dòng)作或動(dòng)畫序列。這類引擎在游戲
    的頭像 發(fā)表于 03-17 15:14 ?3058次閱讀

    使用OpenVINO GenAI和LoRA適配器進(jìn)行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無(wú)奇的文本提示詞轉(zhuǎn)換為令人驚艷的視覺(jué)效果。
    的頭像 發(fā)表于 03-12 13:49 ?1884次閱讀
    使用OpenVINO GenAI和LoRA適配器進(jìn)行<b class='flag-5'>圖像</b>生成