91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Pixel3在相機(jī)算法的升級路上越戰(zhàn)越勇

電子工程師 ? 來源:lq ? 2018-12-03 10:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

想要提高拍照效果,想必對于多數(shù)手機(jī)廠商而言,給手機(jī)塞進(jìn)更多的攝像頭似乎成了當(dāng)前主流做法,例如“普通攝像頭+景深攝像頭”、“黑白+彩色攝像頭”、“廣角+長焦攝像頭”……不過,偏偏有這么一家企業(yè)反其道而行,從發(fā)布 Pixel 系列以來,就一直堅(jiān)持單攝像頭,并強(qiáng)調(diào)在相機(jī)成像算法上的提升。

不久前的一篇《勝過 iPhone XS?Google Pixel 的“夜視功能”是怎樣煉成的》文章中,我們介紹了 Google 新款手機(jī) Pixel3 系列的夜景拍攝功能(Night Sight)。果然,讀者們對于如何利用機(jī)器學(xué)習(xí)解決弱光條件下的拍攝難點(diǎn)持有很大興趣。近日,Google Pixel3 在相機(jī)算法的升級路上越戰(zhàn)越勇,對“人像模型”(Portrait Mode)拍攝功能進(jìn)行了大幅升級。相比上一代的 Pixel2,Pixel3 的人像模式可為用戶提供專業(yè)的外景圖像拍攝,并通過模糊背景來加強(qiáng)主體對象的清晰度。

去年,Google 團(tuán)隊(duì)描述了相位檢測自動(dòng)對焦(PDAF)的技術(shù),該技術(shù)使用了傳統(tǒng)的非學(xué)習(xí)立體算法,并通過單個(gè)攝像頭計(jì)算景深。如今,在最新推出的 Pixel 上,Google 將采用機(jī)器學(xué)習(xí)改進(jìn)景深捕捉,以獲取更好的人像效果。

如上圖所示,上一代的人像模式主要通過神經(jīng)網(wǎng)絡(luò)決定人與背景成像像素,并使用從 PDAF 導(dǎo)出的景深信息來增強(qiáng)這兩層人物的分割掩碼(segmentationmask)。這意味著能夠?qū)崿F(xiàn)相應(yīng)的背景虛化效果,更接近于專業(yè)相機(jī)的效果。

PDAF 通過捕捉場景的兩個(gè)略微不同的視角進(jìn)行工作,如下圖所示。在兩個(gè)視角之間翻轉(zhuǎn),我們看到人是靜止的,而背景是水平移動(dòng)的,這種效果成為視差(parallax)。因?yàn)橐暡钍屈c(diǎn)距相機(jī)的距離與兩個(gè)視點(diǎn)之間距離的函數(shù),我們可以通過將一個(gè)視角中的每個(gè)點(diǎn)與另一個(gè)視角中的對應(yīng)點(diǎn)進(jìn)行匹配來估計(jì)景深。

圖注:左、中的兩個(gè) PDAF 圖像看起來非常相似,但在右圖中,可以看到它們之間的視差

不過,通過立體算法在 PDAF 中找到這些對應(yīng)關(guān)系極具挑戰(zhàn)性,因?yàn)閳鼍爸械狞c(diǎn)幾乎不在視圖之間移動(dòng)。此外,所有的立體聲技術(shù)都存在孔徑問題(Aperture Problem)。也就是說,機(jī)器通過小光圈觀察場景,無法找到與立體基線平行的線的對應(yīng)關(guān)系,即連接兩個(gè)攝像頭的線。換言之,當(dāng)觀察上圖中的水平線(或縱向拍攝的垂直線)時(shí),一個(gè)視角相對于另一個(gè)視角的任意可能的位移都看起來大致相同。結(jié)果,在上一代的人像模式中,以上提到的所有因素都有可能導(dǎo)致景深捕捉錯(cuò)誤,產(chǎn)生令人不快的虛假圖像。

如何改善景深捕捉?

Pixel3 采用的人像模式,通過利用立體算法產(chǎn)生的視差來修復(fù)這些誤差。例如,遠(yuǎn)離焦距平面的點(diǎn)看起來不如較近的點(diǎn)那么清晰銳利,利用了“背景離焦”模式。此外,即使在平面屏幕上觀看圖像,也能通過物體的大致大小準(zhǔn)確判斷物體有多遠(yuǎn),利用了“語義”模式。

如果構(gòu)建一種能將以上不同的模式組合起來的算法是非常困難的,但我們可以通過機(jī)器學(xué)習(xí)進(jìn)行構(gòu)建,并更好地利用 PDAF 的“視差”。具體來講,訓(xùn)練一個(gè)用 TensorFlow 編寫的卷積神經(jīng)網(wǎng)絡(luò),可以將 PDAF 作為輸入并進(jìn)行景深預(yù)測。這種新式改進(jìn)的基于機(jī)器學(xué)習(xí)的景深捕捉方法被應(yīng)用在了 Pixel3 的人像模式中。

圖注:CNN 將 PDAF 圖像作為輸入,并輸出景深圖像。該網(wǎng)絡(luò)使用“編碼-解碼”架構(gòu)

如何訓(xùn)練神經(jīng)網(wǎng)絡(luò)?

為了訓(xùn)練網(wǎng)絡(luò),開發(fā)人員需要大量的 PDFA 圖像和對應(yīng)的高質(zhì)量景深圖,并且保證訓(xùn)練數(shù)據(jù)與用戶使用智能手機(jī)拍攝的照片內(nèi)容類似。為了實(shí)現(xiàn)這一目標(biāo),我們構(gòu)建了自己的定制“Frankenphone”裝備,其中包括五臺 Pixel3 手機(jī),以及基于 WiFi 的解決方案,使其能夠同時(shí)捕捉來自所有手機(jī)的圖片(在~2 毫秒的容差范圍內(nèi))。通過這個(gè)設(shè)備,我們使用來自運(yùn)動(dòng)和多視圖立體的結(jié)構(gòu)從照片計(jì)算出高質(zhì)量的景深。

圖注:左:用于收集訓(xùn)練數(shù)據(jù)的自定義裝備;中:一個(gè)捕獲五個(gè)圖像翻轉(zhuǎn)的示例;右:真實(shí)景深,低保真點(diǎn)

該裝備收集的數(shù)據(jù)適用于訓(xùn)練網(wǎng)絡(luò),主要基于以下五點(diǎn)因素:

五個(gè)視點(diǎn)確保在多個(gè)方向上存在視差,因此不存在孔徑問題;

攝像頭的位置要確保圖像中的某一點(diǎn)在至少一張圖像中是可見的,并一一對應(yīng);

基線,即相機(jī)之間的距離要比 PDAF 的基線大得多,從而產(chǎn)生更準(zhǔn)確的景深捕捉;

攝像頭同步確??梢杂?jì)算上述動(dòng)態(tài)場景的景深;

該裝備具有便捷性,確??刹蹲揭巴庹掌?a href="http://m.makelele.cn/analog/" target="_blank">模擬用戶使用智能手機(jī)拍攝的情況。

然而,即使從該裝備捕獲的數(shù)據(jù)是理想狀態(tài),預(yù)測場景中物體的絕對深度仍然極具挑戰(zhàn)性,因?yàn)槿Q于鏡頭特性、焦距等因素,給定的 PDAF 對可以對應(yīng)一系列不同的景深圖像。為了解釋這一點(diǎn),我們改為捕捉場景中物體的相對景深,這足以產(chǎn)生令人滿意的人像模式結(jié)果。

值得一提的是,這個(gè)基于機(jī)器學(xué)習(xí)模式的景深捕捉模型目前主要應(yīng)用于 Pixel3 手機(jī)上。此外,通過使用 TensorFlow Lite 用于在移動(dòng)和嵌入式設(shè)備上運(yùn)行機(jī)器學(xué)習(xí)模型的跨平臺解決方案,可以將得到的景深信息與分割掩碼神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合。

看到這里,不知道習(xí)慣了使用 iOS 系統(tǒng)手機(jī)的你,是不是正蠢蠢欲動(dòng)回歸在性能、價(jià)位日益提升的 Android 手機(jī)呢?

據(jù)最新消息稱,Google 決定開放自己的相機(jī)算法授權(quán)給其他 Android 品牌使用,此前 Google 就開源了 Pixel2 系列的相機(jī)虛化算法。歡迎留言。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107756
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    5091

    瀏覽量

    103114
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    271

    瀏覽量

    13144

原文標(biāo)題:三攝正普及,四攝在路上?谷歌逆天AI算法,只做單攝虛化

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Google Pixel 10上“聽診”藍(lán)牙信道?開源安卓應(yīng)用實(shí)測揭秘

    的應(yīng)用開發(fā)工具箱注入精準(zhǔn)距離估算能力。開發(fā)者首次能夠通過Nordic Semiconductor的開源應(yīng)用,搭載nRF54L系列設(shè)備的Pixel 10智能手機(jī)上評估并運(yùn)用藍(lán)牙信道探測技術(shù)。 本次更新
    發(fā)表于 11-30 21:09

    nordic NRF54藍(lán)牙設(shè)備Google Pixel 10上“聽診”藍(lán)牙信道示例

    說明如何使用 nRF Connect SDK 中的藍(lán)牙信道探測反射器示例程序(運(yùn)行于 nRF54L15 SoC),配合搭載 Android 16 系統(tǒng)藍(lán)牙信道探測發(fā)起器及算法實(shí)現(xiàn)的 Google Pixel
    發(fā)表于 11-26 17:44

    如何在Google Pixel 10智能手機(jī)上評估信道探測功能

    今年早些時(shí)候發(fā)布的Android 16系統(tǒng)首次引入了支持藍(lán)牙信道探測的公共API,實(shí)現(xiàn)了智能手機(jī)的精準(zhǔn)測距功能。然而直到近期,市面上仍未出現(xiàn)支持藍(lán)牙6.0及信道探測技術(shù)的手機(jī)硬件。這一局面2025
    的頭像 發(fā)表于 11-25 16:10 ?2363次閱讀
    如何在<b class='flag-5'>Google</b> <b class='flag-5'>Pixel</b> 10智能手機(jī)上評估信道探測功能

    當(dāng)樂鑫科技ESP32-S3遇到攝像頭,秒變AI相機(jī)

    跨越算法到硬件的鴻溝,啟明云端不斷憑借完整的AI硬件解決方案幫助各個(gè)企業(yè)實(shí)現(xiàn)了AI創(chuàng)意落地。這次“AI夢想實(shí)現(xiàn)家”又抓住了誰的靈感讓它成真了?AI與相機(jī)的碰撞能擦出怎樣的火花?這款新版AI相機(jī)給出
    的頭像 發(fā)表于 10-21 18:05 ?541次閱讀
    當(dāng)樂鑫科技ESP32-S<b class='flag-5'>3</b>遇到攝像頭,秒變AI<b class='flag-5'>相機(jī)</b>

    廣電計(jì)量與河南威達(dá)成戰(zhàn)略合作

    近日,廣電計(jì)量與河南威特種設(shè)備有限公司(以下簡稱“河南威”)舉行戰(zhàn)略合作簽約儀式。雙方將圍繞無人機(jī)培訓(xùn)、無人機(jī)應(yīng)用等領(lǐng)域深入合作,攜手推動(dòng)無人機(jī)技術(shù)低空產(chǎn)業(yè)的廣泛應(yīng)用與發(fā)展。
    的頭像 發(fā)表于 09-20 16:26 ?1442次閱讀

    【awinic inside】艾為芯助力Google Pixel10系列:點(diǎn)亮影像與顯示的全新境界

    北京時(shí)間8月21日,Google正式揭開了新一年硬件產(chǎn)品線的全新篇章,發(fā)布了備受矚目的Pixel10系列智能手機(jī)。Pixel10搭載TensorG5芯片,改采用臺積電3納米制程。整體而
    的頭像 發(fā)表于 08-28 18:43 ?746次閱讀
    【awinic inside】艾為芯助力<b class='flag-5'>Google</b> <b class='flag-5'>Pixel</b>10系列:點(diǎn)亮影像與顯示的全新境界

    Zivid3D相機(jī)安裝使用教程

    Zivid3D相機(jī)小巧便攜,重量輕,分辨率高,速度快,適合高反光透明物體。本文介紹Zivid 3D相機(jī)的操作流程,幫助用戶掌握其功能。從硬件連接、軟件安裝到參數(shù)設(shè)置,重點(diǎn)涵蓋點(diǎn)云生成、
    的頭像 發(fā)表于 08-26 15:34 ?655次閱讀
    Zivid<b class='flag-5'>3</b>D<b class='flag-5'>相機(jī)</b>安裝使用教程

    3D工業(yè)相機(jī)價(jià)格是?這種3D工業(yè)相機(jī)性價(jià)比最高

    3D 工業(yè)相機(jī)市場,一場價(jià)格與質(zhì)量的博弈已然展開。企業(yè)選擇時(shí)面臨著艱難困境,國際品牌筑起高高的價(jià)格壁壘,國產(chǎn)品牌又深陷低價(jià)低質(zhì)的怪圈。我們該如何為打破這一局面?
    的頭像 發(fā)表于 07-29 11:25 ?1065次閱讀
    <b class='flag-5'>3</b>D工業(yè)<b class='flag-5'>相機(jī)</b>價(jià)格是?這種<b class='flag-5'>3</b>D工業(yè)<b class='flag-5'>相機(jī)</b>性價(jià)比最高

    Google Fast Pair服務(wù)簡介

    Elliptic Curve Diffie–Hellman key Exchange算法改良后生成的)。 關(guān)于initial pairing和Subsequent pairingSPEC中的原文和翻譯如下
    發(fā)表于 06-29 19:28

    shimetapi:開源RGB+EVS視覺融合相機(jī)事件相機(jī)工具鏈與算法

    事件相機(jī)的原始數(shù)據(jù)流,執(zhí)行高級的計(jì)算機(jī)視覺算法,以提升數(shù)據(jù)質(zhì)量、提取有用信息或進(jìn)行三維理解。 包含的模塊: 降噪 (Denoise): 去除事件流中的噪聲,提高信號質(zhì)量。 插值 (Inter
    的頭像 發(fā)表于 06-26 13:52 ?690次閱讀

    2025年3D工業(yè)相機(jī)選型及推薦

    3D工業(yè)相機(jī)的選型
    的頭像 發(fā)表于 05-21 16:49 ?1763次閱讀
    2025年<b class='flag-5'>3</b>D工業(yè)<b class='flag-5'>相機(jī)</b>選型及推薦

    相機(jī)模組膠水檢測

    相機(jī)
    海伯森技術(shù)
    發(fā)布于 :2025年05月19日 15:07:45

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進(jìn)的圖像生成模型 Imagen 3。該模型最初僅對付費(fèi)用戶開放,不久后也將面向免費(fèi)用戶推出。
    的頭像 發(fā)表于 05-14 16:53 ?1262次閱讀

    工業(yè)相機(jī)焊縫跟蹤中的關(guān)鍵作用有哪些

    工業(yè)相機(jī)焊縫跟蹤系統(tǒng)中,扮演了捕捉、處理與反饋焊縫位置信息的核心角色,通過高速、高分辨率的圖像采集,并結(jié)合智能算法的實(shí)時(shí)圖像處理,成為焊縫跟蹤系統(tǒng)中的“眼睛”,能夠復(fù)雜焊接環(huán)境下實(shí)
    的頭像 發(fā)表于 05-13 17:56 ?726次閱讀
    工業(yè)<b class='flag-5'>相機(jī)</b><b class='flag-5'>在</b>焊縫跟蹤中的關(guān)鍵作用有哪些

    濱松光子的相機(jī)研發(fā)史:ORCA系列與qCMOS的誕生(下)

    ? 自1971年,濱松光子開始研發(fā)相機(jī)以來(追溯1971,濱松光子的相機(jī)研發(fā)史(上)),濱松光子的世界里,時(shí)間就像是一條長長的路,而他們研發(fā)的相機(jī),就像是
    的頭像 發(fā)表于 03-17 06:23 ?811次閱讀
    濱松光子的<b class='flag-5'>相機(jī)</b>研發(fā)史:ORCA系列與qCMOS的誕生(下)