五月欧美综合第一页,黄片A级片毛片A级黄色片,国产一区二区三区四在线视频看看

四個月前，谷歌在Kaggle發(fā)布了一項地標檢索挑戰(zhàn)賽，在這場比賽中，參賽者會得到一些圖像，他們需要在所有圖像數(shù)據(jù)集中找到含有給定圖像中地標的圖片。

圖像檢索是計算機視覺領(lǐng)域的基礎(chǔ)問題，對于包含地標的圖像更是非常重要，因為這是用戶拍攝的熱門對象。本次挑戰(zhàn)賽的數(shù)據(jù)集是世界最大的圖像檢索數(shù)據(jù)集，其中有超過一百萬張圖像，覆蓋了全球1.5萬個不同景點。

同時，這項挑戰(zhàn)賽也是CVPR 2018的地標辨認研討會的一部分。下面就是本次競賽排名第一的解決方案，參賽隊伍是由anokas帶領(lǐng)的團隊，論智對其進行了編譯。

解決方案包括兩個主要元素：

首先，創(chuàng)建一個高性能的全局描述符（global descriptor），它可以將數(shù)據(jù)庫中的圖像用奇異向量表示；

然后，創(chuàng)建一個高效的框架，能將這些向量和最可能的圖片聯(lián)系起來，最后提交到積分榜上。

下面是總體框架的流程圖，其中每一步應用后都有對應的LB分數(shù)。

注：下文中所有分數(shù)都以百分數(shù)表示，即62.5%=0.625

方案詳細講解

全局描述符（Global Descriptors）

我們的方案中最主要的部分就是幾個全局描述符，這些向量描述了圖片的全部內(nèi)容。我們從兩個預訓練的CNN模型開始（ResNet和ResNeXt），并用四種目前最先進的集結(jié)方法（aggregation methods）生成全局描述符。下面是四種集結(jié)方法各自的細節(jié)以及它們“原始”的表現(xiàn)性能（也就是沒有進行檢索詞擴展和數(shù)據(jù)庫擴展）：

基于區(qū)域熵的多層抽象池化（REMAP）[42.8% mAP]：我們之前設(shè)計的一個全局描述符聚合了不同CNN層的深度特征，之后經(jīng)過訓練可以表示多個水平的可視化抽象對象。我們將在之后的CVPR研討會上進一步展示REMAP的細節(jié)架構(gòu)。

最大卷積激活值（MAC）[32.9% mAP]：MAC描述符將每個CNN的最后一層卷積過濾的最大局部回應進行編碼。在它的架構(gòu)中，ResNeXt的最后一個卷積層后面有一個最大池化層、L2-正則化層和PCA+白化層。

卷積的池化和（SPoC）[31.7% mAP]：在SPoC這一過程中，ResNeXt的最后一個卷積層后接池化和層、L2-正則化層和PCA+白化層。

卷積的區(qū)域最大激活值（RMAC）[34.7% mAP]：在RMAC中，ResNeXt最后的卷積特征是在多個規(guī)模重疊區(qū)域中進行的最大池化。這些區(qū)域同樣是基于有L2-正則化層和PCA+白化層的描述符。最后把所有描述符匯總到一個單一的描述符中。

基礎(chǔ)的CNN網(wǎng)絡(luò)（ResNet和ResNeXt）是在ImageNet上進行的訓練，之后再一個地標數(shù)據(jù)集的子集中進行調(diào)整。該子集來自Babenko等人的研究成果，其中包括大約12萬張圖片和650個著名景點。

這一數(shù)據(jù)集中的圖像最初是在圖片搜索引擎中用文字搜到的，沒有經(jīng)過檢驗，所以其中可能含有很多不相關(guān)的圖片，這需要我們過濾掉。刪除圖片的過程是半自動的，利用帶有密集SIFT特征的Hessian-affine檢測器以及RVD-W描述符進行聚合。處理完圖像后，還剩下25000張左右的圖片，都屬于一種地標，我們想用它對模型進行調(diào)整。

我們沒有用其他類似競賽中的數(shù)據(jù)集作為訓練數(shù)據(jù)，因為我們想看看在新的數(shù)據(jù)集下，我們的方案生成的效果如何。

合并描述符

通過用上述方法訓練的六個全局描述符合并，就得到了最終的全局描述符（括號中的是LB分數(shù)）：

ResNeXt+REMAP（42.8%）

ResNeXt+RMAC（34.7%）

ResNeXt+MAC（32.9%）

ResNeXt+SPoC（31.7%）

ResNet+REMAP（35.8%）

ResNet+MAC（30.4%）

接著我們將每個描述符縮放到固定的L2 norm上，為每個描述符分配權(quán)重，按以下方式連接描述符：

XG = [2× ResNeXt+REMAP; 1.5× ResNeXt+RMAC; 1.5× ResNeXt+MAC; 1.5× ResNeXt+SPoC; ResNet+MAC; ResNet+REMAP]

權(quán)重的選擇是點對點的，以反映每種方法相應的性能。之后，我們用PCA將描述符的維度降到4K，同時應用白化，讓所有維度的方差相同。雖然PCA和白化只能改善一小部分，但是它將查詢擴展的結(jié)果提升了幾個百分點。