論文の概要: Self-supervising Fine-grained Region Similarities for Large-scale Image
Localization
- arxiv url: http://arxiv.org/abs/2006.03926v2
- Date: Thu, 9 Jul 2020 06:21:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 21:51:03.341697
- Title: Self-supervising Fine-grained Region Similarities for Large-scale Image
Localization
- Title(参考訳): 大規模像定位のための自己監督型きめ細かい領域類似性
- Authors: Yixiao Ge, Haibo Wang, Feng Zhu, Rui Zhao, Hongsheng Li
- Abstract要約: 一般のベンチマークでは、画像と画像の類似性を学ぶためのノイズの多いGPSラベルしか提供されていない。
本稿では,画像と領域の類似性を自己監督し,その部分領域とともに,困難な正のイメージの可能性について検討する。
提案する自己強調画像-領域類似性ラベルは,最先端パイプラインのトレーニングボトルネックを効果的に処理する。
- 参考スコア(独自算出の注目度): 43.1611420685653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of large-scale retrieval-based image localization is to estimate the
geographical location of a query image by recognizing its nearest reference
images from a city-scale dataset. However, the general public benchmarks only
provide noisy GPS labels associated with the training images, which act as weak
supervisions for learning image-to-image similarities. Such label noise
prevents deep neural networks from learning discriminative features for
accurate localization. To tackle this challenge, we propose to self-supervise
image-to-region similarities in order to fully explore the potential of
difficult positive images alongside their sub-regions. The estimated
image-to-region similarities can serve as extra training supervision for
improving the network in generations, which could in turn gradually refine the
fine-grained similarities to achieve optimal performance. Our proposed
self-enhanced image-to-region similarity labels effectively deal with the
training bottleneck in the state-of-the-art pipelines without any additional
parameters or manual annotations in both training and inference. Our method
outperforms state-of-the-arts on the standard localization benchmarks by
noticeable margins and shows excellent generalization capability on multiple
image retrieval datasets.
- Abstract(参考訳): 大規模検索ベース画像ローカライゼーションの課題は、都市規模のデータセットから最も近い参照画像を認識してクエリ画像の地理的位置を推定することである。
しかし、一般のベンチマークではトレーニング画像に関連するノイズの多いGPSラベルのみを提供しており、画像と画像の類似性を学ぶための弱い監督役として機能している。
このようなラベルノイズは、ディープニューラルネットワークが正確なローカライゼーションのために識別的特徴を学習することを妨げる。
そこで本研究では,画像と領域の類似性を自己監視し,それらのサブ領域と並行して,困難でポジティブな画像の可能性を十分に探究することを提案する。
推定された画像と地域間の類似性は、ネットワークを世代ごとに改善するための追加のトレーニング監督となり、結果として、最適な性能を達成するために徐々に細かな類似性を洗練することができる。
提案する自己強調画像から領域への類似性ラベルは,トレーニングと推論の両方において,追加パラメータや手動アノテーションを必要とせず,最先端パイプラインのトレーニングボトルネックを効果的に処理する。
本手法は,標準ローカライズベンチマークの最先端を目立ったマージンで上回り,複数の画像検索データセットにおいて優れた一般化能力を示す。
関連論文リスト
- Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Mitigating Urban-Rural Disparities in Contrastive Representation Learning with Satellite Imagery [19.93324644519412]
土地被覆の特徴の特定における都市と農村の格差のリスクを考察する。
本稿では,畳み込みニューラルネットワークモデルの多レベル潜在空間を非バイアス化する手法として,コントラッシブラーニングを用いた高密度表現(FairDCL)を提案する。
得られた画像表現は、下流の都市と農村の予測格差を軽減し、現実の衛星画像の最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-11-16T04:59:46Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Local contrastive loss with pseudo-label based self-training for
semi-supervised medical image segmentation [13.996217500923413]
セミ/セルフ教師付き学習ベースのアプローチは、注釈付きデータとともにラベル付きデータを悪用する。
近年の自己教師付き学習法では, コントラッシブ・ロスを用いて, ラベルのない画像から優れたグローバルレベル表現を学習している。
セグメンテーションに有用な画素レベルの特徴を,セマンティックラベル情報を利用して学習するために,局所的なコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-12-17T17:38:56Z) - Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。
その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文 参考訳(メタデータ) (2021-08-20T14:02:38Z) - Spatially Consistent Representation Learning [12.120041613482558]
本研究では,空間的に一貫した表現学習アルゴリズム(SCRL)を提案する。
ランダムに切り抜かれた局所領域のコヒーレントな空間表現を作ろうとする新しい自己教師付き目的を考案する。
ベンチマークデータセットを用いた下流のローカライゼーションタスクでは、提案したSCRLは大幅な性能改善を示す。
論文 参考訳(メタデータ) (2021-03-10T15:23:45Z) - Re-rank Coarse Classification with Local Region Enhanced Features for
Fine-Grained Image Recognition [22.83821575990778]
そこで我々は,Top1の精度を向上させるため,TopN分類結果を局所的に拡張した埋め込み機能を用いて再評価した。
より効果的なセマンティクスグローバル機能を学ぶために、我々は、自動構築された階層的カテゴリ構造上のマルチレベル損失をデザインする。
本手法は,cub-200-2011,stanford cars,fgvc aircraftの3つのベンチマークで最新性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T11:30:25Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。