論文の概要: Inter-Image Communication for Weakly Supervised Localization
- arxiv url: http://arxiv.org/abs/2008.05096v1
- Date: Wed, 12 Aug 2020 04:14:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 05:23:09.838016
- Title: Inter-Image Communication for Weakly Supervised Localization
- Title(参考訳): 弱教師付き局所化のための画像間通信
- Authors: Xiaolin Zhang, Yunchao Wei, Yi Yang
- Abstract要約: 弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
- 参考スコア(独自算出の注目度): 77.2171924626778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised localization aims at finding target object regions using
only image-level supervision. However, localization maps extracted from
classification networks are often not accurate due to the lack of fine
pixel-level supervision. In this paper, we propose to leverage pixel-level
similarities across different objects for learning more accurate object
locations in a complementary way. Particularly, two kinds of constraints are
proposed to prompt the consistency of object features within the same
categories. The first constraint is to learn the stochastic feature consistency
among discriminative pixels that are randomly sampled from different images
within a batch. The discriminative information embedded in one image can be
leveraged to benefit its counterpart with inter-image communication. The second
constraint is to learn the global consistency of object features throughout the
entire dataset. We learn a feature center for each category and realize the
global feature consistency by forcing the object features to approach
class-specific centers. The global centers are actively updated with the
training process. The two constraints can benefit each other to learn
consistent pixel-level features within the same categories, and finally improve
the quality of localization maps. We conduct extensive experiments on two
popular benchmarks, i.e., ILSVRC and CUB-200-2011. Our method achieves the
Top-1 localization error rate of 45.17% on the ILSVRC validation set,
surpassing the current state-of-the-art method by a large margin. The code is
available at https://github.com/xiaomengyc/I2C.
- Abstract(参考訳): 弱い教師付きローカライゼーションは、画像レベルの監督だけでターゲットのオブジェクト領域を見つけることを目的としている。
しかし,分類ネットワークから抽出したローカライゼーションマップは,微細な画素レベルの監督が欠如しているため,しばしば正確ではない。
本稿では,異なる物体間の画素レベルの類似性を利用して,より正確な物体位置を相補的に学習することを提案する。
特に、同じカテゴリ内のオブジェクト特徴の一貫性を促進するために、2種類の制約が提案されている。
最初の制約は、バッチ内で異なる画像からランダムにサンプリングされた識別画素間の確率的特徴一貫性を学ぶことである。
1つの画像に埋め込まれた識別情報は、画像間通信の利点を享受することができる。
2つめの制約は、データセット全体を通してオブジェクトの機能のグローバル一貫性を学ぶことである。
各カテゴリの特徴中心を学習し,クラス固有の中心にオブジェクトの特徴を強制することで,グローバルな特徴整合性を実現する。
グローバルセンターはトレーニングプロセスで積極的に更新されている。
この2つの制約は、同じカテゴリ内で一貫したピクセルレベルの特徴を学習し、最終的にローカライズマップの品質を改善するのに役立ちます。
ILSVRCとCUB-200-2011の2つの人気のあるベンチマークで広範な実験を行った。
本手法は,ilsvrc検証セット上でトップ1位置推定誤差率45.17%を達成し,現在の最先端手法を大差で上回った。
コードはhttps://github.com/xiaomengyc/i2cで入手できる。
関連論文リスト
- Keypoint-Augmented Self-Supervised Learning for Medical Image
Segmentation with Limited Annotation [21.203307064937142]
本稿では,短距離と長距離の両方の自己注意を保った表現を抽出するキーポイント拡張融合層を提案する。
特に,長距離空間の自己意識を学習する追加入力を組み込むことで,CNN機能マップを複数スケールで拡張する。
提案手法は,より堅牢な自己アテンションを生成することにより,既存のSSLメソッドよりも優れる。
論文 参考訳(メタデータ) (2023-10-02T22:31:30Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - VICRegL: Self-Supervised Learning of Local Visual Features [34.92750644059916]
本稿では,局所的な特徴とグローバルな特徴の学習における基本的なトレードオフについて考察する。
グローバルな特徴とローカルな特徴を同時に学習するVICRegLと呼ばれる新しい手法が提案されている。
線形分類とセグメンテーション伝達タスクにおいて高い性能を示す。
論文 参考訳(メタデータ) (2022-10-04T12:54:25Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。
本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-20T17:56:47Z) - Re-rank Coarse Classification with Local Region Enhanced Features for
Fine-Grained Image Recognition [22.83821575990778]
そこで我々は,Top1の精度を向上させるため,TopN分類結果を局所的に拡張した埋め込み機能を用いて再評価した。
より効果的なセマンティクスグローバル機能を学ぶために、我々は、自動構築された階層的カテゴリ構造上のマルチレベル損失をデザインする。
本手法は,cub-200-2011,stanford cars,fgvc aircraftの3つのベンチマークで最新性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T11:30:25Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。