論文の概要: ASOC: Adaptive Self-aware Object Co-localization
- arxiv url: http://arxiv.org/abs/2201.11547v1
- Date: Thu, 27 Jan 2022 14:38:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 18:03:21.475504
- Title: ASOC: Adaptive Self-aware Object Co-localization
- Title(参考訳): asoc:適応型自己認識オブジェクトのコローカライズ
- Authors: Koteswar Rao Jerripothula, Prerana Mukherjee
- Abstract要約: 本論文の主な目的は,オブジェクトを意味論的に類似した画像群に共同でローカライズすることである。
既存の作品の多くは本質的に弱い監督を受けており、近隣のイメージの弱いスーパービジョンに大きく依存している。
本稿では,この問題を緩和するために,自己認識現象と組み合わせる。
- 参考スコア(独自算出の注目度): 11.709606641185438
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The primary goal of this paper is to localize objects in a group of
semantically similar images jointly, also known as the object co-localization
problem. Most related existing works are essentially weakly-supervised, relying
prominently on the neighboring images' weak-supervision. Although weak
supervision is beneficial, it is not entirely reliable, for the results are
quite sensitive to the neighboring images considered. In this paper, we combine
it with a self-awareness phenomenon to mitigate this issue. By self-awareness
here, we refer to the solution derived from the image itself in the form of
saliency cue, which can also be unreliable if applied alone. Nevertheless,
combining these two paradigms together can lead to a better co-localization
ability. Specifically, we introduce a dynamic mediator that adaptively strikes
a proper balance between the two static solutions to provide an optimal
solution. Therefore, we call this method \textit{ASOC}: Adaptive Self-aware
Object Co-localization. We perform exhaustive experiments on several benchmark
datasets and validate that weak-supervision supplemented with self-awareness
has superior performance outperforming several compared competing methods.
- Abstract(参考訳): 本論文の主な目的は,オブジェクトの局所化問題(コローカライズ問題)として,意味論的に類似した画像群を共同で対象にローカライズすることである。
既存の作品の多くは本質的に弱い監督を受けており、近隣のイメージの弱いスーパービジョンに大きく依存している。
弱い監督は有益であるが、完全に信頼できないため、結果は近隣の画像に非常に敏感である。
本稿では,この問題を軽減するために,自己認識現象と組み合わせる。
ここでは、自己認識によって、画像自体から得られる解を、サラエンシー・キュー(saliency cue)という形で参照する。
しかし、これらの2つのパラダイムを組み合わせることで、より優れたコローカライゼーション能力が得られる。
具体的には,2つの静的解の間に適切なバランスをとる動的メディエータを導入し,最適解を提供する。
したがって、このメソッドを \textit{asoc}:adaptive self-aware object co-localizationと呼ぶ。
我々は,いくつかのベンチマークデータセットで徹底的な実験を行い,自己認識で補う弱いスーパービジョンが,比較比較手法よりも優れた性能を示すことを確認した。
関連論文リスト
- Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - Counterfactual Reasoning for Multi-Label Image Classification via Patching-Based Training [84.95281245784348]
共起関係の過度な強調は、モデルの過度な問題を引き起こす可能性がある。
本稿では,対象対象物とその共起対象物による相関特性を媒介者とみなすことができることを示す因果推論フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T13:13:24Z) - Self-attention fusion for audiovisual emotion recognition with
incomplete data [103.70855797025689]
視覚的感情認識を応用したマルチモーダルデータ解析の問題点を考察する。
本稿では、生データから学習可能なアーキテクチャを提案し、その3つの変種を異なるモダリティ融合機構で記述する。
論文 参考訳(メタデータ) (2022-01-26T18:04:29Z) - PixMatch: Unsupervised Domain Adaptation via Pixelwise Consistency
Training [4.336877104987131]
教師なしドメイン適応はセマンティックセグメンテーションの有望なテクニックである。
対象領域整合性訓練の概念に基づく非監視領域適応のための新しいフレームワークを提案する。
私たちのアプローチはシンプルで、実装が簡単で、トレーニング時にメモリ効率が向上します。
論文 参考訳(メタデータ) (2021-05-17T19:36:28Z) - The Single-Noun Prior for Image Clustering [34.97652735163338]
近年,自己教師付きクラスタリング手法は精度の向上を図っているが,教師付き分類法のようには機能していない。
先述の"single-noun"は、セマンティッククラスタは、人間が単一名詞でラベル付けする概念に対応する傾向がある、と述べている。
本稿では,施設配置問題の特別な場合として,この最適化タスクを大規模に解くための簡単な手法を提案する。
論文 参考訳(メタデータ) (2021-04-08T17:54:37Z) - Learning from Self-Discrepancy via Multiple Co-teaching for Cross-Domain
Person Re-Identification [12.106894735305714]
ドメイン適応者再IDのための複数コティーチングフレームワークを提案する。
本手法は最先端技術と比較して競争力が向上する。
論文 参考訳(メタデータ) (2021-04-06T03:12:11Z) - Relation-aware Instance Refinement for Weakly Supervised Visual
Grounding [44.33411132188231]
visual groundingは、ビジュアルオブジェクトとその言語エンティティ間の対応を構築することを目的としている。
本稿では,オブジェクトの細粒化とエンティティ関係モデリングを組み込んだ,新しい弱教師付き学習手法を提案する。
2つの公開ベンチマークの実験は、我々のフレームワークの有効性を実証している。
論文 参考訳(メタデータ) (2021-03-24T05:03:54Z) - Weakly supervised cross-domain alignment with optimal transport [102.8572398001639]
画像オブジェクトとテキストシーケンス間のクロスドメインアライメントは多くの視覚言語タスクの鍵となる。
本稿では,画像とテキスト間の微粒な意味的類似点の同定と最適化のための新しいアプローチについて検討する。
論文 参考訳(メタデータ) (2020-08-14T22:48:36Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z) - iFAN: Image-Instance Full Alignment Networks for Adaptive Object
Detection [48.83883375118966]
iFANは、イメージレベルとインスタンスレベルの両方で、機能の分散を正確に調整することを目的としている。
ソースのみのベースライン上で10%以上のAPで、最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2020-03-09T13:27:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。