論文の概要: LoDisc: Learning Global-Local Discriminative Features for
Self-Supervised Fine-Grained Visual Recognition
- arxiv url: http://arxiv.org/abs/2403.04066v1
- Date: Wed, 6 Mar 2024 21:36:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 15:54:21.230009
- Title: LoDisc: Learning Global-Local Discriminative Features for
Self-Supervised Fine-Grained Visual Recognition
- Title(参考訳): LoDisc: 自己監督型細粒度視覚認識のためのグローバルローカル識別特徴の学習
- Authors: Jialu Shi, Zhiqiang Wei, Jie Nie, Lei Huang
- Abstract要約: 本稿では,微妙な局所的きめ細かい特徴学習をグローバルな自己教師付きコントラスト学習に取り入れる。
局所的識別(LoDisc)と呼ばれる新しいプリテキストタスクは、局所的な中心領域に対する自己教師付きモデルの焦点を明示的に監督するために提案される。
そこで本稿では, 局所識別課題が重要な地域において, きめ細かな手掛かりを効果的に強化し, 画像のきめ細かな特徴表現をさらに洗練させることを実証する。
- 参考スコア(独自算出の注目度): 18.442966979622717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised contrastive learning strategy has attracted remarkable
attention due to its exceptional ability in representation learning. However,
current contrastive learning tends to learn global coarse-grained
representations of the image that benefit generic object recognition, whereas
such coarse-grained features are insufficient for fine-grained visual
recognition. In this paper, we present to incorporate the subtle local
fine-grained feature learning into global self-supervised contrastive learning
through a pure self-supervised global-local fine-grained contrastive learning
framework. Specifically, a novel pretext task called Local Discrimination
(LoDisc) is proposed to explicitly supervise self-supervised model's focus
towards local pivotal regions which are captured by a simple-but-effective
location-wise mask sampling strategy. We show that Local Discrimination pretext
task can effectively enhance fine-grained clues in important local regions, and
the global-local framework further refines the fine-grained feature
representations of images. Extensive experimental results on different
fine-grained object recognition tasks demonstrate that the proposed method can
lead to a decent improvement in different evaluation settings. Meanwhile, the
proposed method is also effective in general object recognition tasks.
- Abstract(参考訳): 自己教師付きコントラスト学習戦略は,表現学習の能力が異常であることから注目されている。
しかし、現在のコントラスト学習は、汎用物体認識に有効な画像の粗粒度をグローバルに学習する傾向にある一方、粗粒度の特徴は微粒度認識には不十分である。
本稿では,この微妙な局所的細粒度特徴学習を,純粋に自己教師付きグローバル局所細粒度コントラスト学習フレームワークを通じて,グローバル自己教師付きコントラスト学習に組み込む。
具体的には、局所識別(LoDisc)と呼ばれる新しいプリテキストタスクを提案し、単純だが効果的なマスクサンプリング戦略によって捕捉される局所的な枢軸領域への自己監督モデルの焦点を明示的に監督する。
そこで本稿では, 局所識別課題が重要な地域において, きめ細かな手掛かりを効果的に強化し, 画像のきめ細かな特徴表現をさらに洗練することを示す。
異なる粒度の物体認識タスクに対する実験結果から,提案手法が評価設定の精度の向上につながることが示された。
一方,提案手法は一般物体認識にも有効である。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Improving Weakly-Supervised Object Localization Using Adversarial Erasing and Pseudo Label [7.400926717561454]
本稿では,弱教師付きオブジェクトローカライゼーションの枠組みについて検討する。
それは、画像と画像レベルのクラスラベルのみを使用して、オブジェクトクラスとその位置を予測できるニューラルネットワークをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2024-04-15T06:02:09Z) - Adaptive Global-Local Representation Learning and Selection for
Cross-Domain Facial Expression Recognition [54.334773598942775]
ドメインシフトは、クロスドメイン顔表情認識(CD-FER)において重要な課題となる
適応的グローバルローカル表現学習・選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-20T02:21:41Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Modeling Multiple Views via Implicitly Preserving Global Consistency and
Local Complementarity [61.05259660910437]
複数の視点から表現を学習するために,グローバルな一貫性と相補性ネットワーク(CoCoNet)を提案する。
グローバルな段階では、重要な知識はビュー間で暗黙的に共有され、そのような知識を捕捉するためのエンコーダの強化は、学習された表現の識別性を向上させることができる。
最後に、局所的な段階において、横断的な識別的知識を結合する相補的要素を提案し、また、エンコーダが視点的識別性だけでなく、横断的な相補的情報も学習するように誘導する。
論文 参考訳(メタデータ) (2022-09-16T09:24:00Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Learning Consistency from High-quality Pseudo-labels for Weakly
Supervised Object Localization [7.602783618330373]
より一貫したローカライゼーションを学習するための2段階のアプローチを提案する。
まず,マスクを用いた擬似ラベル生成アルゴリズムを提案し,擬似教師付き学習手法を用いてオブジェクトの局所化ネットワークを初期化する。
第2段階では,分類識別に基づく疑似ラベルの信頼度を簡易かつ効果的に評価する手法を提案する。
論文 参考訳(メタデータ) (2022-03-18T09:05:51Z) - Spatially Consistent Representation Learning [12.120041613482558]
本研究では,空間的に一貫した表現学習アルゴリズム(SCRL)を提案する。
ランダムに切り抜かれた局所領域のコヒーレントな空間表現を作ろうとする新しい自己教師付き目的を考案する。
ベンチマークデータセットを用いた下流のローカライゼーションタスクでは、提案したSCRLは大幅な性能改善を示す。
論文 参考訳(メタデータ) (2021-03-10T15:23:45Z) - Visualization of Supervised and Self-Supervised Neural Networks via
Attribution Guided Factorization [87.96102461221415]
クラスごとの説明性を提供するアルゴリズムを開発した。
実験の広範なバッテリーでは、クラス固有の可視化のための手法の能力を実証する。
論文 参考訳(メタデータ) (2020-12-03T18:48:39Z) - Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation [28.721376937882958]
歩行認識は最も重要な生体計測技術の一つであり、多くの分野で応用されている。
近年の歩行認識フレームワークは、人間のグローバルな外観または地域から抽出された記述子によって各歩行フレームを表現している。
歩行認識のための識別的特徴表現を実現するための新しい特徴抽出・融合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T04:07:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。