論文の概要: Self-Classification Enhancement and Correction for Weakly Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2505.16294v1
- Date: Thu, 22 May 2025 06:45:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.094644
- Title: Self-Classification Enhancement and Correction for Weakly Supervised Object Detection
- Title(参考訳): 弱い修正対象検出のための自己分類の強化と補正
- Authors: Yufei Yin, Lechao Cheng, Wengang Zhou, Jiajun Deng, Zhou Yu, Houqiang Li,
- Abstract要約: 弱い監督対象検出(WSOD)は、ラベル付けコストの低いため、多くの注目を集めている。
本稿では,この2つの問題を改善するための新しいWSODフレームワークを紹介する。
まず,2つの異なるMCCタスク間のギャップを埋めるために,クラス内バイナリ分類(ICBC)を統合した自己分類拡張モジュールを提案する。
また,2つのMCCタスクの結果を組み合わせて,誤分類予測を効果的に削減する自己分類補正アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 113.51483527300496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, weakly supervised object detection (WSOD) has attracted much attention due to its low labeling cost. The success of recent WSOD models is often ascribed to the two-stage multi-class classification (MCC) task, i.e., multiple instance learning and online classification refinement. Despite achieving non-trivial progresses, these methods overlook potential classification ambiguities between these two MCC tasks and fail to leverage their unique strengths. In this work, we introduce a novel WSOD framework to ameliorate these two issues. For one thing, we propose a self-classification enhancement module that integrates intra-class binary classification (ICBC) to bridge the gap between the two distinct MCC tasks. The ICBC task enhances the network's discrimination between positive and mis-located samples in a class-wise manner and forges a mutually reinforcing relationship with the MCC task. For another, we propose a self-classification correction algorithm during inference, which combines the results of both MCC tasks to effectively reduce the mis-classified predictions. Extensive experiments on the prevalent VOC 2007 & 2012 datasets demonstrate the superior performance of our framework.
- Abstract(参考訳): 近年,ラベル付けコストの低さから,弱教師付き物体検出 (WSOD) が注目されている。
最近のWSODモデルの成功は、しばしば2段階のマルチクラス分類(MCC)タスク、すなわち複数のインスタンス学習とオンライン分類の洗練に言及される。
非自明な進歩を達成しているにもかかわらず、これらの手法はこれらの2つのMCCタスク間の潜在的な分類の曖昧さを見逃し、それらの固有の強みを活用できない。
本稿では,この2つの問題を改善するための新しいWSODフレームワークを紹介する。
まず,2つの異なるMCCタスク間のギャップを埋めるために,クラス内バイナリ分類(ICBC)を統合した自己分類拡張モジュールを提案する。
ICBCタスクは、正と誤位置のサンプルをクラスワイドで識別し、MCCタスクと相互に強化する関係を築き上げる。
また,2つのMCCタスクの結果を組み合わせて,誤分類予測を効果的に削減する自己分類補正アルゴリズムを提案する。
VOC 2007と2012のデータセットに対する大規模な実験は、我々のフレームワークの優れた性能を示している。
関連論文リスト
- Completely Weakly Supervised Class-Incremental Learning for Semantic Segmentation [2.7855886538423182]
本研究は,セマンティックセグメンテーションのためのクラスインクリメンタル学習の完全弱化という課題に対処する。
そこで本研究では,ローカライザからの擬似ラベルと基礎モデルのシーケンスを組み合わせることで,ロバストな擬似ラベルを生成することを提案する。
また,従来のクラスと新しいクラスの両方を含む多様なイメージをガイダンスで生成する,先進的なデータ拡張手法も導入する。
論文 参考訳(メタデータ) (2025-05-16T01:43:36Z) - Cross-Hierarchical Bidirectional Consistency Learning for Fine-Grained Visual Classification [1.757077789361314]
分類精度と整合性を改善するために,新しい階層型双方向学習(CHBC)フレームワークを提案する。
CHBCフレームワークは、注目マスクの分解と強化のために特別に設計されたモジュールを使用して、様々な階層にわたる差別的特徴を抽出する。
広く使われている3つのFGVCデータセットの実験は、CHBCフレームワークの有効性を検証する。
論文 参考訳(メタデータ) (2025-04-18T10:30:17Z) - CoMBO: Conflict Mitigation via Branched Optimization for Class Incremental Segmentation [75.35841972192684]
効果的なクラスインクリメンタル(CIS)は、破滅的な忘れを同時に緩和し、新しいクラスを統合するのに十分な可塑性を確保する必要がある。
分岐最適化(CoMBO)による競合緩和という新しいアプローチを導入する。
このアプローチでは、新しいクラスに対するクエリを明示的に洗練するために設計されたQuery Conflict Reductionモジュールを提示する。
論文 参考訳(メタデータ) (2025-04-05T12:34:51Z) - Class-Independent Increment: An Efficient Approach for Multi-label Class-Incremental Learning [49.65841002338575]
本稿では,MLCIL(Multi-label class-incremental Learning)問題に焦点をあてる。
マルチラベルサンプルに対して複数のクラスレベルの埋め込みを抽出する新しいクラス独立インクリメンタルネットワーク(CINet)を提案する。
クラス固有のトークンを構築することで、異なるクラスの知識を学び、保存する。
論文 参考訳(メタデータ) (2025-03-01T14:40:52Z) - Joint Input and Output Coordination for Class-Incremental Learning [84.36763449830812]
本稿では,これらの問題に対処するためのJIOC機構を提案する。
このメカニズムは、出力スコアの勾配に応じて異なるカテゴリのデータに異なる重みを割り当てる。
メモリストレージを使用するさまざまなインクリメンタルな学習アプローチに組み込むことができる。
論文 参考訳(メタデータ) (2024-09-09T13:55:07Z) - Constrained Multi-Layer Contrastive Learning for Implicit Discourse Relationship Recognition [9.644808110078833]
我々は,教師付きコントラスト学習(CL)手法,ラベルとインスタンス中心のCLを適用し,表現学習を強化する。
PDTB 2.0 と PDTB 3.0 の実験結果から,本手法は多クラス分類とバイナリ分類の両方において,性能を著しく向上させることができることがわかった。
論文 参考訳(メタデータ) (2024-09-07T17:55:41Z) - Cross-supervised Dual Classifiers for Semi-supervised Medical Image
Segmentation [10.18427897663732]
半教師付き医用画像分割は、大規模医用画像解析に有望な解決策を提供する。
本稿では、二重分類器(DC-Net)に基づくクロス教師あり学習フレームワークを提案する。
LAとPancreas-CTデータセットの実験は、DC-Netが半教師付きセグメンテーションの他の最先端手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2023-05-25T16:23:39Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。