論文の概要: Foundation Model Priors Enhance Object Focus in Feature Space for Source-Free Object Detection
- arxiv url: http://arxiv.org/abs/2512.17514v2
- Date: Wed, 24 Dec 2025 07:10:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 13:34:31.932438
- Title: Foundation Model Priors Enhance Object Focus in Feature Space for Source-Free Object Detection
- Title(参考訳): ソースフリー物体検出のための特徴空間に着目した基礎モデル
- Authors: Sairam VCR, Rishabh Lalla, Aveen Dayal, Tejal Kulkarni, Anuj Lalla, Vineeth N Balasubramanian, Muhammad Haris Khan,
- Abstract要約: ドメインシフトは、検出器が強力なオブジェクト中心の表現を維持する能力を低下させる。
FALCON-SFODはドメインシフト下でのオブジェクト指向適応を強化するために設計されたフレームワークである。
- 参考スコア(独自算出の注目度): 38.14795337940857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current state-of-the-art approaches in Source-Free Object Detection (SFOD) typically rely on Mean-Teacher self-labeling. However, domain shift often reduces the detector's ability to maintain strong object-focused representations, causing high-confidence activations over background clutter. This weak object focus results in unreliable pseudo-labels from the detection head. While prior works mainly refine these pseudo-labels, they overlook the underlying need to strengthen the feature space itself. We propose FALCON-SFOD (Foundation-Aligned Learning with Clutter suppression and Noise robustness), a framework designed to enhance object-focused adaptation under domain shift. It consists of two complementary components. SPAR (Spatial Prior-Aware Regularization) leverages the generalization strength of vision foundation models to regularize the detector's feature space. Using class-agnostic binary masks derived from OV-SAM, SPAR promotes structured and foreground-focused activations by guiding the network toward object regions. IRPL (Imbalance-aware Noise Robust Pseudo-Labeling) complements SPAR by promoting balanced and noise-tolerant learning under severe foreground-background imbalance. Guided by a theoretical analysis that connects these designs to tighter localization and classification error bounds, FALCON-SFOD achieves competitive performance across SFOD benchmarks.
- Abstract(参考訳): Source-Free Object Detection (SFOD) における現在の最先端のアプローチは、平均的なTeacherの自己ラベルに依存している。
しかし、ドメインシフトは、しばしば検出器の強力なオブジェクト中心の表現を維持する能力を低下させ、背景の乱れに対して高信頼なアクティベーションを引き起こす。
この弱い対象焦点は、検出ヘッドからの信頼できない擬似ラベルをもたらす。
以前の研究は主にこれらの擬似ラベルを洗練させるが、機能空間自体を強化するための基本的な必要性を見落としている。
本研究では,FALCON-SFOD (Foundation-Aligned Learning with Clutter suppress and Noise robustness) を提案する。
2つの相補的な構成要素から構成される。
SPAR(Spatial Prior-Aware Regularization)は、視覚基盤モデルの一般化強度を利用して検出器の特徴空間を正規化する。
OV-SAMから派生したクラス非依存のバイナリマスクを用いて、SPARはネットワークを対象領域に向けて誘導することにより、構造化および前景中心のアクティベーションを促進する。
IRPL (Im Balance-aware Noise Robust Pseudo-Labeling) は、重度の背景不均衡下でのバランスと耐雑音性学習を促進することでSPARを補完する。
FALCON-SFODは、これらの設計をより厳密なローカライズと分類誤差境界に接続する理論的解析によって導かれ、SFODベンチマーク間の競合性能を達成する。
関連論文リスト
- Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - VFM-Guided Semi-Supervised Detection Transformer under Source-Free Constraints for Remote Sensing Object Detection [9.029534000674388]
VG-DETRは、Vision Foundation Model(VFM)を「フリーランチ」方法でトレーニングパイプラインに統合する。
擬似ラベルの信頼性を評価するために,VFMのセマンティックな事前情報を利用した擬似ラベルマイニング手法を提案する。
さらに,デュアルレベルのVFM誘導アライメント手法を提案し,インスタンスレベルと画像レベルでのVFM埋め込みと検出器特性を一致させる。
論文 参考訳(メタデータ) (2025-08-15T02:35:56Z) - FOAM: A General Frequency-Optimized Anti-Overlapping Framework for Overlapping Object Perception [7.258172311752019]
重なり合う物体知覚は、ランダムに重なり合う前景の特徴を分離し、背景の特徴を抑えつつ前景の特徴を抽出することを目的としている。
本稿では、よりテクスチャや輪郭情報を抽出する際のモデルを支援するために、一般周波数ベースのアンチオーバーラップフレームワーク(FOAM)を提案する。
具体的には、周波数空間変換器ブロック(FSTB)を設計し、周波数領域と空間領域の両方から特徴を同時に抽出し、ネットワークがフォアグラウンドからより多くのテクスチャ特徴をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2025-06-16T13:58:49Z) - Source-Free Domain Adaptive Object Detection with Semantics Compensation [54.00183496587841]
Weak-to-strong Semantics Compensation (WSCo)を導入する。
WSCoは、クラス関連セマンティクスを補う。
WSCoは一般的なプラグインとして実装することができ、既存のSFODパイプラインと容易に統合できます。
論文 参考訳(メタデータ) (2024-10-07T23:32:06Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。