論文の概要: Focus, Align, and Sustain: Counteracting Gradient Dilution in Incremental Object Detection
- arxiv url: http://arxiv.org/abs/2606.15253v1
- Date: Sat, 13 Jun 2026 11:20:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.16187
- Title: Focus, Align, and Sustain: Counteracting Gradient Dilution in Incremental Object Detection
- Title(参考訳): 焦点・アライメント・持続性:インクリメンタル物体検出におけるグラディエント希釈の防止
- Authors: Aoting Zhang, Dongbao Yang, Chang Liu, Xiaopeng Hong, Yu Zhou,
- Abstract要約: インクリメンタル学習を通して、Focuse、Aligns、Sustainsの勾配フローを統一するフレームワークを提案する。
実験により、FASはロバストな最適化のダイナミクスを復元し、最先端の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 34.23489857539403
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting Detection Transformers to Incremental Object Detection (IOD) poses a systemic challenge, as set-based optimization is inherently destabilized by sequential learning. In this work, we identify Gradient Dilution as the root cause of performance degradation, wherein optimization signals required to preserve old knowledge are progressively weakened. This phenomenon manifests as a cascading erosion of preservation gradients in magnitude, direction, and support coverage, driven by three tightly coupled factors: Signal Dispersion, where foreground gradients are overwhelmed by background noise; Assignment Drift, where stochastic query-target matching induces inconsistent gradient trajectories; and Support Attrition, where gradients from retained samples insufficiently cover the old-class feature space, weakening decision boundaries under interference from new classes. To counteract this, we propose FAS, a unified framework that Focuses, Aligns, and Sustains gradient flow throughout incremental learning. Specifically, we introduce prior-injected queries to focus discriminative signals by filtering background interference at the source. We further propose deterministic anchor distillation to align query-target assignments and enforce semantic consistency across stages under unstable matching. Finally, we devise manifold-support replay to sustain distributional support of old classes, counteracting representational erosion induced by continual updates. Extensive experiments show that FAS restores robust optimization dynamics and outperforms state-of-the-art methods, achieving over 5.0 AP improvement in the challenging 40+10x4 incremental setting.
- Abstract(参考訳): インクリメンタルオブジェクト検出(IOD)への検出トランスフォーマーの適応は、逐次学習によってセットベース最適化が本質的に不安定になるため、体系的な課題となる。
本研究では,従来の知識の保存に必要な最適化信号が徐々に弱まる性能劣化の根本原因として,勾配解を同定する。
信号分散, 前景勾配が背景雑音に圧倒される信号分散, 確率的クエリターゲットマッチングが不整合勾配軌跡を誘導するアサインメントドリフト, 保持されたサンプルからの勾配が旧来の特徴空間を十分にカバーし, 新しいクラスからの干渉による決定境界を弱める。
これに対応するために、段階的な学習を通しての勾配流を集中、アライン、持続する統一的なフレームワークであるFASを提案する。
具体的には、ソースの背景干渉をフィルタリングして識別信号に焦点を合わせるために、事前挿入クエリを導入する。
さらに、クエリターゲットの割り当てを整列させ、不安定なマッチングの下でステージ間のセマンティック一貫性を強制するために、決定論的アンカー蒸留を提案する。
最後に,連続的な更新によって引き起こされる表現的侵食に対抗して,古いクラスの分布的サポートを維持するために,多様体によるリプレイを考案する。
大規模な実験により、FASは堅牢な最適化のダイナミクスを復元し、最先端の手法より優れており、挑戦的な40×10x4のインクリメンタル設定において5.0 APの改善を達成している。
関連論文リスト
- Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.278200968044665]
カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。
既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。
動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-25T09:57:46Z) - Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0127582612634]
Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。
NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文 参考訳(メタデータ) (2026-05-21T16:45:31Z) - MoASE++: Mixture of Activation Sparsity Experts with Domain-Adaptive On-policy Distillation for Continual Test Time Adaptation [65.068801413044]
連続的なテスト時間適応は、非定常な未ラベルのターゲットストリームにソース予測モデルを適用する。
ドメインに依存しない構造をドメイン固有のテクスチャから切り離す。
論文 参考訳(メタデータ) (2026-05-18T01:52:12Z) - Enhancing Gradient Inversion Attacks in Federated Learning via Hierarchical Feature Optimization [56.95448807869383]
フェデレートラーニング(FL)は、プライバシを保存する分散機械学習の魅力的なパラダイムとして登場した。
近年の研究では、FLシステムで交換される勾配もプライバシー漏洩に弱いことが報告されている。
我々は textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD) を提案する。
論文 参考訳(メタデータ) (2026-04-01T14:32:15Z) - Dual-Stage Invariant Continual Learning under Extreme Visual Sparsity [8.16821029459195]
背景駆動の勾配は、連続的なドメインシフトの間、機能のバックボーンを不安定にすることを示す。
連成蒸留による二段階不変連続学習フレームワークを提案する。
高分解能空間ベース RSO 検出データセットの実験は、確立された連続物体検出法よりも一貫した改善を示す。
論文 参考訳(メタデータ) (2026-03-27T09:03:49Z) - Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。
本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。
不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文 参考訳(メタデータ) (2026-01-02T09:16:55Z) - CF-CAM: Cluster Filter Class Activation Mapping for Reliable Gradient-Based Interpretability [16.032048689169866]
CAM(Class Activation Mapping)技術は、モデル決定を視覚化するための重要なアプローチとして登場した。
勾配に基づくCAM変種は、勾配ノイズによる勾配摂動に対する感受性に悩まされ、不安定で信頼性の低い説明をもたらす。
本稿では,勾配雑音に対する頑健性を高めつつ,勾配に基づく重み付けを再導入するクラスタフィルタクラス活性化マップ(CF-CAM)手法を提案する。
論文 参考訳(メタデータ) (2025-03-31T12:20:59Z) - Mjolnir: Breaking the Shield of Perturbation-Protected Gradients via Adaptive Diffusion [13.764770382623812]
フェデレートラーニングにおける勾配摂動保護のシールドを破ろうとする試みについて紹介する。
摂動抵抗性勾配漏洩攻撃であるMjolnirを導入する。
Mjolnirは、オリジナルのモデル構造や外部データへのアクセスを必要とせずに、勾配から摂動を取り除くことができる。
論文 参考訳(メタデータ) (2024-07-07T07:06:49Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。