論文の概要: Exploring the Limits of End-to-End Feature-Affinity Propagation for Single-Point Supervised Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2605.00722v1
- Date: Fri, 01 May 2026 15:08:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.994464
- Title: Exploring the Limits of End-to-End Feature-Affinity Propagation for Single-Point Supervised Infrared Small Target Detection
- Title(参考訳): 単一点監視赤外小ターゲット検出のためのエンドツーエンド特徴親和性の限界探索
- Authors: Qiancheng Zhou, Wenhua Zhang,
- Abstract要約: 単一点制御赤外線小ターゲット検出(IRSTD)は、高密度アノテーションのコストを大幅に削減する。
現在のSOTA(State-of-the-art)手法は、マスクの監督を明示的でオフラインな擬似ラベル構成によって回収することにより、高精度を実現する。
最小限の代替策として、オンラインのポイント・ツー・マスク・イン・バッチ、ポイント・アンカレド・フィーチャー・アフィニティ・プロパゲーションを通じて、ポイント・ツー・マスクをオンラインに生成する手法について検討する。
- 参考スコア(独自算出の注目度): 6.7126559398433665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-point supervised infrared small target detection (IRSTD) drastically reduces dense annotation costs. Current state-of-the-art (SOTA) methods achieve high precision by recovering mask supervision through explicit, offline pseudo-label construction, such as multi-stage active learning and physics-driven mask generation. In this paper, we study a minimalist alternative: generating point-to-mask supervision online through in-batch, point-anchored feature-affinity propagation. We instantiate this paradigm as GSACP, an end-to-end testbed that directly supervises the detector using hard-margin feature affinity gated by local image priors, entirely eliminating external label-evolution loops. This compact design, however, exposes an optimization bottleneck. Because the affinity target is generated from the same feature representation being optimized, training forms a self-referential loop. We theoretically formalize this as \emph{Self-Referential Propagation Drift}, a representation-supervision entanglement that can sharpen true boundaries or distort the feature space to satisfy its own targets. To systematically isolate these failure modes, we apply a protocolized single-variable ablation procedure spanning local EMA teacher decoupling, hard-background contrastive separation, and adaptive support geometry. On the SIRST3 dataset, GSACP-Final establishes a new ultra-low false-alarm operating regime, achieving a highly competitive $0.6674$ mIoU while demonstrating a $38\% relative reduction in false-positive artifacts ($\mathrm{Fa}$) compared with PAL. By systematically deconstructing the end-to-end paradigm, we map its performance boundaries and show that in-batch feature propagation provides a compact alternative for deployment scenarios where false-alarm suppression is paramount.
- Abstract(参考訳): 単一点制御赤外線小ターゲット検出(IRSTD)は、高密度アノテーションのコストを大幅に削減する。
現在のSOTA(State-of-the-art)法は,多段階能動学習や物理駆動型マスク生成など,明示的でオフラインな擬似ラベル構成を通じてマスク監視を復元することにより,高精度に実現している。
本稿では,最小限の代替手段として,オンラインのポイント・ツー・マスク・イン・バッチ(in-batch, point-anchored)特徴親和性伝播により,ポイント・ツー・マスク(point-to-mask)の監視を生成する手法を提案する。
我々は、このパラダイムをGSACPとしてインスタンス化する。これは、ローカル画像の先行によりゲートされるハードマージン特徴親和性を用いて検出器を直接監視し、外部ラベル進化ループを完全に排除するエンドツーエンドテストベッドである。
しかし、このコンパクトな設計は最適化のボトルネックを露呈する。
アフィニティターゲットは、最適化されている同じ特徴表現から生成されるため、トレーニングは自己参照ループを形成する。
理論的には、これを「emph{Self-Referential Propagation Drift}」として定式化します。
これらの障害モードを系統的に分離するために、ローカルEMA教師分離、ハードバックコントラスト分離、適応支援幾何にまたがるプロトコル化された単一変数アブレーション手順を適用する。
SIRST3データセットでは、GSACP-Finalは、PALと比較して38 %の偽陽性アーティファクトを相対的に減少させながら、競争力の高い 0.6674$ mIoU を達成し、新しい超低額の偽アラーム運用体制を確立している。
エンド・ツー・エンドのパラダイムを体系的にデコンストラクションすることで、パフォーマンス境界をマッピングし、バッチ内のフィーチャの伝搬が、フェイル・アラームの抑制が最重要となるデプロイメントシナリオのコンパクトな代替手段を提供することを示す。
関連論文リスト
- Rethinking IRSTD: Single-Point Supervision Guided Encoder-only Framework is Enough for Infrared Small Target Detection [18.866174322297997]
赤外線小ターゲット検出(IRSTD)は、小さなターゲットを乱雑な背景から分離することを目的としている。
本稿では,新しい単一点応答スーパービジョン誘導赤外線確率応答法を提案する。
論文 参考訳(メタデータ) (2026-04-07T03:01:51Z) - Enhancing Gradient Inversion Attacks in Federated Learning via Hierarchical Feature Optimization [56.95448807869383]
フェデレートラーニング(FL)は、プライバシを保存する分散機械学習の魅力的なパラダイムとして登場した。
近年の研究では、FLシステムで交換される勾配もプライバシー漏洩に弱いことが報告されている。
我々は textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD) を提案する。
論文 参考訳(メタデータ) (2026-04-01T14:32:15Z) - Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing [1.0312968200748118]
Rectified Flowモデルは最先端の世代品質を実現するが、正確なタスクのためにそれらを制御することは依然として困難である。
現在のアプローチは「幾何学的ロック」に苦しむ逆法に基づくガイダンスに分岐する
Score-Guided Proximal Projectionは,決定論的最適化と縮尺サンプリングのギャップを埋める統一フレームワークである。
論文 参考訳(メタデータ) (2026-03-05T23:44:45Z) - Learning Accurate Segmentation Purely from Self-Supervision [87.78965637247107]
Selfmentは完全に自己管理型のフレームワークで、人間のラベルなしでオブジェクトを生画像から直接分割する。
Selfmentは、複数のベンチマークで新しい最先端(SoTA)結果を設定する。
論文 参考訳(メタデータ) (2026-02-27T07:36:32Z) - TABES: Trajectory-Aware Backward-on-Entropy Steering for Masked Diffusion Models [35.327100592206115]
Backward-on-Entropy (BoE) Steeringは勾配誘導型推論フレームワークで、無限水平コンテキストを1つの後方パスで近似する。
スケーラビリティを確保するために,マスク対象の構造を利用した疎結合プリミティブであるttexttActiveQueryAttentionを導入し,後方通過の複雑さを低減する。
論文 参考訳(メタデータ) (2026-01-30T19:10:32Z) - Towards Robust DeepFake Detection under Unstable Face Sequences: Adaptive Sparse Graph Embedding with Order-Free Representation and Explicit Laplacian Spectral Prior [12.202765237400143]
本稿では,Laplacian-Regularized Graph Convolutional Network (LR-GCN)を提案する。
LR-GCNは、高度のグローバル・ローカル・ディスラプションの下で、最先端の性能とロバスト性を大幅に向上する。
論文 参考訳(メタデータ) (2025-12-08T12:31:07Z) - Lightweight Transformer Framework for Weakly Supervised Semantic Segmentation [0.45880283710344055]
弱い教師付きセマンティックセマンティックセグメンテーション(WSSS)は、ノイズの多い未特定の手がかりから密集したマスクを学習しなければならない。
3つの小さな相乗的変化は、MiTバックボーンを変更することなく、弱い監督を著しく効果的にすることを示した。
提案手法であるCrispFormerは,(1)軽量エッジヘッドと境界認識損失を用いて細い物体の輪郭を監督する境界分岐,(2)画素ごとの不確かさを予測し,重み付けとセグメント化ログの残差補正に使用する不確実性誘導型精細化器,(3)静的結合を置き換える動的マルチスケール融合層をデコーダに拡張する。
論文 参考訳(メタデータ) (2025-11-24T22:40:57Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。