論文の概要: Rethinking Representations for Cross-Domain Infrared Small Target Detection: A Generalizable Perspective from the Frequency Domain
- arxiv url: http://arxiv.org/abs/2604.01934v1
- Date: Thu, 02 Apr 2026 11:54:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.718466
- Title: Rethinking Representations for Cross-Domain Infrared Small Target Detection: A Generalizable Perspective from the Frequency Domain
- Title(参考訳): クロスドメイン赤外小ターゲット検出のための表現再考:周波数領域からの一般化可能な視点
- Authors: Yimin Fu, Songbo Wang, Feiyan Wu, Jialin Lyu, Zhunga Liu, Michael K. Ng,
- Abstract要約: クロスドメインIRSTDのための空間-スペクトル協調認識ネットワークを提案する。
我々は、一般化可能な目標認識を導出するための位相修正モジュール(PRM)を開発した。
我々は、位置情報を保持するために、スキップ接続に注意機構(OAM)を用いる。
- 参考スコア(独自算出の注目度): 26.03122882760887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accurate target-background separation in infrared small target detection (IRSTD) highly depends on the discriminability of extracted representations. However, most existing methods are confined to domain-consistent settings, while overlooking whether such discriminability can generalize to unseen domains. In practice, distribution shifts between training and testing data are inevitable due to variations in observational conditions and environmental factors. Meanwhile, the intrinsic indistinctiveness of infrared small targets aggravates overfitting to domain-specific patterns. Consequently, the detection performance of models trained on source domains can be severely degraded when deployed in unseen domains. To address this challenge, we propose a spatial-spectral collaborative perception network (S$^2$CPNet) for cross-domain IRSTD. Moving beyond conventional spatial learning pipelines, we rethink IRSTD representations from a frequency perspective and reveal inconsistencies in spectral phase as the primary manifestation of domain discrepancies. Based on this insight, we develop a phase rectification module (PRM) to derive generalizable target awareness. Then, we employ an orthogonal attention mechanism (OAM) in skip connections to preserve positional information while refining informative representations. Moreover, the bias toward domain-specific patterns is further mitigated through selective style recomposition (SSR). Extensive experiments have been conducted on three IRSTD datasets, and the proposed method consistently achieves state-of-the-art performance under diverse cross-domain settings.
- Abstract(参考訳): 赤外線小目標検出(IRSTD)における正確な目標背景分離は,抽出した表現の識別可能性に大きく依存する。
しかし、既存のほとんどのメソッドはドメインに一貫性のある設定に限られており、そのような差別性は目に見えないドメインに一般化できるかどうかを見落としている。
実際には、観測条件や環境要因の変動により、トレーニングデータとテストデータの分布変化は避けられない。
一方、赤外小ターゲットの本質的な不明瞭さは、ドメイン固有のパターンへの過度な適合を増す。
その結果、ソースドメインでトレーニングされたモデルの検出性能は、目に見えないドメインにデプロイされた場合、著しく低下する可能性がある。
この課題に対処するために、クロスドメインIRSTDのための空間スペクトル協調認識ネットワーク(S$^2$CPNet)を提案する。
従来の空間学習パイプラインを超えて、周波数の観点からIRSTD表現を再考し、スペクトル位相の不整合をドメイン不一致の主徴として明らかにする。
この知見に基づいて、一般化可能な目標認識を導出するための位相修正モジュール(PRM)を開発した。
そこで我々は,情報表現を洗練しながら位置情報を保存するために,直交注意機構(OAM)をスキップ接続に適用した。
さらに、ドメイン固有のパターンに対するバイアスは選択的スタイル再構成(SSR)によってさらに軽減される。
3つのIRSTDデータセットに対して大規模な実験が行われ、提案手法は多種多様なドメイン間設定下での最先端性能を一貫して達成する。
関連論文リスト
- Towards Single-Source Domain Generalized Object Detection via Causal Visual Prompts [37.886574666175065]
単一ソースのドメイン一般化オブジェクト検出はコンピュータビジョンにおける最先端の研究トピックである。
Causal Visual Prompts 法は、視覚的プロンプトと横断的アテンションを統合することで、刺激的な特徴からバイアスを緩和する。
Causalは15.9-31.4%のアップで最先端の性能を実現している。
論文 参考訳(メタデータ) (2025-10-22T11:24:52Z) - VFM-Guided Semi-Supervised Detection Transformer under Source-Free Constraints for Remote Sensing Object Detection [9.029534000674388]
VG-DETRは、Vision Foundation Model(VFM)を「フリーランチ」方法でトレーニングパイプラインに統合する。
擬似ラベルの信頼性を評価するために,VFMのセマンティックな事前情報を利用した擬似ラベルマイニング手法を提案する。
さらに,デュアルレベルのVFM誘導アライメント手法を提案し,インスタンスレベルと画像レベルでのVFM埋め込みと検出器特性を一致させる。
論文 参考訳(メタデータ) (2025-08-15T02:35:56Z) - Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - Towards Cross-domain Few-shot Graph Anomaly Detection [6.732699844225434]
ソースとターゲットドメイン間のデータ分散の相違により、クロスドメインの少数ショットグラフ異常検出(GAD)は簡単ではない。
我々は,上記の課題に対処するために,CDFS-GADと呼ばれるシンプルで効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-11T08:47:25Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - An Unsupervised Domain Adaptive Approach for Multimodal 2D Object
Detection in Adverse Weather Conditions [5.217255784808035]
本稿では、ソースとターゲットドメイン間のドメインギャップを埋めるために、教師なしのドメイン適応フレームワークを提案する。
天候の歪みをシミュレートするデータ拡張方式を用いて、ドメインの混乱を増し、ソースデータへの過度な適合を防止する。
DENSEデータセットで行った実験は、我々の手法がドメインギャップを大幅に軽減できることを示している。
論文 参考訳(メタデータ) (2022-03-07T18:10:40Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Generalizable Representation Learning for Mixture Domain Face
Anti-Spoofing [53.82826073959756]
ドメイン一般化(DG)に基づく対スプーフィングアプローチは、予期せぬシナリオの堅牢性のために注目を集めています。
ドメインダイナミック調整メタラーニング(D2AM)についてドメインラベルを使わずに提案する。
この制限を克服するため,ドメインダイナミック調整メタラーニング(D2AM)を提案する。
論文 参考訳(メタデータ) (2021-05-06T06:04:59Z) - Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation [62.29076080124199]
本稿では,クロスドメインオブジェクト検出のための特徴適応手法を提案する。
粗粒度では、アテンション機構を採用して前景領域を抽出し、その辺縁分布に応じて整列する。
粒度の細かい段階では、同じカテゴリのグローバルプロトタイプと異なるドメインとの距離を最小化することにより、前景の条件分布アライメントを行う。
論文 参考訳(メタデータ) (2020-03-23T13:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。