論文の概要: Ivan-ISTD: Rethinking Cross-domain Heteroscedastic Noise Perturbations in Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2510.12241v1
- Date: Tue, 14 Oct 2025 07:48:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.230246
- Title: Ivan-ISTD: Rethinking Cross-domain Heteroscedastic Noise Perturbations in Infrared Small Target Detection
- Title(参考訳): Ivan-ISTD:赤外小ターゲット検出におけるクロスドメイン・ヘテロセダスティックノイズ摂動の再考
- Authors: Yuehui Li, Yahao Lu, Haoyuan Wu, Sen Zhang, Liang Lin, Yukai Shi,
- Abstract要約: Ivan-ISTD は ISTD におけるクロスドメインシフトと異方性雑音摂動の2つの課題に対処するように設計されている。
Ivan-ISTDはクロスドメインシナリオにおいて優れた堅牢性を示している。
- 参考スコア(独自算出の注目度): 53.689841037081834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the multimedia domain, Infrared Small Target Detection (ISTD) plays a important role in drone-based multi-modality sensing. To address the dual challenges of cross-domain shift and heteroscedastic noise perturbations in ISTD, we propose a doubly wavelet-guided Invariance learning framework(Ivan-ISTD). In the first stage, we generate training samples aligned with the target domain using Wavelet-guided Cross-domain Synthesis. This wavelet-guided alignment machine accurately separates the target background through multi-frequency wavelet filtering. In the second stage, we introduce Real-domain Noise Invariance Learning, which extracts real noise characteristics from the target domain to build a dynamic noise library. The model learns noise invariance through self-supervised loss, thereby overcoming the limitations of distribution bias in traditional artificial noise modeling. Finally, we create the Dynamic-ISTD Benchmark, a cross-domain dynamic degradation dataset that simulates the distribution shifts encountered in real-world applications. Additionally, we validate the versatility of our method using other real-world datasets. Experimental results demonstrate that our approach outperforms existing state-of-the-art methods in terms of many quantitative metrics. In particular, Ivan-ISTD demonstrates excellent robustness in cross-domain scenarios. The code for this work can be found at: https://github.com/nanjin1/Ivan-ISTD.
- Abstract(参考訳): マルチメディア領域において、赤外線小ターゲット検出(ISTD)は、ドローンによるマルチモダリティセンシングにおいて重要な役割を果たす。
ISTDにおけるクロスドメインシフトとヘテロscedastic noise perturbationsの2つの課題に対処するために,2つのウェーブレット誘導不変分散学習フレームワーク(Ivan-ISTD)を提案する。
最初の段階では、ウェーブレット誘導クロスドメイン合成を用いて、ターゲットドメインと整合したトレーニングサンプルを生成する。
ウェーブレット誘導アライメント装置は、多周波ウェーブレットフィルタリングによりターゲット背景を正確に分離する。
第2段階では、ターゲット領域から実雑音特性を抽出し、動的ノイズライブラリを構築するリアルドメイン雑音分散学習を導入する。
このモデルは、自己教師付き損失を通じてノイズ不変性を学習し、従来の人工雑音モデリングにおける分布バイアスの限界を克服する。
最後に、現実世界のアプリケーションで発生する分散シフトをシミュレートするクロスドメインな動的劣化データセットであるDynamic-ISTD Benchmarkを作成します。
さらに,他の実世界のデータセットを用いて,本手法の汎用性を検証する。
実験結果から,本手法は,多くの定量的指標から既存の最先端手法よりも優れていることが示された。
特にIvan-ISTDは、クロスドメインシナリオにおいて優れた堅牢性を示している。
この作業のコードは、https://github.com/nanjin1/Ivan-ISTD.comにある。
関連論文リスト
- InJecteD: Analyzing Trajectories and Drift Dynamics in Denoising Diffusion Probabilistic Models for 2D Point Cloud Generation [48.55037712252843]
InJecteDは拡散確率モデル(DDPM)を解釈するフレームワーク
このフレームワークをDatasaurus Dozen bullseye, dino, circleの3つのデータセットに適用する。
提案手法は, 変位, 速度, クラスタリング, ドリフト場力学などの軌道特性を定量的に評価する。
論文 参考訳(メタデータ) (2025-09-09T14:53:19Z) - Rethinking Generalizable Infrared Small Target Detection: A Real-scene Benchmark and Cross-view Representation Learning [46.60262602072635]
赤外線小目標検出 (ISTD) は, センサタイプ, 観測条件, 標的の固有特性に非常に敏感である。
本稿では,ドメイン適応により拡張されたISTDフレームワークを提案する。
我々はまた、専用の赤外線小ターゲットデータセットであるRealScene-ISTDを開発した。
論文 参考訳(メタデータ) (2025-04-23T07:58:15Z) - Effective Noise-aware Data Simulation for Domain-adaptive Speech Enhancement Leveraging Dynamic Stochastic Perturbation [25.410770364140856]
クロスドメイン音声強調(SE)は、目に見えない対象領域におけるノイズや背景情報の不足により、しばしば深刻な課題に直面している。
本研究では,ノイズ抽出技術とGANを利用した新しいデータシミュレーション手法を提案する。
本研究では,動的摂動の概念を導入し,制御された摂動を推論中の雑音埋め込みに注入する。
論文 参考訳(メタデータ) (2024-09-03T02:29:01Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Gaussian Flow Bridges for Audio Domain Transfer with Unpaired Data [20.181313153447412]
本稿では,生成モデルにおけるガウス流橋の可能性について検討する。
提案フレームワークは,2つの決定論的確率フローの一連の実装を通じて,音声信号の分布の異なる輸送問題に対処する。
音声内容の一貫性を維持する上での課題に対処するため,チャンクをベースとしたデータサンプルとノイズの最適輸送結合を含むトレーニング戦略を推奨する。
論文 参考訳(メタデータ) (2024-05-29T20:23:01Z) - Generative Model Based Noise Robust Training for Unsupervised Domain
Adaptation [108.11783463263328]
本稿では, 生成モデルに基づくノイズ・ロバスト訓練法(GeNRT)を提案する。
ラベルノイズを緩和しながらドメインシフトを除去する。
Office-Home、PACS、Digit-Fiveの実験は、GeNRTが最先端のメソッドに匹敵するパフォーマンスを実現していることを示している。
論文 参考訳(メタデータ) (2023-03-10T06:43:55Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。