論文の概要: Difference Decomposition Networks for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2512.03470v1
- Date: Wed, 03 Dec 2025 05:52:06 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:09:43.939949
- Title: Difference Decomposition Networks for Infrared Small Target Detection
- Title(参考訳): 赤外線小ターゲット検出のための差分分解ネットワーク
- Authors: Chen Hu, Mingyu Zhou, Shuai Yuan, Hongbo Hu, Xiangyu Qiu, Junhai Luo, Tian Pu, Xiyin Li,
- Abstract要約: 赤外線小目標検出(ISTD)は、識別可能な標的テクスチャの欠如と厳しい背景乱れの2つの大きな課題に直面している。
単一フレームISTD(SISTD)のための空間差分分解ネットワーク(SD$mathrm2$Net)とマルチフレームISTD(MISTD)のための時空間差分分解ネットワーク(STD$mathrm2$Net)を開発する。
STD$mathrm2$Netは87.68%のmIoUを達成する。
- 参考スコア(独自算出の注目度): 7.4275321692534115
- License:
- Abstract: Infrared small target detection (ISTD) faces two major challenges: a lack of discernible target texture and severe background clutter, which results in the background obscuring the target. To enhance targets and suppress backgrounds, we propose the Basis Decomposition Module (BDM) as an extensible and lightweight module based on basis decomposition, which decomposes a complex feature into several basis features and enhances certain information while eliminating redundancy. Extending BDM leads to a series of modules, including the Spatial Difference Decomposition Module (SD$^\mathrm{2}$M), Spatial Difference Decomposition Downsampling Module (SD$^\mathrm{3}$M), and Temporal Difference Decomposition Module (TD$^\mathrm{2}$M). Based on these modules, we develop the Spatial Difference Decomposition Network (SD$^\mathrm{2}$Net) for single-frame ISTD (SISTD) and the Spatiotemporal Difference Decomposition Network (STD$^\mathrm{2}$Net) for multi-frame ISTD (MISTD). SD$^\mathrm{2}$Net integrates SD$^\mathrm{2}$M and SD$^\mathrm{3}$M within an adapted U-shaped architecture. We employ TD$^\mathrm{2}$M to introduce motion information, which transforms SD$^\mathrm{2}$Net into STD$^\mathrm{2}$Net. Extensive experiments on SISTD and MISTD datasets demonstrate state-of-the-art (SOTA) performance. On the SISTD task, SD$^\mathrm{2}$Net performs well compared to most established networks. On the MISTD datasets, STD$^\mathrm{2}$Net achieves a mIoU of 87.68\%, outperforming SD$^\mathrm{2}$Net, which achieves a mIoU of 64.97\%. Our codes are available: https://github.com/greekinRoma/IRSTD_HC_Platform.
- Abstract(参考訳): Infrared small target detection (ISTD) は、識別可能な標的テクスチャの欠如と、背景の乱れという2つの大きな課題に直面している。
本稿では, 基本分解に基づく拡張性と軽量なモジュールとして, 複雑な特徴を複数の基本特徴に分解し, 冗長性を排除しつつ, 特定の情報を強化するBDMを提案する。
BDMの拡張は、空間差分分解モジュール(SD$^\mathrm{2}$M)、空間差分分解ダウンサンプリングモジュール(SD$^\mathrm{3}$M)、時間差分分解モジュール(TD$^\mathrm{2}$M)などの一連のモジュールにつながる。
これらのモジュールに基づいて、単一フレームISTD(SISTD)のための空間差分分解ネットワーク(SD$^\mathrm{2}$Net)とマルチフレームISTD(MISTD)のための時空間差分分解ネットワーク(STD$^\mathrm{2}$Net)を開発する。
SD$^\mathrm{2}$Net は SD$^\mathrm{2}$M と SD$^\mathrm{3}$M を統合する。
我々はTD$^\mathrm{2}$Mを用いて動き情報を導入し、SD$^\mathrm{2}$NetをSTD$^\mathrm{2}$Netに変換する。
SISTDとMISTDデータセットに関する大規模な実験は、最先端(SOTA)のパフォーマンスを示している。
SISTDタスクでは、SD$^\mathrm{2}$Netは、既存のネットワークと比較してよく機能する。
MISTDデータセットでは、STD$^\mathrm{2}$Netが87.68\%のmIoUを達成し、SD$^\mathrm{2}$Netを上回っ、64.97\%のmIoUを達成している。
私たちのコードは、https://github.com/greekinRoma/IRSTD_HC_Platform.comで利用可能です。
関連論文リスト
- The Hidden Width of Deep ResNets: Tight Error Bounds and Phase Diagrams [15.246178589173523]
大深度残差ネットワーク(ResNets)の勾配に基づくトレーニングについて検討する。
可変深さ$L$,固定埋め込み寸法$D$,任意の隠れ幅$M$で、トレーニングダイナミクスはニューラル平均ODEトレーニングダイナミクスに収束することを示す。
論文 参考訳(メタデータ) (2025-09-12T11:51:44Z) - Corporate Needs You to Find the Difference: Revisiting Submodular and Supermodular Ratio Optimization Problems [3.637365301757111]
平均値 $ f(S)/|S| $ を小モジュラーあるいは超モジュラーな集合関数 f: 2V から算術 $ への最小化や最大化の問題について研究する。
これは、Densest Subgraph (DSG)、Densest Supermodular Set (DSS)、Submodular Minimization (SFM)といった古典的な問題を一般化する。
論文 参考訳(メタデータ) (2025-05-23T03:55:11Z) - Simple yet Effective Semi-supervised Knowledge Distillation from Vision-Language Models via Dual-Head Optimization [47.38380084735716]
大規模な画像テキストペアで事前訓練された視覚教師付きモデル(VLM)は、顕著なゼロ/フェーショット性能を示した。
知識蒸留(KD)は、VLM能力を伝達するための自然な枠組みを提供するが、監督と蒸留の損失の間の勾配の衝突に悩まされる。
本稿では,異なる信号に対して2つの予測ヘッドを導入するDual-Head Optimization (DHO)を提案する。
論文 参考訳(メタデータ) (2025-05-12T15:39:51Z) - Monge-Ampere Regularization for Learning Arbitrary Shapes from Point Clouds [69.69726932986923]
任意の曲面型をモデル化するための新しい暗黙曲面表現であるスケールド2乗距離関数 (S$2$DF) を提案する。
S$2$DFは、ゼロレベルセットでのUDFの非微分可能性問題に効果的に対処しながら、内部領域と外部領域を区別しない。
論文 参考訳(メタデータ) (2024-10-24T06:56:34Z) - Learning Orthogonal Multi-Index Models: A Fine-Grained Information Exponent Analysis [54.57279006229212]
情報指数は、オンライン勾配降下のサンプルの複雑さを予測する上で重要な役割を担っている。
本研究では,2次項と高次項の両方を考慮することで,まず2次項を用いて関連する空間を学習できることを示す。
オンラインSGDの全体サンプルと複雑さは$tildeO(d PL-1 )$である。
論文 参考訳(メタデータ) (2024-10-13T00:14:08Z) - Learning sum of diverse features: computational hardness and efficient gradient-based training for ridge combinations [40.77319247558742]
目的関数 $f_*:mathbbRdtomathbbR$ を加法構造で学習する際の計算複雑性について検討する。
2層ニューラルネットワークの勾配学習により,$f_*$の大規模なサブセットを効率的に学習できることを実証した。
論文 参考訳(メタデータ) (2024-06-17T17:59:17Z) - Online Learning and Information Exponents: On The Importance of Batch size, and Time/Complexity Tradeoffs [24.305423716384272]
我々は,1パス勾配勾配(SGD)を有する2層ニューラルネットワークの繰り返し時間に対するバッチサイズの影響について検討した。
大規模なバッチで勾配更新を行うことで、サンプル全体の複雑さを変えることなく、トレーニング時間を最小化できることが示される。
低次元常微分方程式(ODE)のシステムにより、トレーニングの進捗を追跡できることを示す。
論文 参考訳(メタデータ) (2024-06-04T09:44:49Z) - Neural network learns low-dimensional polynomials with SGD near the information-theoretic limit [75.4661041626338]
単一インデックス対象関数 $f_*(boldsymbolx) = textstylesigma_*left(langleboldsymbolx,boldsymbolthetarangleright)$ の勾配勾配勾配学習問題について検討する。
SGDに基づくアルゴリズムにより最適化された2層ニューラルネットワークは、情報指数に支配されない複雑さで$f_*$を学習する。
論文 参考訳(メタデータ) (2024-06-03T17:56:58Z) - Simplifying and Understanding State Space Models with Diagonal Linear
RNNs [56.33053691749856]
本研究は、離散化ステップを解消し、バニラ対角線形RNNに基づくモデルを提案する。
概念的にはるかに単純であるにもかかわらず、$mathrmDLR$は以前提案したSSMと同じくらいのパフォーマンスを示す。
また、合成シーケンス・ツー・シーケンス・タスクのスイートによって、SSMとアテンションベースモデルの表現性も特徴付ける。
論文 参考訳(メタデータ) (2022-12-01T18:53:06Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。