論文の概要: SCTransNet: Spatial-channel Cross Transformer Network for Infrared Small
Target Detection
- arxiv url: http://arxiv.org/abs/2401.15583v2
- Date: Thu, 1 Feb 2024 02:29:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-02 11:48:53.044253
- Title: SCTransNet: Spatial-channel Cross Transformer Network for Infrared Small
Target Detection
- Title(参考訳): SCTransNet:赤外小ターゲット検出のための空間チャネルクロストランスネットワーク
- Authors: Shuai Yuan, Hanlin Qin, Xiang Yan, Naveed AKhtar, Ajmal Mian
- Abstract要約: 赤外線小ターゲット検出(IRSTD)は近年,U字型ニューラルモデルから大きな恩恵を受けている。
既存のテクニックは、ターゲットが背景と高い類似性を持つ場合に苦労する。
本稿では,空間チャネルクロストランスネットワーク(SCTransNet)を提案する。
- 参考スコア(独自算出の注目度): 49.40391453094225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small target detection (IRSTD) has recently benefitted greatly from
U-shaped neural models. However, largely overlooking effective global
information modeling, existing techniques struggle when the target has high
similarities with the background. We present a Spatial-channel Cross
Transformer Network (SCTransNet) that leverages spatial-channel cross
transformer blocks (SCTBs) on top of long-range skip connections to address the
aforementioned challenge. In the proposed SCTBs, the outputs of all encoders
are interacted with cross transformer to generate mixed features, which are
redistributed to all decoders to effectively reinforce semantic differences
between the target and clutter at full scales. Specifically, SCTB contains the
following two key elements: (a) spatial-embedded single-head channel-cross
attention (SSCA) for exchanging local spatial features and full-level global
channel information to eliminate ambiguity among the encoders and facilitate
high-level semantic associations of the images, and (b) a complementary
feed-forward network (CFN) for enhancing the feature discriminability via a
multi-scale strategy and cross-spatial-channel information interaction to
promote beneficial information transfer. Our SCTransNet effectively encodes the
semantic differences between targets and backgrounds to boost its internal
representation for detecting small infrared targets accurately. Extensive
experiments on three public datasets, NUDT-SIRST, NUAA-SIRST, and IRSTD-1k,
demonstrate that the proposed SCTransNet outperforms existing IRSTD methods.
Our code will be made public at https://github.com/xdFai.
- Abstract(参考訳): 赤外線小ターゲット検出(IRSTD)は近年,U字型ニューラルモデルから大きな恩恵を受けている。
しかしながら、効果的なグローバル情報モデリングは見過ごされ、ターゲットが背景と高い類似度を持つ場合、既存の技術は苦戦する。
本稿では,この課題に対処するために,長距離スキップ接続上の空間チャネルクロストランスブロック(SCTB)を利用する空間チャネルクロストランスネットワーク(SCTransNet)を提案する。
提案するsctbでは、すべてのエンコーダの出力がクロストランスと相互作用して混合特徴を生成し、全てのデコーダに再分配することで、ターゲットとクラッタ間の意味的差異を効果的に強化する。
具体的には、SCTBは以下の2つのキー要素を含む。
(a)局所的空間特徴とフルレベルグローバルチャネル情報を交換し、エンコーダ間のあいまいさをなくし、画像の高レベルなセマンティックアソシエーションを促進するための空間埋め込みシングルヘッドチャネルクロスアテンション(SSCA)
b)マルチスケール戦略と空間間情報通信により特徴識別性を向上し,有益な情報伝達を促進するための補完的フィードフォワードネットワーク(CFN)を提案する。
sctransnetはターゲットと背景のセマンティックな違いを効果的にエンコードし、赤外線の小さなターゲットを正確に検出するための内部表現を高めます。
3つの公開データセット(NUDT-SIRST、NUAA-SIRST、IRSTD-1k)に対する大規模な実験は、提案されたSCTransNetが既存のIRSTD法より優れていることを示した。
私たちのコードはhttps://github.com/xdFai.comで公開されます。
関連論文リスト
- LKASeg:Remote-Sensing Image Semantic Segmentation with Large Kernel Attention and Full-Scale Skip Connections [27.473573286685063]
LKASegというリモートセンシング画像セマンティックセマンティックネットワークを提案する。
LKASegはLarge Kernel Attention(LSKA)とFull-Scale Skip Connection(FSC)を組み合わせる
ISPRSのベイヒンゲンデータセットでは、mF1とmIoUのスコアは90.33%と82.77%に達した。
論文 参考訳(メタデータ) (2024-10-14T12:25:48Z) - Cross-Layer Feature Pyramid Transformer for Small Object Detection in Aerial Images [5.652171904017473]
空中画像における物体検出は、通常、物体のサイズが小さいため、常に困難な作業であった。
現在の検出器の多くは新しい検出フレームワークを優先しており、しばしば特徴ピラミッドネットワークのような基本的なコンポーネントの研究を見落としている。
空中画像における小物体検出に特化して設計された新しいアップサンプラーフリー特徴ピラミッドネットワークであるCFPT(Cross-Layer Feature Pyramid Transformer)を紹介する。
論文 参考訳(メタデータ) (2024-07-29T04:40:18Z) - Relating CNN-Transformer Fusion Network for Change Detection [23.025190360146635]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。
実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T14:58:40Z) - TBSN: Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師型イメージデノベーション(SSID)において一般的なネットワークアーキテクチャである。
本稿では, ブラインドスポット要求を満たす変圧器演算子の解析と再設計により, 変圧器ベースブラインドスポットネットワーク(TBSN)を提案する。
空間的自己注意のために、注意行列に精巧なマスクを適用して受容場を制限し、拡張された畳み込みを模倣する。
チャネル自己アテンションについては,マルチスケールアーキテクチャの深層部において,チャネル数が空間的サイズよりも大きい場合,盲点情報を漏洩する可能性がある。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - Dual-Augmented Transformer Network for Weakly Supervised Semantic
Segmentation [4.02487511510606]
弱教師付きセマンティックセグメンテーション(WSSS)は、クラスレベルのラベルのみにオブジェクトを分割することを目的とした、基本的なコンピュータビジョンタスクである。
従来の手法では、CNNベースのネットワークを採用し、クラスアクティベーションマップ(CAM)戦略を用いて対象領域を発見する。
別の方法は、視覚変換器(ViT)を探索して画像を符号化し、グローバルな意味情報を取得することである。
相互補完学習のためのCNNベースネットワークとトランスフォーマーネットワークを併用したデュアルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-30T08:41:11Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Dual Aggregation Transformer for Image Super-Resolution [92.41781921611646]
画像SRのための新しいトランスモデルDual Aggregation Transformerを提案する。
DATは、ブロック間およびブロック内二重方式で、空間次元とチャネル次元にまたがる特徴を集約する。
我々のDATは現在の手法を超越している。
論文 参考訳(メタデータ) (2023-08-07T07:39:39Z) - CIR-Net: Cross-modality Interaction and Refinement for RGB-D Salient
Object Detection [144.66411561224507]
本稿では,CIR-Netと呼ばれる畳み込みニューラルネットワーク(CNN)モデルを提案する。
我々のネットワークは、定性的かつ定量的に最先端の塩分濃度検出器より優れています。
論文 参考訳(メタデータ) (2022-10-06T11:59:19Z) - SwinNet: Swin Transformer drives edge-aware RGB-D and RGB-T salient
object detection [12.126413875108993]
本稿では,RGB-D と RGB-T の有向物体検出のための相互モード融合モデル SwinNet を提案する。
提案モデルは,RGB-DデータセットとRGB-Tデータセットの最先端モデルより優れている。
論文 参考訳(メタデータ) (2022-04-12T07:37:39Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。