論文の概要: IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2407.07520v1
- Date: Wed, 10 Jul 2024 10:17:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 17:01:49.184746
- Title: IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection
- Title(参考訳): IRSAM:赤外線小ターゲット検出のためのセグメンテーションモデル
- Authors: Mingjin Zhang, Yuchun Wang, Jie Guo, Yunsong Li, Xinbo Gao, Jing Zhang,
- Abstract要約: Infrared Small Target Detection (IRSTD) タスクは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。
IRSTDのためのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
- 参考スコア(独自算出の注目度): 55.554484379021524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent Segment Anything Model (SAM) is a significant advancement in natural image segmentation, exhibiting potent zero-shot performance suitable for various downstream image segmentation tasks. However, directly utilizing the pretrained SAM for Infrared Small Target Detection (IRSTD) task falls short in achieving satisfying performance due to a notable domain gap between natural and infrared images. Unlike a visible light camera, a thermal imager reveals an object's temperature distribution by capturing infrared radiation. Small targets often show a subtle temperature transition at the object's boundaries. To address this issue, we propose the IRSAM model for IRSTD, which improves SAM's encoder-decoder architecture to learn better feature representation of infrared small objects. Specifically, we design a Perona-Malik diffusion (PMD)-based block and incorporate it into multiple levels of SAM's encoder to help it capture essential structural features while suppressing noise. Additionally, we devise a Granularity-Aware Decoder (GAD) to fuse the multi-granularity feature from the encoder to capture structural information that may be lost in long-distance modeling. Extensive experiments on the public datasets, including NUAA-SIRST, NUDT-SIRST, and IRSTD-1K, validate the design choice of IRSAM and its significant superiority over representative state-of-the-art methods. The source code are available at: github.com/IPIC-Lab/IRSAM.
- Abstract(参考訳): 最近のSegment Anything Model(SAM)は、様々な下流画像セグメンテーションタスクに適した強力なゼロショット性能を示す、自然な画像セグメンテーションにおける重要な進歩である。
しかし、赤外線小ターゲット検出(IRSTD)タスクに事前訓練されたSAMを直接利用することは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。
可視光カメラとは異なり、熱撮像器は赤外線を捉えて物体の温度分布を明らかにする。
小さなターゲットはしばしば、物体の境界で微妙な温度遷移を示す。
この問題に対処するため、IRSTDのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
具体的には、Perona-Malik拡散(PMD)に基づくブロックを設計し、SAMエンコーダの複数のレベルに組み込んで、ノイズを抑えながら重要な構造的特徴を捉えるのに役立つ。
さらに, 長距離モデリングにおいて失われる可能性のある構造情報を取得するために, 多粒度特徴をエンコーダから融合するグラニュラリティ・アウェア・デコーダ(GAD)を考案した。
NUAA-SIRST、NUDT-SIRST、IRSTD-1Kなどの公開データセットに関する大規模な実験は、IRSAMの設計選択と、その代表的な最先端手法に対する大きな優位性を検証する。
ソースコードはgithub.com/IPIC-Lab/IRSAMで入手できる。
関連論文リスト
- Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - MAS-SAM: Segment Any Marine Animal with Aggregated Features [55.91291540810978]
そこで本研究では,海洋生物のセグメンテーションのためのMAS-SAMという新しい特徴学習フレームワークを提案する。
本手法により,グローバルな文脈的手がかりからよりリッチな海洋情報を抽出し,よりきめ細かな局部的詳細を抽出できる。
論文 参考訳(メタデータ) (2024-04-24T07:38:14Z) - Performance Evaluation of Segment Anything Model with Variational Prompting for Application to Non-Visible Spectrum Imagery [15.748043194987075]
この研究は、X線/赤外線モダリティに関心のあるオブジェクトのセグメンテーションにおけるセグメンション・任意のモデル機能を評価する。
提案手法は,ボックスプロンプトが与えられた場合,SAMはオブジェクトをX線モードで分割できるが,その性能は点プロンプトによって異なる。
このモダリティの低コントラストの性質を考えると、赤外線オブジェクトもポイントプロンプトでセグメント化することが困難である。
論文 参考訳(メタデータ) (2024-04-18T16:04:14Z) - Distilling Semantic Priors from SAM to Efficient Image Restoration Models [80.83077145948863]
画像復元(IR)では、セグメンテーションモデルからセグメンテーションの事前情報を活用することが、性能向上のための一般的なアプローチである。
近年のセグメンテーション・アズ・モデル (SAM) は、IRタスクを強化するために先進的なセグメンテーション先行を抽出する強力なツールとして登場した。
本稿では,SAMのセマンティック知識を抽出し,推論プロセスに干渉することなく,IRモデルからの撤退を促進するための一般的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-25T02:17:20Z) - HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection [16.92362922379821]
赤外線小物体検出性能を向上させるための深層学習法を提案する。
本発明の方法は、PPAモジュール、DASIモジュール、MDCRモジュールを含む。
論文 参考訳(メタデータ) (2024-03-16T02:45:42Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - RSAM-Seg: A SAM-based Approach with Prior Knowledge Integration for
Remote Sensing Image Semantic Segmentation [10.37240769959699]
Segment Anything Model (SAM)は、イメージセグメンテーションタスクのための普遍的な事前トレーニングモデルを提供する。
本稿では,セマンティックを用いたリモートセンシングSAM(RSAM-Seg)を提案する。
SAMのエンコーダ部分のマルチヘッドアテンションブロックにおいて,アダプタスケール(Adapter-Scale)が提案されている。
クラウド検出、フィールド監視、ビル検出、道路マッピングタスクを含む4つの異なるリモートセンシングシナリオで実験が行われた。
論文 参考訳(メタデータ) (2024-02-29T09:55:46Z) - MTU-Net: Multi-level TransUNet for Space-based Infrared Tiny Ship
Detection [42.92798053154314]
我々は,48個の空間ベースの赤外線画像と17598ピクセルレベルの小型船舶アノテーションを用いた,宇宙ベースの小型船舶検出データセット(NUDT-SIRST-Sea)を開発した。
このような挑戦的な場面におけるこれらの小型船の極端な特性を考慮すると、本稿ではマルチレベルトランスUNet(MTU-Net)を提案する。
NUDT-SIRST-Seaデータセットによる実験結果から,MTU-Netは従来の深層学習に基づくSIRST法よりも検出率,誤警報率,結合上の交叉率の点で優れていた。
論文 参考訳(メタデータ) (2022-09-28T00:48:14Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。