論文の概要: Infrared Small Target Detection in Satellite Videos: A New Dataset and A Novel Recurrent Feature Refinement Framework
- arxiv url: http://arxiv.org/abs/2409.12448v2
- Date: Fri, 4 Oct 2024 10:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 14:52:37.419578
- Title: Infrared Small Target Detection in Satellite Videos: A New Dataset and A Novel Recurrent Feature Refinement Framework
- Title(参考訳): 衛星映像における赤外小ターゲット検出:新しいデータセットと新しい特徴再構成フレームワーク
- Authors: Xinyi Ying, Li Liu, Zaipin Lin, Yangsi Shi, Yingqian Wang, Ruojing Li, Xu Cao, Boyang Li, Shilin Zhou,
- Abstract要約: IRSatVideo-LEOは、合成された衛星の動き、ターゲットの外観、軌道、強度を備えたセミシミュレートされたデータセットである。
RFRは、長期の時間的依存性を悪用するための、既存の強力なCNNベースの手法を備えることが提案されている。
- 参考スコア(独自算出の注目度): 20.72563526645679
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-frame infrared small target (MIRST) detection in satellite videos is a long-standing, fundamental yet challenging task for decades, and the challenges can be summarized as: First, extremely small target size, highly complex clutters & noises, various satellite motions result in limited feature representation, high false alarms, and difficult motion analyses. Second, the lack of large-scale public available MIRST dataset in satellite videos greatly hinders the algorithm development. To address the aforementioned challenges, in this paper, we first build a large-scale dataset for MIRST detection in satellite videos (namely IRSatVideo-LEO), and then develop a recurrent feature refinement (RFR) framework as the baseline method. Specifically, IRSatVideo-LEO is a semi-simulated dataset with synthesized satellite motion, target appearance, trajectory and intensity, which can provide a standard toolbox for satellite video generation and a reliable evaluation platform to facilitate the algorithm development. For baseline method, RFR is proposed to be equipped with existing powerful CNN-based methods for long-term temporal dependency exploitation and integrated motion compensation & MIRST detection. Specifically, a pyramid deformable alignment (PDA) module and a temporal-spatial-frequency modulation (TSFM) module are proposed to achieve effective and efficient feature alignment, propagation, aggregation and refinement. Extensive experiments have been conducted to demonstrate the effectiveness and superiority of our scheme. The comparative results show that ResUNet equipped with RFR outperforms the state-of-the-art MIRST detection methods. Dataset and code are released at https://github.com/XinyiYing/RFR.
- Abstract(参考訳): 衛星ビデオにおけるMIRST(Multi-frame infrared small target)検出は、何十年にもわたって持続する基本的かつ困難な課題であり、その課題は次のように要約できる: 第一に、非常に小さなターゲットサイズ、非常に複雑なクラッタとノイズ、様々な衛星の動きは、限られた特徴表現、高い偽アラーム、難しい動き解析である。
第2に、衛星ビデオにおける大規模公開可能なMIRSTデータセットの欠如は、アルゴリズムの開発を著しく妨げている。
上記の課題に対処するため、我々はまず衛星ビデオ(IRSatVideo-LEO)におけるMIRST検出のための大規模データセットを構築し、次にベースライン法として繰り返し機能改善(RFR)フレームワークを開発する。
具体的には、IRSatVideo-LEOは、合成された衛星の動き、ターゲットの外観、軌道、強度を備えたセミシミュレートされたデータセットであり、衛星ビデオ生成のための標準ツールボックスと、アルゴリズム開発を容易にする信頼性の高い評価プラットフォームを提供することができる。
ベースライン法では,時間的依存の長期利用と統合的動き補償とMIRST検出のための既存の強力なCNNベースの手法が提案されている。
具体的には, ピラミッド変形性アライメント (PDA) モジュールと時間空間周波数変調 (TSFM) モジュールを提案し, 効率的な特徴アライメント, 伝搬, 凝集, 精製を実現する。
提案手法の有効性と優位性を示すため, 大規模な実験を行った。
比較の結果,ResUNetのRFRは最先端のMIRST検出法よりも優れていた。
データセットとコードはhttps://github.com/XinyiYing/RFR.comで公開されている。
関連論文リスト
- Enhancing Maritime Situational Awareness through End-to-End Onboard Raw Data Analysis [4.441792803766689]
本研究は、小型衛星の厳密な帯域幅、エネルギー、遅延制約に対処する枠組みを提案する。
衛星画像からの船舶の直接検出・分類における深層学習手法の適用について検討した。
本手法は,車載処理チェーンの簡素化により,キャリブレーションや整形などの計算集約的なステップを必要とせず,直接解析を容易にする。
論文 参考訳(メタデータ) (2024-11-05T18:38:42Z) - Single-Point Supervised High-Resolution Dynamic Network for Infrared Small Target Detection [7.0456782736205685]
単一点教師付き高分解能ダイナミックネットワーク(SSHD-Net)を提案する。
単一点監視のみを用いて、最先端(SOTA)検出性能を実現する。
公開データセット NUDT-SIRST と IRSTD-1k の実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-08-04T09:44:47Z) - IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection [55.554484379021524]
Infrared Small Target Detection (IRSTD) タスクは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。
IRSTDのためのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
論文 参考訳(メタデータ) (2024-07-10T10:17:57Z) - FlightScope: A Deep Comprehensive Review of Aircraft Detection Algorithms in Satellite Imagery [2.9687381456164004]
本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。
この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。
YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文 参考訳(メタデータ) (2024-04-03T17:24:27Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Diffusion Models for Interferometric Satellite Aperture Radar [73.01013149014865]
確率拡散モデル (Probabilistic Diffusion Models, PDMs) は、最近、非常に有望な生成モデルのクラスとして登場した。
ここでは、PDMを活用して、レーダーベースの衛星画像データセットを複数生成する。
PDMは複雑で現実的な構造を持つ画像を生成することに成功したが、サンプリング時間は依然として問題である。
論文 参考訳(メタデータ) (2023-08-31T16:26:17Z) - STIP: A SpatioTemporal Information-Preserving and Perception-Augmented
Model for High-Resolution Video Prediction [78.129039340528]
本稿では、上記の2つの問題を解決するために、時空間情報保存・知覚拡張モデル(STIP)を提案する。
提案モデルは,特徴抽出と状態遷移中の映像の時間的情報を保存することを目的としている。
実験結果から,提案したSTIPは,様々な最先端手法と比較して,より良好な映像品質で映像を予測できることが示唆された。
論文 参考訳(メタデータ) (2022-06-09T09:49:04Z) - LiDARCap: Long-range Marker-less 3D Human Motion Capture with LiDAR
Point Clouds [58.402752909624716]
既存のモーションキャプチャデータセットはほとんどが短距離であり、まだ長距離アプリケーションのニーズに合わない。
我々は,この制限を克服するために,LiDARがより長い範囲で捉えた新しい人間のモーションキャプチャーデータセットLiDARHuman26Mを提案する。
我々のデータセットには、IMUシステムによって取得された人間の動きと同期RGB画像も含まれている。
論文 参考訳(メタデータ) (2022-03-28T12:52:45Z) - Wireless Sensing With Deep Spectrogram Network and Primitive Based
Autoregressive Hybrid Channel Model [20.670058030653458]
無線センシングに基づくヒューマンモーション認識(hmr)は,シーン理解のための低コスト手法である。
現在のHMRシステムは、レーダー信号を分類するためにサポートベクターマシン(SVM)と畳み込みニューラルネットワーク(CNN)を採用している。
本稿では,残差マッピング技術を利用してHMR性能を向上させるディープ・スペクトログラム・ネットワーク(DSN)を提案する。
論文 参考訳(メタデータ) (2021-04-21T06:33:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。