論文の概要: SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2403.05416v1
- Date: Fri, 8 Mar 2024 16:14:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 13:04:41.628743
- Title: SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection
- Title(参考訳): SIRST-5K:ロバスト赤外小ターゲット検出のための自己教師付き学習による大規模負の合成探索
- Authors: Yahao Lu, Yupei Lin, Han Wu, Xiaoyu Xian, Yukai Shi, Liang Lin
- Abstract要約: 単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
- 参考スコア(独自算出の注目度): 53.19618419772467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-frame infrared small target (SIRST) detection aims to recognize small
targets from clutter backgrounds. Recently, convolutional neural networks have
achieved significant advantages in general object detection. With the
development of Transformer, the scale of SIRST models is constantly increasing.
Due to the limited training samples, performance has not been improved
accordingly. The quality, quantity, and diversity of the infrared dataset are
critical to the detection of small targets. To highlight this issue, we propose
a negative sample augmentation method in this paper. Specifically, a negative
augmentation approach is proposed to generate massive negatives for
self-supervised learning. Firstly, we perform a sequential noise modeling
technology to generate realistic infrared data. Secondly, we fuse the extracted
noise with the original data to facilitate diversity and fidelity in the
generated data. Lastly, we proposed a negative augmentation strategy to enrich
diversity as well as maintain semantic invariance. The proposed algorithm
produces a synthetic SIRST-5K dataset, which contains massive pseudo-data and
corresponding labels. With a rich diversity of infrared small target data, our
algorithm significantly improves the model performance and convergence speed.
Compared with other state-of-the-art (SOTA) methods, our method achieves
outstanding performance in terms of probability of detection (Pd), false-alarm
rate (Fa), and intersection over union (IoU).
- Abstract(参考訳): 単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
近年,畳み込みニューラルネットワークは一般物体検出において大きな利点を享受している。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
限られたトレーニングサンプルのため、パフォーマンスは改善されていない。
赤外線データセットの品質、量、多様性は、小さなターゲットの検出に不可欠である。
そこで本稿では,本論文では負のサンプル増補法を提案する。
特に,自己教師付き学習のための膨大な否定を生成するために,負の強化手法が提案されている。
まず、現実的な赤外線データを生成するためのシーケンシャルノイズモデリング技術を実行する。
次に、抽出したノイズを元のデータと融合することで、生成されたデータの多様性と忠実性が向上する。
最後に,多様性を豊かにし,意味的不変性を維持するための負の強化戦略を提案した。
提案アルゴリズムは,大量の擬似データと対応するラベルを含む合成SIRST-5Kデータセットを生成する。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
本手法は他のSOTA法と比較して,検出確率 (Pd), 偽アラーム率 (Fa), 結合の交叉率 (IoU) の点で優れた性能を発揮する。
関連論文リスト
- Unleashing the Power of Generic Segmentation Models: A Simple Baseline for Infrared Small Target Detection [57.666055329221194]
本稿では,Segment Anything Model (SAM) などのジェネリックセグメンテーションモデルの赤外線小物体検出タスクへの適応について検討する。
提案モデルでは,既存の手法と比較して,精度とスループットの両方で性能が大幅に向上した。
論文 参考訳(メタデータ) (2024-09-07T05:31:24Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - Mitigate Target-level Insensitivity of Infrared Small Target Detection
via Posterior Distribution Modeling [5.248337726304453]
Infrared Small Target Detection (IRSTD) は、赤外線クラッタ背景から小さなターゲットを分離することを目的としている。
マスク後部分布モデルを用いて画素レベルの判別を補正する赤外線小ターゲット検出のための拡散モデルフレームワークを提案する。
実験により,提案手法は, NUAA-SIRST, IRSTD-1k, NUDT-SIRSTデータセット上での最先端手法と競合する性能向上を実現することを示した。
論文 参考訳(メタデータ) (2024-03-13T09:45:30Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - Improved Dense Nested Attention Network Based on Transformer for
Infrared Small Target Detection [8.388564430699155]
深層学習に基づく赤外線小ターゲット検出は、複雑な背景と動的背景から小さなターゲットを分離する際、独特な利点をもたらす。
畳み込みニューラルネットワーク(CNN)の深さが増加するにつれて、赤外線小ターゲットの特徴は徐々に弱まる。
本稿では,トランスアーキテクチャに基づく高密度ネストアテンションネットワーク (IDNANet) を提案する。
論文 参考訳(メタデータ) (2023-11-15T07:29:24Z) - Tensor Factorization for Leveraging Cross-Modal Knowledge in
Data-Constrained Infrared Object Detection [22.60228799622782]
赤外線画像における物体検出のボトルネックは、十分なラベル付きトレーニングデータがないことである。
我々は、RGBモードにおけるモデル性能を保ちながら、RGBモードからオブジェクト検出器をIRモードにスケールするために、RGBモードからの手がかりを活用しようとしている。
まず、これらの因子行列をRGBモードで事前トレーニングし、多くのトレーニングデータが存在すると仮定した後、IRモードでトレーニングするためのトレーニング可能なパラメータをわずかに増やして過度な適合を避ける。
論文 参考訳(メタデータ) (2023-09-28T16:55:52Z) - ABC: Attention with Bilinear Correlation for Infrared Small Target
Detection [4.7379300868029395]
CNNに基づく深層学習法は、赤外線小ターゲット(IRST)のセグメンテーションに有効ではない
バイリニア相関(ABC)を用いた注目モデルを提案する。
ABCはトランスアーキテクチャに基づいており、特徴抽出と融合のための新しいアテンション機構を備えた畳み込み線形核融合トランス (CLFT) モジュールを含んでいる。
論文 参考訳(メタデータ) (2023-03-18T03:47:06Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Learning Selective Mutual Attention and Contrast for RGB-D Saliency
Detection [145.4919781325014]
クロスモーダル情報を効果的に融合する方法は、RGB-Dの有能な物体検出の鍵となる問題である。
多くのモデルは特徴融合戦略を用いるが、低次点対点融合法によって制限されている。
本研究では,異なるモダリティから注目とコンテキストを融合させることにより,新たな相互注意モデルを提案する。
論文 参考訳(メタデータ) (2020-10-12T08:50:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。