論文の概要: Dynamic Background Reconstruction via Transformer for Infrared Small
Target Detection
- arxiv url: http://arxiv.org/abs/2301.04497v1
- Date: Wed, 11 Jan 2023 14:45:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 17:04:02.746241
- Title: Dynamic Background Reconstruction via Transformer for Infrared Small
Target Detection
- Title(参考訳): 赤外線小目標検出用変圧器による動的背景復元
- Authors: Jingchao Peng, Haitao Zhao, Zhengwei Hu, Kaijie Zhao, Zhongze Wang
- Abstract要約: 本稿では,動的背景再構成(DBR)と呼ばれる背景再構成に基づくISTD手法を提案する。
実験の結果、DBRは2つのISTDデータセット、MFIRST(64.10%)とSIRST(75.01%)で最高のF1スコアを達成することが示された。
- 参考スコア(独自算出の注目度): 0.6165605009782557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small target detection (ISTD) under complex backgrounds is a
difficult problem, for the differences between targets and backgrounds are not
easy to distinguish. Background reconstruction is one of the methods to deal
with this problem. This paper proposes an ISTD method based on background
reconstruction called Dynamic Background Reconstruction (DBR). DBR consists of
three modules: a dynamic shift window module (DSW), a background reconstruction
module (BR), and a detection head (DH). BR takes advantage of Vision
Transformers in reconstructing missing patches and adopts a grid masking
strategy with a masking ratio of 50\% to reconstruct clean backgrounds without
targets. To avoid dividing one target into two neighboring patches, resulting
in reconstructing failure, DSW is performed before input embedding. DSW
calculates offsets, according to which infrared images dynamically shift. To
reduce False Positive (FP) cases caused by regarding reconstruction errors as
targets, DH utilizes a structure of densely connected Transformer to further
improve the detection performance. Experimental results show that DBR achieves
the best F1-score on the two ISTD datasets, MFIRST (64.10\%) and SIRST
(75.01\%).
- Abstract(参考訳): 複雑な背景下での赤外線小目標検出(ISTD)は、ターゲットと背景の違いが区別しにくいため、難しい問題である。
背景復元はこの問題に対処する方法の1つである。
本稿では,動的背景再構成(DBR)と呼ばれる背景再構成に基づくISTD手法を提案する。
DBRは動的シフトウィンドウモジュール(DSW)、バックグラウンド再構築モジュール(BR)、検出ヘッド(DH)の3つのモジュールで構成される。
brは欠落したパッチの再構築に視覚トランスフォーマーを利用し、ターゲットなしでクリーンな背景を再構築するために50\%のマスキング率でグリッドマスキング戦略を採用している。
1つのターゲットを2つの隣り合うパッチに分割するのを避けるために、入力埋め込みの前にdswを行う。
DSWはオフセットを計算し、赤外線画像は動的にシフトする。
再建誤差を目標とする偽陽性(FP)のケースを低減するため,DHは密結合トランスフォーマの構造を用いて検出性能をさらに向上する。
実験の結果、dbrはmfirst (64.10\%)とsirst (75.01\%)の2つのistdデータセットで最高のf1-scoreを達成した。
関連論文リスト
- Sparse Prior Is Not All You Need: When Differential Directionality Meets Saliency Coherence for Infrared Small Target Detection [15.605122893098981]
本研究では,Sparse Differential Directionality prior (SDD)フレームワークを提案する。
我々は、ターゲットの異なる方向特性を活用して、それらを背景と区別する。
さらに、サリエンシ・コヒーレンス・ストラテジーにより、目標検出性をさらに強化する。
近似交互最小化法(PAM)アルゴリズムは,提案したモデルを効率的に解く。
論文 参考訳(メタデータ) (2024-07-22T04:32:43Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Reti-Diff: Illumination Degradation Image Restoration with Retinex-based
Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。
これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。
我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。
Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文 参考訳(メタデータ) (2023-11-20T09:55:06Z) - RPCANet: Deep Unfolding RPCA Based Infrared Small Target Detection [10.202639589226076]
この研究は、RPCANetと呼ばれる赤外線ディムターゲットを検出するための解釈可能なディープネットワークを提案する。
提案手法では, ISTDタスクをスパースターゲット抽出, 低ランク背景推定, 画像再構成として定式化する。
反復最適化の更新ステップをディープラーニングフレームワークに展開することにより、時間を要する複雑な行列計算を理論誘導ニューラルネットワークに置き換える。
論文 参考訳(メタデータ) (2023-11-02T01:21:12Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Enhancing Infrared Small Target Detection Robustness with Bi-Level
Adversarial Framework [61.34862133870934]
本稿では,異なる汚職の存在下での検出の堅牢性を促進するために,二段階の対向的枠組みを提案する。
我々の手法は広範囲の汚職で21.96%のIOUを著しく改善し、特に一般ベンチマークで4.97%のIOUを推進している。
論文 参考訳(メタデータ) (2023-09-03T06:35:07Z) - Reconstruction-driven Dynamic Refinement based Unsupervised Domain
Adaptation for Joint Optic Disc and Cup Segmentation [25.750583118977833]
緑内障は可逆性失明の主要な原因の1つである。
OD/OCセグメンテーションモデルをトレーニングすることは依然として難しい。
本稿ではリコンストラクション駆動動的リファインメントネットワーク(RDR-Net)と呼ばれる新しい非教師なし領域適応(UDA)手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T13:33:13Z) - DFTR: Depth-supervised Hierarchical Feature Fusion Transformer for
Salient Object Detection [44.94166578314837]
我々は、純粋なトランスフォーマーベースのSODフレームワーク、すなわち、Depth-supervised Hierarchical Feature Fusion TRansformer (DFTR)を提案する。
我々は,提案したDFTRを10個のベンチマークデータセット上で広範囲に評価し,実験結果から,既存のRGBおよびRGB-D SODタスクにおいて,DFTRが従来手法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2022-03-12T12:59:12Z) - Total Scale: Face-to-Body Detail Reconstruction from Sparse RGBD Sensors [52.38220261632204]
PIFuをベースとした再建術では, 顔面の平坦化が頻発する。
再建した顔のディテールの質を高めるために,2段階のPIFu表現を提案する。
顔の鮮明な細部と身体形状の変形におけるアプローチの有効性を実験的に検証した。
論文 参考訳(メタデータ) (2021-12-03T18:46:49Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。