Fugu-MT 論文翻訳(概要): Studying the Effects of Self-Attention on SAR Automatic Target Recognition

論文の概要: Studying the Effects of Self-Attention on SAR Automatic Target Recognition

arxiv url: http://arxiv.org/abs/2409.00473v1
Date: Sat, 31 Aug 2024 15:04:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-06 14:39:09.409040
Title: Studying the Effects of Self-Attention on SAR Automatic Target Recognition
Title（参考訳）: SAR自動目標認識における自己注意の効果の検討
Authors: Jacob Fein-Ashley, Rajgopal Kannan, Viktor Prasanna,
Abstract要約: 我々は、注目モジュールがトップ1の精度を高め、入力の堅牢性を向上し、MSTARデータセットで定性的に説明可能であることを示す。我々は、注目モジュールがトップ1の精度を高め、入力の堅牢性を向上し、MSTARデータセットで定性的に説明可能であることを示す。
参考スコア（独自算出の注目度）: 2.404163279345609
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Attention mechanisms are critically important in the advancement of synthetic aperture radar (SAR) automatic target recognition (ATR) systems. Traditional SAR ATR models often struggle with the noisy nature of the SAR data, frequently learning from background noise rather than the most relevant image features. Attention mechanisms address this limitation by focusing on crucial image components, such as the shadows and small parts of a vehicle, which are crucial for accurate target classification. By dynamically prioritizing these significant features, attention-based models can efficiently characterize the entire image with a few pixels, thus enhancing recognition performance. This capability allows for the discrimination of targets from background clutter, leading to more practical and robust SAR ATR models. We show that attention modules increase top-1 accuracy, improve input robustness, and are qualitatively more explainable on the MSTAR dataset.
Abstract（参考訳）: 注意機構は合成開口レーダ(SAR)自動目標認識(ATR)システムの発展において極めて重要である。従来のSAR ATRモデルは、最も関連性の高い画像の特徴ではなく、背景ノイズから学習することが多い。注意機構は、正確な目標分類に不可欠である車両の影や小さな部分のような重要な画像成分に焦点を当てることによって、この制限に対処する。これらの重要な特徴を動的に優先順位付けすることにより、注意に基づくモデルは、画像全体を数ピクセルで効率よく特徴付けることができ、認識性能が向上する。この能力は、背景の乱雑からターゲットを識別することができ、より実用的で堅牢なSAR ATRモデルをもたらす。我々は、注目モジュールがトップ1の精度を高め、入力の堅牢性を向上し、MSTARデータセットで定性的に説明可能であることを示す。

関連論文リスト

Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文参考訳（メタデータ） (2025-09-21T02:45:07Z)
Integrated Image Reconstruction and Target Recognition based on Deep Learning Technique [3.3410072288157155]
Att-ClassiGAN は,従来の CMI アプローチと比較して,再建時間を大幅に短縮する。改良された正規化平均二乗誤差(NMSE)、より高い構造類似度指数(SSIM)、再建対象に対するより良い分類結果を提供する。
論文参考訳（メタデータ） (2025-05-07T22:34:32Z)
SAR-W-MixMAE: SAR Foundation Model Training Using Backscatter Power Weighting [3.618534280726541]
マスク付きオートエンコーダ(MAE)などの基礎モデルアプローチや、そのバリエーションが衛星画像に適用されている。セマンティックラベリングによるデータセット作成の困難さと光学画像に対する高ノイズコンテントのため、SAR(Synthetic Aperture Radar)データは基礎モデルの分野ではあまり研究されていない。本研究では,マスク付きオートエンコーダ,特にSentinel-1 SAR画像上のMixMAEとそのSAR画像分類タスクへの影響について検討した。
論文参考訳（メタデータ） (2025-03-03T05:09:44Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Hierarchical Information Flow for Generalized Efficient Image Restoration [108.83750852785582]
画像復元のための階層型情報フロー機構であるHi-IRを提案する。 Hi-IRは、劣化した画像を表す階層的な情報ツリーを3段階にわたって構築する。 7つの共通画像復元タスクにおいて、Hi-IRはその有効性と一般化性を達成する。
論文参考訳（メタデータ） (2024-11-27T18:30:08Z)
Towards SAR Automatic Target Recognition MultiCategory SAR Image Classification Based on Light Weight Vision Transformer [11.983317593939688]
本稿では,SAR画像の分類に軽量な視覚変換器モデルを適用しようとする。構造全体がオープンアクセスされたSARデータセットによって検証された。
論文参考訳（メタデータ） (2024-05-18T11:24:52Z)
OCR is All you need: Importing Multi-Modality into Image-based Defect Detection System [7.1083241462091165]
我々は,光学的文字認識(OCR)を基本とする外部モダリティ誘導データマイニングフレームワークを導入し,画像から統計的特徴を抽出する。提案手法の重要な側面は、単一のモーダル認識モデルを用いて抽出された外部モーダル特徴のアライメントであり、畳み込みニューラルネットワークによって符号化された画像特徴である。本手法は欠陥検出モデルのリコール率を大幅に向上させ,挑戦シナリオにおいても高い堅牢性を維持する。
論文参考訳（メタデータ） (2024-03-18T07:41:39Z)
Interpreting and Improving Attention From the Perspective of Large Kernel Convolution [51.06461246235176]
本稿では,LKCA(Large Kernel Convolutional Attention)について紹介する。 LKCAは、特にデータ制約のある設定において、様々な視覚的タスク間での競合性能を達成する。
論文参考訳（メタデータ） (2024-01-11T08:40:35Z)
ROSE: A Recognition-Oriented Speech Enhancement Framework in Air Traffic Control Using Multi-Objective Learning [6.60571587618006]
無線音声エコー(Radio speech echo)は、空気交通制御(ATC)領域において特定の現象であり、音声品質を低下させ、自動音声認識(ASR)の精度に影響を与える。本研究では,時間領域認識指向音声強調フレームワークを提案し,音声認識能力の向上とASR精度の向上を図る。このフレームワークはATCシナリオのプラグイン・アンド・プレイツールとして機能し、ASRモデルのさらなる再トレーニングを必要としない。
論文参考訳（メタデータ） (2023-12-11T04:51:41Z)
Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文参考訳（メタデータ） (2023-11-30T05:15:35Z)
Multi-Modal Domain Fusion for Multi-modal Aerial View Object Classification [4.438928487047433]
マルチモーダルデータから領域不変性を学習するために,新しいマルチモーダルドメイン融合(MDF)ネットワークを提案する。ネットワークはTrack-1で25.3%、Track-2でトップ5で34.26%の精度でトップ10のパフォーマンスを達成した。
論文参考訳（メタデータ） (2022-12-14T05:14:02Z)
CiaoSR: Continuous Implicit Attention-in-Attention Network for Arbitrary-Scale Image Super-Resolution [158.2282163651066]
本稿ではCiaoSRと呼ばれる連続的な暗黙の注意-注意ネットワークを提案する。我々は、周辺地域の特徴のアンサンブル重みを学習するために、暗黙の注意ネットワークを明示的に設計する。我々は、この暗黙の注意ネットワークにスケールアウェアの注意を埋め込んで、追加の非ローカル情報を活用する。
論文参考訳（メタデータ） (2022-12-08T15:57:46Z)
SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文参考訳（メタデータ） (2022-06-09T14:00:26Z)
Learning Efficient Representations for Enhanced Object Detection on Large-scene SAR Images [16.602738933183865]
SAR(Synthetic Aperture Radar)画像のターゲットの検出と認識は難しい問題である。近年開発されたディープラーニングアルゴリズムは,SAR画像の固有の特徴を自動的に学習することができる。本稿では,効率的かつ堅牢なディープラーニングに基づくターゲット検出手法を提案する。
論文参考訳（メタデータ） (2022-01-22T03:25:24Z)
How Knowledge Graph and Attention Help? A Quantitative Analysis into Bag-level Relation Extraction [66.09605613944201]
バッグレベルの関係抽出(RE)における注意と知識グラフの効果を定量的に評価する。その結果,(1)注目精度の向上は,エンティティ参照特徴を抽出するモデルの性能を損なう可能性があること,(2)注目性能は様々なノイズ分布パターンの影響が大きいこと,(3)KG強化された注目はRE性能を向上するが,その効果は注目度を向上させるだけでなく,先行するエンティティを組み込むことによっても改善することがわかった。
論文参考訳（メタデータ） (2021-07-26T09:38:28Z)
PeaceGAN: A GAN-based Multi-Task Learning Method for SAR Target Image Generation with a Pose Estimator and an Auxiliary Classifier [50.17500790309477]
SARターゲット画像生成のための新しいGANベースのマルチタスク学習(MTL)手法であるPeaceGANを提案する。 PeaceGANはポーズ角とターゲットクラス情報の両方を使用し、目的のポーズ角で所望のターゲットクラスのSARターゲット画像を作成することができる。
論文参考訳（メタデータ） (2021-03-29T10:03:09Z)
Automotive Radar Interference Mitigation with Unfolded Robust PCA based on Residual Overcomplete Auto-Encoder Blocks [88.46770122522697]
自律走行では、レーダーシステムは道路上の他の車両のような標的を検出する上で重要な役割を果たす。自動車用レーダー干渉緩和のための深層学習手法は、目標の振幅を確実に推定できるが、それぞれの目標の位相を回復できない。干渉の有無で振幅と位相の両方を推定できる効率的かつ効率的な手法を提案する。
論文参考訳（メタデータ） (2020-10-14T09:41:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。