論文の概要: Temporal Micro-Doppler Spectrogram-based ViT Multiclass Target Classification
- arxiv url: http://arxiv.org/abs/2511.11951v1
- Date: Fri, 14 Nov 2025 23:53:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.41813
- Title: Temporal Micro-Doppler Spectrogram-based ViT Multiclass Target Classification
- Title(参考訳): 時間マイクロドップラースペクトログラムに基づくViTマルチクラスターゲット分類
- Authors: Nghia Thinh Nguyen, Tri Nhu Do,
- Abstract要約: ミリ波FMCWレーダスペクトログラムを用いたマルチクラスターゲット分類のための新しいテンポラルMDS-Vision Transformer(T-MDS-T)を提案する。
具体的には、パッチ埋め込みとクロス軸アテンション機構を用いて、スタック化されたレンジ速度テンソルを処理するトランスフォーマーベースのアーキテクチャを設計する。
提案手法は,データ効率とリアルタイムのデプロイ性を向上しつつ,分類精度の点で既存のCNN手法よりも優れている。
- 参考スコア(独自算出の注目度): 2.165723322157105
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we propose a new Temporal MDS-Vision Transformer (T-MDS-ViT) for multiclass target classification using millimeter-wave FMCW radar micro-Doppler spectrograms. Specifically, we design a transformer-based architecture that processes stacked range-velocity-angle (RVA) spatiotemporal tensors via patch embeddings and cross-axis attention mechanisms to explicitly model the sequential nature of MDS data across multiple frames. The T-MDS-ViT exploits mobility-aware constraints in its attention layer correspondences to maintain separability under target overlaps and partial occlusions. Next, we apply an explainable mechanism to examine how the attention layers focus on characteristic high-energy regions of the MDS representations and their effect on class-specific kinematic features. We also demonstrate that our proposed framework is superior to existing CNN-based methods in terms of classification accuracy while achieving better data efficiency and real-time deployability.
- Abstract(参考訳): 本稿では、ミリ波FMCWレーダマイクロドップラー分光器を用いたマルチクラスターゲット分類のための新しいテンポラルMDS-Vision Transformer(T-MDS-ViT)を提案する。
具体的には,複数のフレームにまたがるMDSデータのシーケンシャルな性質を明示的にモデル化するために,パッチ埋め込みとクロス軸アテンション機構を用いて,スタックドレンジ速度角(RVA)時空間テンソルを処理するトランスフォーマーアーキテクチャを設計する。
T-MDS-ViTは、注意層対応におけるモビリティに配慮した制約を利用して、ターゲット重なり合いや部分閉塞下での分離性を維持する。
次に、注意層がMDS表現の特徴的高エネルギー領域にどのように焦点をあてるか、クラス固有の運動特性にどのように影響するかを説明するための説明可能なメカニズムを適用した。
また,提案手法は,データ効率とリアルタイムのデプロイ性の向上を図りながら,分類精度の点で既存のCNN手法よりも優れていることを示す。
関連論文リスト
- DAMS:Dual-Branch Adaptive Multiscale Spatiotemporal Framework for Video Anomaly Detection [7.117824587276951]
この研究は、マルチレベル特徴とデカップリング融合に基づくDual-Branch Adaptive Multiscale Stemporal Framework (DAMS)と呼ばれるデュアルパスアーキテクチャを提供する。
主処理経路は、適応型マルチスケール時間ピラミッドネットワーク(AMTPN)と畳み込みブロック注意機構(CBAM)を統合している。
論文 参考訳(メタデータ) (2025-07-28T08:42:00Z) - Dual-Domain Masked Image Modeling: A Self-Supervised Pretraining Strategy Using Spatial and Frequency Domain Masking for Hyperspectral Data [35.34526230299484]
本稿では,ラベルなしデータの大部分を利用するハイパースペクトルデータに対する自己教師付き事前学習戦略を提案する。
本稿では,空間領域と周波数領域の両方で動作する新しい二重ドメインマスキング機構を提案する。
提案手法を3つの公開HSI分類ベンチマークで評価し,現状の性能を実証した。
論文 参考訳(メタデータ) (2025-05-06T06:24:21Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - Spatial-Spectral Diffusion Contrastive Representation Network for Hyperspectral Image Classification [8.600534616819333]
本稿では,空間スペクトル拡散コントラスト表現ネットワーク(DiffCRN)を提案する。
DiffCRNは、高スペクトル画像分類のための拡散確率モデル(DDPM)とコントラスト学習(CL)の組み合わせに基づく。
広く使われている4つのHSIデータセットを用いて実験を行い、提案したDiffCRNの性能改善を実証した。
論文 参考訳(メタデータ) (2025-02-27T02:34:23Z) - ViTs for SITS: Vision Transformers for Satellite Image Time Series [52.012084080257544]
ビジョン変換器(ViT)に基づく一般衛星画像時系列(SITS)処理のための完全アテンショナルモデルを提案する。
TSViTはSITSレコードを空間と時間で重複しないパッチに分割し、トークン化し、分解されたテンポロ空間エンコーダで処理する。
論文 参考訳(メタデータ) (2023-01-12T11:33:07Z) - SatMAE: Pre-training Transformers for Temporal and Multi-Spectral
Satellite Imagery [74.82821342249039]
Masked Autoencoder(MAE)に基づく時間・マルチスペクトル衛星画像の事前学習フレームワークであるSatMAEについて述べる。
時間的情報を活用するために、時間にわたって画像パッチを個別にマスキングする時間的埋め込みを含む。
論文 参考訳(メタデータ) (2022-07-17T01:35:29Z) - Mask-guided Spectral-wise Transformer for Efficient Hyperspectral Image
Reconstruction [127.20208645280438]
ハイパースペクトル画像(HSI)再構成は、2次元計測から3次元空間スペクトル信号を復元することを目的としている。
スペクトル間相互作用のモデル化は、HSI再構成に有用である。
Mask-guided Spectral-wise Transformer (MST) は,HSI再構成のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-15T16:59:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。