論文の概要: Graph Embedding with Mel-spectrograms for Underwater Acoustic Target Recognition
- arxiv url: http://arxiv.org/abs/2512.11545v1
- Date: Fri, 12 Dec 2025 13:25:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.780611
- Title: Graph Embedding with Mel-spectrograms for Underwater Acoustic Target Recognition
- Title(参考訳): 水中音響目標認識のためのメル・スペクトログラムグラフ埋め込み
- Authors: Sheng Feng, Shuqing Ma, Xiaoqian Zhu,
- Abstract要約: UATR-GTransformerは、Transformerアーキテクチャとグラフニューラルネットワーク(GNN)を統合する非ユークリッドディープラーニングモデルである。
提案モデルでは, 海洋工学への応用の可能性を強調し, 周波数領域情報を効果的に抽出する。
UATR-GTransformerが最先端の手法と競合する性能を実現することを示す。
- 参考スコア(独自算出の注目度): 3.4185611249587278
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Underwater acoustic target recognition (UATR) is extremely challenging due to the complexity of ship-radiated noise and the variability of ocean environments. Although deep learning (DL) approaches have achieved promising results, most existing models implicitly assume that underwater acoustic data lie in a Euclidean space. This assumption, however, is unsuitable for the inherently complex topology of underwater acoustic signals, which exhibit non-stationary, non-Gaussian, and nonlinear characteristics. To overcome this limitation, this paper proposes the UATR-GTransformer, a non-Euclidean DL model that integrates Transformer architectures with graph neural networks (GNNs). The model comprises three key components: a Mel patchify block, a GTransformer block, and a classification head. The Mel patchify block partitions the Mel-spectrogram into overlapping patches, while the GTransformer block employs a Transformer Encoder to capture mutual information between split patches to generate Mel-graph embeddings. Subsequently, a GNN enhances these embeddings by modeling local neighborhood relationships, and a feed-forward network (FFN) further performs feature transformation. Experiments results based on two widely used benchmark datasets demonstrate that the UATR-GTransformer achieves performance competitive with state-of-the-art methods. In addition, interpretability analysis reveals that the proposed model effectively extracts rich frequency-domain information, highlighting its potential for applications in ocean engineering.
- Abstract(参考訳): 水中音響目標認識(UATR)は、船舶放射音の複雑さと海洋環境の変動が原因で極めて困難である。
深層学習(DL)アプローチは有望な結果を得たが、既存のほとんどのモデルは、水中音響データがユークリッド空間にあることを暗黙的に仮定している。
しかし、この仮定は、非定常、非ガウス的、非線形特性を示す水中音響信号の本質的に複雑なトポロジーには適さない。
本稿では,この制限を克服するために,Transformerアーキテクチャとグラフニューラルネットワーク(GNN)を統合した非ユークリッドDLモデルであるUATR-GTransformerを提案する。
モデルは、メルパッチーフィケーションブロック、GTransformerブロック、および分類ヘッドの3つのキーコンポーネントから構成される。
Mel patchifyブロックはMel-spectrogramをオーバーラップパッチに分割し、GTransformerブロックはTransformer Encoderを使用して分割パッチ間の相互情報をキャプチャし、Mel-graph埋め込みを生成する。
その後、GNNは局所的な近傍関係をモデル化してこれらの埋め込みを強化し、フィードフォワードネットワーク(FFN)はさらに特徴変換を行う。
UATR-GTransformerが最先端の手法と競合する性能を実現していることを示す。
さらに, 解釈可能性解析により, 提案モデルが豊富な周波数領域情報を効果的に抽出し, 海洋工学への応用の可能性を明らかにする。
関連論文リスト
- WaveMAE: Wavelet decomposition Masked Auto-Encoder for Remote Sensing [5.65492058135409]
WaveMAEはマルチスペクトル衛星画像に適したマスク付き自動符号化フレームワークである。
評価の公平性を確保するため、全ての手法が同じデータセット上で事前訓練される(fMoW-S2)。
WaveMAEは従来の最先端アプローチよりも一貫した改善を実現している。
論文 参考訳(メタデータ) (2025-10-26T14:45:30Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - Adaptive Control Attention Network for Underwater Acoustic Localization and Domain Adaptation [8.017203108408973]
海洋における音源の局所化は、環境の複雑でダイナミックな性質のために難しい課題である。
本研究では,移動音源と受信機の距離を正確に予測するマルチブランチネットワークアーキテクチャを提案する。
提案手法は,SOTA(State-of-the-art)アプローチに類似した設定で優れる。
論文 参考訳(メタデータ) (2025-06-20T18:13:30Z) - Point Cloud Denoising With Fine-Granularity Dynamic Graph Convolutional Networks [58.050130177241186]
ノイズの摂動は、しばしば3次元の点雲を破損させ、表面の再構成、レンダリング、さらなる処理といった下流のタスクを妨げる。
本稿では,GDGCNと呼ばれる粒度動的グラフ畳み込みネットワークについて紹介する。
論文 参考訳(メタデータ) (2024-11-21T14:19:32Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - ASWT-SGNN: Adaptive Spectral Wavelet Transform-based Self-Supervised
Graph Neural Network [20.924559944655392]
本稿では,適応スペクトルウェーブレット変換を用いた自己教師付きグラフニューラルネットワーク(ASWT-SGNN)を提案する。
ASWT-SGNNは高密度スペクトル領域におけるフィルタ関数を正確に近似し、コストの高い固有分解を避ける。
ノード分類タスクにおける最先端モデルに匹敵するパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-10T03:07:42Z) - Degradation-Noise-Aware Deep Unfolding Transformer for Hyperspectral
Image Denoising [9.119226249676501]
ハイパースペクトル画像(HSI)は、帯域幅が狭いため、ノイズが多いことが多い。
HSIデータキューブのノイズを低減するため、モデル駆動型と学習型の両方の復調アルゴリズムが提案されている。
本稿では,これらの問題に対処するDNA-Net(Degradation-Noise-Aware Unfolding Network)を提案する。
論文 参考訳(メタデータ) (2023-05-06T13:28:20Z) - Hierarchical Spherical CNNs with Lifting-based Adaptive Wavelets for
Pooling and Unpooling [101.72318949104627]
本稿では, 階層型畳み込みニューラルネットワーク(HS-CNN)の新たな枠組みを提案し, プールやアンプールのための適応球面ウェーブレットを学習する。
LiftHS-CNNは、画像レベルのタスクとピクセルレベルのタスクの両方において、より効率的な階層的特徴学習を実現する。
論文 参考訳(メタデータ) (2022-05-31T07:23:42Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。