論文の概要: DEMONet: Underwater Acoustic Target Recognition based on Multi-Expert Network and Cross-Temporal Variational Autoencoder
- arxiv url: http://arxiv.org/abs/2411.02758v1
- Date: Tue, 05 Nov 2024 03:04:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-06 14:58:10.980056
- Title: DEMONet: Underwater Acoustic Target Recognition based on Multi-Expert Network and Cross-Temporal Variational Autoencoder
- Title(参考訳): DEMONet:マルチエキスパートネットワークと時間変動オートエンコーダに基づく水中音響目標認識
- Authors: Yuan Xie, Xiaowei Zhang, Jiawei Ren, Ji Xu,
- Abstract要約: 複雑な水中環境のため、実世界のシナリオで堅牢な水中音響認識システムを構築することは困難である。
ノイズの封筒変調(DEMON)を検出することで,ターゲットのシャフト周波数やブレード数に対するロバストな洞察を提供するDEMONetを提案する。
DEMON特徴量におけるノイズとスプリアス変調スペクトルを緩和するために、時間的アライメント戦略を導入し、ノイズ耐性のDEMONスペクトルを再構成して生のDEMON特徴量を置き換えるために可変オートエンコーダ(VAE)を用いる。
- 参考スコア(独自算出の注目度): 22.271499386492533
- License:
- Abstract: Building a robust underwater acoustic recognition system in real-world scenarios is challenging due to the complex underwater environment and the dynamic motion states of targets. A promising optimization approach is to leverage the intrinsic physical characteristics of targets, which remain invariable regardless of environmental conditions, to provide robust insights. However, our study reveals that while physical characteristics exhibit robust properties, they may lack class-specific discriminative patterns. Consequently, directly incorporating physical characteristics into model training can potentially introduce unintended inductive biases, leading to performance degradation. To utilize the benefits of physical characteristics while mitigating possible detrimental effects, we propose DEMONet in this study, which utilizes the detection of envelope modulation on noise (DEMON) to provide robust insights into the shaft frequency or blade counts of targets. DEMONet is a multi-expert network that allocates various underwater signals to their best-matched expert layer based on DEMON spectra for fine-grained signal processing. Thereinto, DEMON spectra are solely responsible for providing implicit physical characteristics without establishing a mapping relationship with the target category. Furthermore, to mitigate noise and spurious modulation spectra in DEMON features, we introduce a cross-temporal alignment strategy and employ a variational autoencoder (VAE) to reconstruct noise-resistant DEMON spectra to replace the raw DEMON features. The effectiveness of the proposed DEMONet with cross-temporal VAE was primarily evaluated on the DeepShip dataset and our proprietary datasets. Experimental results demonstrated that our approach could achieve state-of-the-art performance on both datasets.
- Abstract(参考訳): 実世界のシナリオで頑健な水中音響認識システムを構築することは、複雑な水中環境とターゲットの動的運動状態のために困難である。
有望な最適化アプローチは、環境条件によらず変化しないターゲットの固有の物理的特性を活用し、堅牢な洞察を提供することである。
しかし,本研究では, 物理的特徴が頑健な特性を示す一方で, クラス固有の識別パターンが欠如していることが判明した。
したがって、物理的特性を直接モデルトレーニングに組み込むことは、意図しない帰納的バイアスを生じさせ、パフォーマンスを低下させる可能性がある。
そこで本研究では,ノイズの包絡変調を検出することで,ターゲットの軸周波数やブレード数に対するロバストな洞察を提供するDemonetを提案する。
DEMONetはマルチエキスパートネットワークであり、詳細な信号処理のためにDEMONスペクトルに基づいて、最も整合した専門家層に様々な水中信号を割り当てる。
現在、DEMONスペクトルは対象カテゴリとのマッピング関係を確立することなく、暗黙の物理的特徴を提供する責任のみを負っている。
さらに,Demon特徴量における雑音及び刺激スペクトルの緩和を目的として,時間的アライメント戦略を導入し,ノイズ耐性Demonスペクトルを再構成して生のDemon特徴量を置き換えるために可変オートエンコーダ(VAE)を用いる。
提案手法の有効性を,DeepShipデータセットと独自のデータセットを用いて評価した。
実験により,両データセットの最先端性能が得られた。
関連論文リスト
- Revisiting Acoustic Features for Robust ASR [25.687120601256787]
生物学的聴覚知覚に触発された音響特性を発達させる先行研究のアプローチを再考する。
本研究では、周波数マスキングと側方抑制の神経心理学的現象をシミュレートするために、周波数マスキング分光法(FreqMask)とガンマトン分光法(DoGSpec)の相違という2つの新しい音響特性を提案する。
論文 参考訳(メタデータ) (2024-09-24T18:58:23Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Hyperspectral Image Denoising via Self-Modulating Convolutional Neural
Networks [15.700048595212051]
相関スペクトルと空間情報を利用した自己変調畳み込みニューラルネットワークを提案する。
モデルの中心には新しいブロックがあり、隣り合うスペクトルデータに基づいて、ネットワークが適応的に特徴を変換することができる。
合成データと実データの両方の実験解析により,提案したSM-CNNは,他の最先端HSI復調法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-09-15T06:57:43Z) - DGSD: Dynamical Graph Self-Distillation for EEG-Based Auditory Spatial
Attention Detection [49.196182908826565]
AAD(Auditory Attention Detection)は、マルチスピーカー環境で脳信号からターゲット話者を検出することを目的としている。
現在のアプローチは主に、画像のようなユークリッドデータを処理するために設計された従来の畳み込みニューラルネットワークに依存している。
本稿では、入力として音声刺激を必要としないAADのための動的グラフ自己蒸留(DGSD)手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T13:43:46Z) - AMSP-UOD: When Vortex Convolution and Stochastic Perturbation Meet
Underwater Object Detection [40.532331552038485]
AMSP-UOD(Amplitude-Modulated Perturbation and Vortex Convolutional Network)を提案する。
AMSP-UODは複雑な水中環境における非理想的撮像因子が検出精度に与える影響に対処する。
提案手法は,既存の最先端手法よりも精度とノイズ免疫の点で優れる。
論文 参考訳(メタデータ) (2023-08-23T05:03:45Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Underwater Acoustic Target Recognition based on Smoothness-inducing Regularization and Spectrogram-based Data Augmentation [21.327653766608805]
不十分なデータは、複雑なモデリングをサポートする認識システムの能力を阻害する可能性がある。
限られたデータの場合,モデルの一般化能力を高めるための2つの戦略を提案する。
論文 参考訳(メタデータ) (2023-06-12T08:26:47Z) - Object recognition in atmospheric turbulence scenes [2.657505380055164]
乱流環境におけるオブジェクトの型を検知・分類するための歪み特徴を学習する新しいフレームワークを提案する。
具体的には、変形可能な畳み込みを利用して空間変位を処理する。
提案手法は平均精度(mAP)が30%を超えるベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-25T20:21:25Z) - EEGminer: Discovering Interpretable Features of Brain Activity with
Learnable Filters [72.19032452642728]
本稿では,学習可能なフィルタと事前決定された特徴抽出モジュールからなる新しい識別可能なEEGデコーディングパイプラインを提案する。
我々は,SEEDデータセットおよび前例のない大きさの新たな脳波データセット上で,脳波信号からの感情認識に向けたモデルの有用性を実証する。
発見された特徴は、以前の神経科学の研究と一致し、音楽聴取中の左右の時間領域間の機能的接続プロファイルの顕著な相違など、新たな洞察を提供する。
論文 参考訳(メタデータ) (2021-10-19T14:22:04Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。