論文の概要: Passive Underwater Acoustic Signal Separation based on Feature Decoupling Dual-path Network
- arxiv url: http://arxiv.org/abs/2504.08371v1
- Date: Fri, 11 Apr 2025 09:16:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:17:53.863318
- Title: Passive Underwater Acoustic Signal Separation based on Feature Decoupling Dual-path Network
- Title(参考訳): 特徴デカップリングデュアルパスネットワークに基づく受動的水中音響信号分離
- Authors: Yucheng Liu, Longyu Jiang,
- Abstract要約: 本研究では, 二重経路モデルと特徴分離手法を用いて, 船舶の放射音を分離する新しい時間ネットワークを提案する。
ShipsEarとDeepShipデータセットでテストされている。
- 参考スコア(独自算出の注目度): 1.1893676124374688
- License:
- Abstract: Signal separation in the passive underwater acoustic domain has heavily relied on deep learning techniques to isolate ship radiated noise. However, the separation networks commonly used in this domain stem from speech separation applications and may not fully consider the unique aspects of underwater acoustics beforehand, such as the influence of different propagation media, signal frequencies and modulation characteristics. This oversight highlights the need for tailored approaches that account for the specific characteristics of underwater sound propagation. This study introduces a novel temporal network designed to separate ship radiated noise by employing a dual-path model and a feature decoupling approach. The mixed signals' features are transformed into a space where they exhibit greater independence, with each dimension's significance decoupled. Subsequently, a fusion of local and global attention mechanisms is employed in the separation layer. Extensive comparisons showcase the effectiveness of this method when compared to other prevalent network models, as evidenced by its performance in the ShipsEar and DeepShip datasets.
- Abstract(参考訳): 受動的水中音響領域における信号分離は、船舶の放射音を分離する深層学習技術に大きく依存している。
しかし、この領域で一般的に使われている分離ネットワークは、音声分離の応用に起因しており、異なる伝搬媒体の影響、信号周波数、変調特性など、水中音響のユニークな側面を事前に十分に考慮していない可能性がある。
この監視は、水中音波伝搬の特定の特性を考慮に入れた調整されたアプローチの必要性を強調している。
本研究では, 二重経路モデルと特徴分離手法を用いて, 船舶の放射音を分離する新しい時間ネットワークを提案する。
混合信号の特徴はより独立な空間に変換され、それぞれの次元の意義は分離される。
その後、分離層に局所的および大域的注意機構の融合を用いる。
大規模な比較では、ShipsEarとDeepShipデータセットのパフォーマンスが証明されているように、他の一般的なネットワークモデルと比較して、この方法の有効性を示している。
関連論文リスト
- Adaptive ship-radiated noise recognition with learnable fine-grained
wavelet transform [25.887932248706218]
本稿では,適応型一般化認識システム AGNet を提案する。
固定ウェーブレットパラメータをきめ細かな学習可能なパラメータに変換することにより、AGNetは異なる周波数で水中音の特性を学習する。
実験の結果、AGNetは水中音響データセットのベースライン法を全て上回っていることがわかった。
論文 参考訳(メタデータ) (2023-05-31T06:56:01Z) - On Neural Architectures for Deep Learning-based Source Separation of
Co-Channel OFDM Signals [104.11663769306566]
周波数分割多重化(OFDM)信号を含む単一チャネル音源分離問題について検討する。
我々はOFDM構造からの洞察に基づいて、ネットワークパラメータ化に対する重要なドメインインフォームド修正を提案する。
論文 参考訳(メタデータ) (2023-03-11T16:29:13Z) - Data-Driven Blind Synchronization and Interference Rejection for Digital
Communication Signals [98.95383921866096]
本研究では,データ駆動型深層学習手法の可能性について検討した。
本研究では,高分解能時間構造(非定常性)の取得が性能向上につながることを示す。
既製のNNと古典的検出と干渉除去の両方で改善可能なドメインインフォームドニューラルネットワーク(NN)の設計を提案する。
論文 参考訳(メタデータ) (2022-09-11T14:10:37Z) - Simultaneous source separation of unknown numbers of single-channel underwater acoustic signals based on deep neural networks with separator-decoder structure [0.0]
本稿では,可能なターゲットの最大数に等しい一定数の出力チャネルを持つ,深層学習に基づく同時分離ソリューションを提案する。
この解は、目標への出力のアライメントによって引き起こされる置換問題による次元的災害を回避する。
放射音の混合を模擬した実験により, 提案手法は, 既知信号数と同等の分離性能が得られることを示した。
論文 参考訳(メタデータ) (2022-07-24T14:04:34Z) - Implicit Neural Spatial Filtering for Multichannel Source Separation in
the Waveform Domain [131.74762114632404]
モデルはエンドツーエンドで訓練され、空間処理を暗黙的に実行する。
提案したモデルを実世界のデータセット上で評価し,そのモデルがオラクルビームフォーマの性能と一致することを示す。
論文 参考訳(メタデータ) (2022-06-30T17:13:01Z) - Data Fusion for Audiovisual Speaker Localization: Extending Dynamic
Stream Weights to the Spatial Domain [103.3388198420822]
複数の話者の位置を推定することは、自動音声認識や話者ダイアリゼーションなどのタスクに役立ちます。
本稿では,個別の動的ストリーム重みを特定領域に割り当てることにより,話者定位のための新しい音声視覚データ融合フレームワークを提案する。
オーディオ・ヴィジュアル・レコードを用いた性能評価は,全てのベースラインモデルより優れた融合手法により,有望な結果をもたらす。
論文 参考訳(メタデータ) (2021-02-23T09:59:31Z) - On End-to-end Multi-channel Time Domain Speech Separation in Reverberant
Environments [33.79711018198589]
本稿では,残響環境におけるマルチチャンネル時間領域音声分離手法を提案する。
完全な畳み込みニューラルネットワーク構造は、複数のマイク記録から直接音声を分離するために使われてきた。
残響が空間的特徴抽出に与える影響を低減するため, 残響前処理法が適用された。
論文 参考訳(メタデータ) (2020-11-11T18:25:07Z) - Learning Joint Articulatory-Acoustic Representations with Normalizing
Flows [7.183132975698293]
可逆ニューラルネットワークモデルを用いて母音の調音領域と音響領域の結合潜時表現を求める。
提案手法は調音から音響へのマッピングと音響から調音へのマッピングの両方を実現し,両領域の同時符号化の実現に成功していることを示す。
論文 参考訳(メタデータ) (2020-05-16T04:34:36Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。