論文の概要: Acoustic Classification of Maritime Vessels using Learnable Filterbanks
- arxiv url: http://arxiv.org/abs/2505.23964v1
- Date: Thu, 29 May 2025 19:41:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.642552
- Title: Acoustic Classification of Maritime Vessels using Learnable Filterbanks
- Title(参考訳): 学習可能なフィルタバンクを用いた船舶の音響分類
- Authors: Jonas Elsborg, Tejs Vegge, Arghya Bhowmik,
- Abstract要約: 異なる記録シナリオにまたがって頑健な性能を有するディープラーニングモデルを提案する。
我々のモデルであるCATFISHは、ジョージア海峡のVTUADハイドロフォン記録に基づいて、最先端の96.63パーセントのテスト精度を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliably monitoring and recognizing maritime vessels based on acoustic signatures is complicated by the variability of different recording scenarios. A robust classification framework must be able to generalize across diverse acoustic environments and variable source-sensor distances. To this end, we present a deep learning model with robust performance across different recording scenarios. Using a trainable spectral front-end and temporal feature encoder to learn a Gabor filterbank, the model can dynamically emphasize different frequency components. Trained on the VTUAD hydrophone recordings from the Strait of Georgia, our model, CATFISH, achieves a state-of-the-art 96.63 % percent test accuracy across varying source-sensor distances, surpassing the previous benchmark by over 12 percentage points. We present the model, justify our architectural choices, analyze the learned Gabor filters, and perform ablation studies on sensor data fusion and attention-based pooling.
- Abstract(参考訳): 音響的シグネチャに基づく海上船舶の信頼性の確認は、異なる記録シナリオのばらつきによって複雑になる。
頑健な分類フレームワークは、様々な音響環境と可変音源センサ距離をまたいで一般化できなければならない。
この目的のために,様々な録音シナリオにまたがる堅牢な性能を有するディープラーニングモデルを提案する。
トレーニング可能なスペクトルフロントエンドと時間的特徴エンコーダを使用して、Gaborフィルタバンクを学習すると、モデルは異なる周波数成分を動的に強調することができる。
我々のモデルであるCATFISHは、ジョージア海峡のVTUADハイドロフォン記録に基づいて、様々なソースセンサー距離で96.63パーセントのテスト精度を達成し、前回のベンチマークを12%以上上回った。
本稿では,このモデルを提示し,アーキテクチャ上の選択を正当化し,学習したGaborフィルタを分析し,センサデータ融合とアテンションベースプールに関するアブレーション研究を行う。
関連論文リスト
- AquaSignal: An Integrated Framework for Robust Underwater Acoustic Analysis [0.0]
AquaSignalは、水中音響信号の事前処理、復調、分類、新規検出のためのモジュール式でスケーラブルなパイプラインである。
システムは、DeepshipとOcean Networks Canada (ONC)ベンチマークの合計データセットで評価される。
論文 参考訳(メタデータ) (2025-05-20T12:35:43Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth [0.0]
本稿では,Score-CAMをベースとした新しいデノイザを開発し,ノイズスペクトルデータからオブジェクトのシグネチャを抽出する。
特に,本論文では,スペクトルトレーニングデータの学習と生成のための,新たな生成逆ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-28T21:40:46Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Adaptive ship-radiated noise recognition with learnable fine-grained
wavelet transform [25.887932248706218]
本稿では,適応型一般化認識システム AGNet を提案する。
固定ウェーブレットパラメータをきめ細かな学習可能なパラメータに変換することにより、AGNetは異なる周波数で水中音の特性を学習する。
実験の結果、AGNetは水中音響データセットのベースライン法を全て上回っていることがわかった。
論文 参考訳(メタデータ) (2023-05-31T06:56:01Z) - Interpretable Acoustic Representation Learning on Breathing and Speech
Signals for COVID-19 Detection [37.01066509527848]
本稿では,新型コロナウイルス検出作業における音声信号の表現学習のアプローチについて述べる。
生音声サンプルは、コサイン変調ガウス関数としてパラメータ化される1次元畳み込みフィルタのバンクで処理される。
フィルタされた出力は、プールされ、ログ圧縮され、自己アテンションベースの関連重み付け機構で使用される。
論文 参考訳(メタデータ) (2022-06-27T15:20:51Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - From Sound Representation to Model Robustness [82.21746840893658]
本研究では, 環境音の標準的な表現(スペクトログラム)が, 被害者の残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
3つの環境音響データセットの様々な実験から、ResNet-18モデルは、他のディープラーニングアーキテクチャよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:30:49Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。