論文の概要: Decodable but not structured: linear probing enables Underwater Acoustic Target Recognition with pretrained audio embeddings
- arxiv url: http://arxiv.org/abs/2601.08358v1
- Date: Tue, 13 Jan 2026 09:15:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.130991
- Title: Decodable but not structured: linear probing enables Underwater Acoustic Target Recognition with pretrained audio embeddings
- Title(参考訳): 分解性はあるが構造的でない線形探査は、事前訓練されたオーディオ埋め込みによる水中音響目標認識を可能にする
- Authors: Hilde I. Hummel, Sandjai Bhulai, Rob D. van der Mei, Burooj Ghani,
- Abstract要約: 船舶の人為的騒音は水中の音汚染に大きく寄与し、海洋生態系にリスクをもたらす。
パッシブ・アコースティック・モニタリング(PAM)システムはこの目的のために広く展開されており、様々な音環境にまたがる水中記録を何年にもわたって生成している。
水中音響目標自動認識(UATR)の最近の進歩は、ラベル付きデータの不足によって制約される教師あり学習に大きく依存している。
本研究では、UATRにおける転送学習の実証的研究を行い、多様なオーディオ領域から派生した複数の事前学習オーディオモデルを評価する。
- 参考スコア(独自算出の注目度): 1.25052154879199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Increasing levels of anthropogenic noise from ships contribute significantly to underwater sound pollution, posing risks to marine ecosystems. This makes monitoring crucial to understand and quantify the impact of the ship radiated noise. Passive Acoustic Monitoring (PAM) systems are widely deployed for this purpose, generating years of underwater recordings across diverse soundscapes. Manual analysis of such large-scale data is impractical, motivating the need for automated approaches based on machine learning. Recent advances in automatic Underwater Acoustic Target Recognition (UATR) have largely relied on supervised learning, which is constrained by the scarcity of labeled data. Transfer Learning (TL) offers a promising alternative to mitigate this limitation. In this work, we conduct the first empirical comparative study of transfer learning for UATR, evaluating multiple pretrained audio models originating from diverse audio domains. The pretrained model weights are frozen, and the resulting embeddings are analyzed through classification, clustering, and similarity-based evaluations. The analysis shows that the geometrical structure of the embedding space is largely dominated by recording-specific characteristics. However, a simple linear probe can effectively suppress this recording-specific information and isolate ship-type features from these embeddings. As a result, linear probing enables effective automatic UATR using pretrained audio models at low computational cost, significantly reducing the need for a large amounts of high-quality labeled ship recordings.
- Abstract(参考訳): 船舶からの人為的騒音の増加は水中の音汚染に大きく寄与し、海洋生態系にリスクをもたらす。
これにより、船舶が放射する騒音の影響を理解し定量化することが重要となる。
パッシブ・アコースティック・モニタリング(PAM)システムはこの目的のために広く展開されており、様々な音環境にまたがる水中記録を何年にもわたって生成している。
このような大規模なデータの手動分析は非現実的であり、機械学習に基づく自動化アプローチの必要性を動機付けている。
水中音響目標自動認識(UATR)の最近の進歩は、ラベル付きデータの不足によって制約される教師あり学習に大きく依存している。
Transfer Learning (TL)はこの制限を緩和する有望な代替手段を提供する。
本研究では、UATRにおける転送学習の実証的研究を行い、多様なオーディオ領域から派生した複数の事前学習オーディオモデルを評価する。
事前訓練されたモデルの重みは凍結され、その結果の埋め込みは分類、クラスタリング、類似性に基づく評価によって分析される。
解析の結果,埋め込み空間の幾何学的構造は記録特性に大きく左右されることがわかった。
しかし、単純な線形プローブは、この記録固有の情報を効果的に抑制し、これらの埋め込みから船型特徴を分離することができる。
その結果、線形探索により、事前訓練されたオーディオモデルを用いた効率的な自動UATRを低コストで実現し、大量の高品質なラベル付き船舶記録の必要性を著しく低減する。
関連論文リスト
- Automated data curation for self-supervised learning in underwater acoustic analysis [0.6990493129893112]
海洋生態系の持続性は、音質汚染の増加によって脅かされている。
パッシブ・アコースティック・モニタリング (PAM) システムは大量の水中音響記録を収集する。
機械学習は潜在的な解決策を提供するが、ほとんどの水中音響記録はラベル付けされていない。
論文 参考訳(メタデータ) (2025-05-26T14:50:04Z) - The Computation of Generalized Embeddings for Underwater Acoustic Target Recognition using Contrastive Learning [0.7145837421668514]
海洋環境における音汚染は、海洋の健康に対する脅威を増大させる。
このノイズをモニターすることで、汚染の原因となるソースをマッピングすることができる。
これにより大量のデータ記録が生成され、船舶活動や海洋哺乳類の発声などの音源が混在している。
論文 参考訳(メタデータ) (2025-05-19T09:37:46Z) - Neural Edge Histogram Descriptors for Underwater Acoustic Target Recognition [42.23422932643755]
この研究は、もともと画像分類のために開発されたニューラルエッジヒストグラム記述子(NEHD)法に適応し、受動的ソナー信号を分類する。
統計的および構造的テクスチャの特徴を包括的に評価し、それらの組み合わせが大きな事前学習モデルとの競合性能を達成することを示す。
提案したNEHDベースのアプローチは、水中目標認識のための軽量で効率的なソリューションを提供し、精度を維持しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2025-03-17T22:57:05Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Cross-domain Sound Recognition for Efficient Underwater Data Analysis [4.373836150479923]
本研究では, 水中音の広帯域学習モデルを用いて, 水中音響データを解析するための新しい深層学習手法を提案する。
我々は,PCA と UMAP の可視化を用いて2次元空間にデータをクラスタ化し,これらのクラスタ内の点を聴き,それらの定義特性を理解する。
第2部では、選択した水中データと非水中データセットの両方を用いてニューラルネットワークモデルを訓練する。
論文 参考訳(メタデータ) (2023-09-07T02:26:32Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。