論文の概要: Advancing Marine Bioacoustics with Deep Generative Models: A Hybrid Augmentation Strategy for Southern Resident Killer Whale Detection
- arxiv url: http://arxiv.org/abs/2511.21872v1
- Date: Wed, 26 Nov 2025 19:51:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.275501
- Title: Advancing Marine Bioacoustics with Deep Generative Models: A Hybrid Augmentation Strategy for Southern Resident Killer Whale Detection
- Title(参考訳): 深部生成モデルによる海洋生物音響の高度化:サザン・レジデントキラークジラ検出のためのハイブリッド増強戦略
- Authors: Bruno Padovese, Fabio Frazao, Michael Dowd, Ruth Joy,
- Abstract要約: 海洋哺乳動物の呼出検出におけるデータ増大のための深部生成モデルの可能性について検討した。
サリッシュ海における2つの長期ハイドロフォンの発声は,南部住民のKiller Whale (Orcinus orca) によるものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated detection and classification of marine mammals vocalizations is critical for conservation and management efforts but is hindered by limited annotated datasets and the acoustic complexity of real-world marine environments. Data augmentation has proven to be an effective strategy to address this limitation by increasing dataset diversity and improving model generalization without requiring additional field data. However, most augmentation techniques used to date rely on effective but relatively simple transformations, leaving open the question of whether deep generative models can provide additional benefits. In this study, we evaluate the potential of deep generative for data augmentation in marine mammal call detection including: Variational Autoencoders, Generative Adversarial Networks, and Denoising Diffusion Probabilistic Models. Using Southern Resident Killer Whale (Orcinus orca) vocalizations from two long-term hydrophone deployments in the Salish Sea, we compare these approaches against traditional augmentation methods such as time-shifting and vocalization masking. While all generative approaches improved classification performance relative to the baseline, diffusion-based augmentation yielded the highest recall (0.87) and overall F1-score (0.75). A hybrid strategy combining generative-based synthesis with traditional methods achieved the best overall performance with an F1-score of 0.81. We hope this study encourages further exploration of deep generative models as complementary augmentation strategies to advance acoustic monitoring of threatened marine mammal populations.
- Abstract(参考訳): 海洋哺乳動物の発声の自動検出と分類は保存と管理に重要であるが、注釈付きデータセットの制限と実世界の海洋環境の音響的複雑さによって妨げられている。
データ拡張は、データセットの多様性を高め、追加のフィールドデータを必要としないモデル一般化を改善することで、この制限に対処するための効果的な戦略であることが証明されている。
しかし、従来の拡張技術のほとんどは、効果的だが比較的単純な変換に依存しており、深層生成モデルがさらなる利点をもたらすかどうかという疑問が残されている。
本研究では,海洋哺乳動物の呼出検出における深層生成の可能性について検討した。
サリッシュ海における2つの長期のハイドロフォン展開から得られた南部住民キラー・ワレ (Orcinus orca) の発声を, 時間シフトや発声マスキングといった従来の拡張手法と比較した。
全ての生成的アプローチはベースラインと比較して分類性能を向上させたが、拡散ベースの増強は最も高いリコール(0.87)と全体的なF1スコア(0.75)を得た。
生成的合成と従来の手法を組み合わせたハイブリッド戦略は、F1スコアの0.81で最高性能を達成した。
本研究は, 海洋哺乳動物集団の音響モニタリングを促進するために, 補足的増強戦略として, 深部再生モデルをさらに探究することを願っている。
関連論文リスト
- Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Enhancing Adversarial Transferability by Balancing Exploration and Exploitation with Gradient-Guided Sampling [82.52485740425321]
アドリアックは、ディープニューラルネットワークの堅牢性にとって重要な課題である。
敵攻撃の伝達性は、爆発(最大攻撃能力)と探索(クロスモデル一般化の促進)のジレンマに直面している
論文 参考訳(メタデータ) (2025-11-01T05:43:47Z) - Multi-Representation Attention Framework for Underwater Bioacoustic Denoising and Recognition [0.924965746838578]
生体関連エネルギーのソフトマスクを生成するために、まずスペクトログラムをセグメント化する多段階の注意誘導フレームワークを導入する。
画像とマスクの埋め込みは、中間レベルの融合によって統合され、モデルが正常なスペクトル領域に集中できるようにする。
カナダのセイグネイ・セントローレンス海洋公園研究ステーションの実際の記録を用いて、セグメンテーション駆動の注意と中級核融合が信号の識別を改善することを実証した。
論文 参考訳(メタデータ) (2025-10-29T22:49:15Z) - GAUDA: Generative Adaptive Uncertainty-guided Diffusion-based Augmentation for Surgical Segmentation [1.0808810256442274]
我々は、意味的に包括的でコンパクトな(イメージ、マスク)空間の潜在表現を学習する。
提案手法は,目立ったセマンティック・コヒーレンスを持つ高品質なセグメンテーションデータを効果的に合成できることを示す。
論文 参考訳(メタデータ) (2025-01-18T16:40:53Z) - OXYGENERATOR: Reconstructing Global Ocean Deoxygenation Over a Century with Deep Learning [50.365198230613956]
既存の専門家が支配する数値シミュレーションは、地球温暖化や人的活動によって引き起こされる動的変動に追いつかなかった。
1920年から2023年までの世界の海洋脱酸素モデルを再構築するために,最初の深層学習モデルであるOxyGeneratorを提案する。
論文 参考訳(メタデータ) (2024-05-12T09:32:40Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Underwater Acoustic Target Recognition based on Smoothness-inducing Regularization and Spectrogram-based Data Augmentation [21.327653766608805]
不十分なデータは、複雑なモデリングをサポートする認識システムの能力を阻害する可能性がある。
限られたデータの場合,モデルの一般化能力を高めるための2つの戦略を提案する。
論文 参考訳(メタデータ) (2023-06-12T08:26:47Z) - Learning-based estimation of in-situ wind speed from underwater
acoustics [58.293528982012255]
水中音響から風速時系列を検索するための深層学習手法を提案する。
我々のアプローチは、事前の物理知識と計算効率の両面から恩恵を受けるために、データ同化と学習ベースのフレームワークをブリッジする。
論文 参考訳(メタデータ) (2022-08-18T15:27:40Z) - SALT: Sea lice Adaptive Lattice Tracking -- An Unsupervised Approach to
Generate an Improved Ocean Model [72.3183990520267]
シーライス分散と分布を効率的に推定するためのシーライス適応格子追跡手法を提案する。
具体的には、局所的な海洋特性に基づいて、オーシャンモデルの格子グラフにノードをマージすることで、適応的な空間メッシュを生成する。
提案手法は, 変動する気候下での海洋ライス寄生圧マップの予測モデルにより, 積極的養殖管理の促進を約束するものである。
論文 参考訳(メタデータ) (2021-06-24T17:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。