論文の概要: Automated data curation for self-supervised learning in underwater acoustic analysis
- arxiv url: http://arxiv.org/abs/2505.20066v1
- Date: Mon, 26 May 2025 14:50:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.52681
- Title: Automated data curation for self-supervised learning in underwater acoustic analysis
- Title(参考訳): 水中音響解析における自己教師あり学習のための自動データキュレーション
- Authors: Hilde I Hummel, Sandjai Bhulai, Burooj Ghani, Rob van der Mei,
- Abstract要約: 海洋生態系の持続性は、音質汚染の増加によって脅かされている。
パッシブ・アコースティック・モニタリング (PAM) システムは大量の水中音響記録を収集する。
機械学習は潜在的な解決策を提供するが、ほとんどの水中音響記録はラベル付けされていない。
- 参考スコア(独自算出の注目度): 0.6990493129893112
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The sustainability of the ocean ecosystem is threatened by increased levels of sound pollution, making monitoring crucial to understand its variability and impact. Passive acoustic monitoring (PAM) systems collect a large amount of underwater sound recordings, but the large volume of data makes manual analysis impossible, creating the need for automation. Although machine learning offers a potential solution, most underwater acoustic recordings are unlabeled. Self-supervised learning models have demonstrated success in learning from large-scale unlabeled data in various domains like computer vision, Natural Language Processing, and audio. However, these models require large, diverse, and balanced datasets for training in order to generalize well. To address this, a fully automated self-supervised data curation pipeline is proposed to create a diverse and balanced dataset from raw PAM data. It integrates Automatic Identification System (AIS) data with recordings from various hydrophones in the U.S. waters. Using hierarchical k-means clustering, the raw audio data is sampled and then combined with AIS samples to create a balanced and diverse dataset. The resulting curated dataset enables the development of self-supervised learning models, facilitating various tasks such as monitoring marine mammals and assessing sound pollution.
- Abstract(参考訳): 海洋生態系の持続性は、音汚染のレベルの増加によって脅かされており、その多様性と影響を理解するためにモニタリングが不可欠である。
パッシブ・アコースティック・モニタリング (PAM) システムは大量の水中音声を収集するが、大量のデータによって手動による分析が不可能になり、自動化の必要性が生じる。
機械学習は潜在的な解決策を提供するが、ほとんどの水中音響記録はラベル付けされていない。
自己教師付き学習モデルは、コンピュータビジョン、自然言語処理、オーディオなど、さまざまな領域において、大規模にラベル付けされていないデータから学習することに成功した。
しかし、これらのモデルは、トレーニングをうまく一般化するために、大きく、多様で、バランスのとれたデータセットを必要とする。
これを解決するために、完全に自動化された自己教師付きデータキュレーションパイプラインを提案し、生のPAMデータから多種多様なバランスの取れたデータセットを作成する。
このシステムはAIS(Automatic Identification System)データと、米国水中の様々なハイドロフォンからの録音を統合している。
階層的なk平均クラスタリングを使用して、生オーディオデータをサンプリングし、AISサンプルと組み合わせてバランスの取れた多様なデータセットを生成する。
得られたキュレートされたデータセットは、自己教師付き学習モデルの開発を可能にし、海洋哺乳類の監視や音質汚染の評価など、様々なタスクを容易にする。
関連論文リスト
- The Computation of Generalized Embeddings for Underwater Acoustic Target Recognition using Contrastive Learning [0.7145837421668514]
海洋環境における音汚染は、海洋の健康に対する脅威を増大させる。
このノイズをモニターすることで、汚染の原因となるソースをマッピングすることができる。
これにより大量のデータ記録が生成され、船舶活動や海洋哺乳類の発声などの音源が混在している。
論文 参考訳(メタデータ) (2025-05-19T09:37:46Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - RU-AI: A Large Multimodal Dataset for Machine-Generated Content Detection [11.265512559447986]
本稿では,テキスト,画像,音声中の機械生成コンテンツを堅牢かつ効果的に検出するための大規模マルチモーダルデータセットであるRU-AIを紹介する。
私たちのデータセットは、Flickr8K、COCO、Places205という3つの大きな公開データセットに基づいて構築されています。
その結果,既存のモデルでは,データセットの正確かつ堅牢な検出に苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2024-06-07T12:58:14Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Efficacy of MRI data harmonization in the age of machine learning. A
multicenter study across 36 datasets [0.0]
複数のサイトから公開されているMRIデータをポーリングすることで、幅広い被験者のグループを集め、統計力を高め、機械学習技術でデータの再利用を促進することができる。
マルチセンターデータの調和化は、データの非生物学的変動源に付随する相反効果を低減するために必要である。
機械学習の前にデータセット全体に適用されると、トレーニングセット外の情報がモデル構築に影響を与える可能性があるため、ハーモニゼーションはデータ漏洩につながる。
論文 参考訳(メタデータ) (2022-11-08T09:45:39Z) - Representation Learning for the Automatic Indexing of Sound Effects
Libraries [79.68916470119743]
タスク固有のがデータセットに依存しない表現は、クラス不均衡、一貫性のないクラスラベル、不十分なデータセットサイズなどのデータ問題にうまく対処できることを示す。
詳細な実験結果は、メトリック学習アプローチと異なるデータセット間の学習方法が表現効率に与える影響を示している。
論文 参考訳(メタデータ) (2022-08-18T23:46:13Z) - Impact of Dataset on Acoustic Models for Automatic Speech Recognition [0.0]
音声認識において、GMM-HMMは音響モデリングに広く用いられてきた。
GMMモデルは、ハイブリッドディープニューラルネットワークモデルのトレーニングデータのアライメントを作成するために広く使用されている。
本研究の目的は,データセットサイズの変化が各種GMM-HMM音響モデルの性能に与える影響を検討することである。
論文 参考訳(メタデータ) (2022-03-25T11:41:49Z) - BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning
for Automatic Speech Recognition [126.5605160882849]
事前学習,自己学習,モデルサイズのスケールアップの組み合わせによって,データの効率が大幅に向上することがわかった。
本稿では,大規模な下流タスクに対して,事前学習モデルと自己学習モデルを使用することによって得られる普遍的なメリットについて報告する。
論文 参考訳(メタデータ) (2021-09-27T17:59:19Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Automatic Curation of Large-Scale Datasets for Audio-Visual
Representation Learning [62.47593143542552]
本稿では,自動データセットキュレーションのためのサブセット最適化手法について述べる。
本研究では,高視聴覚対応の映像を抽出し,自己監視モデルが自動的に構築されているにもかかわらず,既存のスケールのビデオデータセットと類似したダウンストリームパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-01-26T14:27:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。