Fugu-MT 論文翻訳(概要): Leveraging tropical reef, bird and unrelated sounds for superior transfer learning in marine bioacoustics

論文の概要: Leveraging tropical reef, bird and unrelated sounds for superior transfer learning in marine bioacoustics

arxiv url: http://arxiv.org/abs/2404.16436v1
Date: Thu, 25 Apr 2024 09:12:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-26 14:19:10.441051
Title: Leveraging tropical reef, bird and unrelated sounds for superior transfer learning in marine bioacoustics
Title（参考訳）: 海洋生物音響学における越流学習のための熱帯礁・鳥・無関係音の活用
Authors: Ben Williams, Bart van Merriënboer, Vincent Dumoulin, Jenny Hamer, Eleni Triantafillou, Abram B. Fleishman, Matthew McKown, Jill E. Munger, Aaron N. Rice, Ashlee Lillis, Clemency E. White, Catherine A. D. Hobbs, Tries B. Razak, Kate E. Jones, Tom Denton,
Abstract要約: 機械学習は、環境評価のためのパッシブ音響モニタリング(PAM)に革命をもたらす可能性がある。一般化可能な事前学習ネットワークはこれらのコストを克服することができるが、高品質な事前学習には膨大な注釈付きライブラリが必要である。ここではサンゴ礁生物音響学を用いてデータ不足領域に対する最適事前学習戦略を同定する。
参考スコア（独自算出の注目度）: 5.799126142155481
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Machine learning has the potential to revolutionize passive acoustic monitoring (PAM) for ecological assessments. However, high annotation and compute costs limit the field's efficacy. Generalizable pretrained networks can overcome these costs, but high-quality pretraining requires vast annotated libraries, limiting its current applicability primarily to bird taxa. Here, we identify the optimum pretraining strategy for a data-deficient domain using coral reef bioacoustics. We assemble ReefSet, a large annotated library of reef sounds, though modest compared to bird libraries at 2% of the sample count. Through testing few-shot transfer learning performance, we observe that pretraining on bird audio provides notably superior generalizability compared to pretraining on ReefSet or unrelated audio alone. However, our key findings show that cross-domain mixing which leverages bird, reef and unrelated audio during pretraining maximizes reef generalizability. SurfPerch, our pretrained network, provides a strong foundation for automated analysis of marine PAM data with minimal annotation and compute costs.
Abstract（参考訳）: 機械学習は、環境評価のためのパッシブ音響モニタリング(PAM)に革命をもたらす可能性がある。しかし、高いアノテーションと計算コストは、フィールドの有効性を制限する。一般化可能な事前訓練ネットワークはこれらのコストを克服することができるが、高品質な事前訓練には膨大な注釈付きライブラリが必要である。ここではサンゴ礁生物音響学を用いてデータ不足領域に対する最適事前学習戦略を同定する。 ReefSetは大きなアノテートされたサンゴ礁音のライブラリである。数発の転送学習性能をテストすることにより,鳥の音声による事前学習は,ReefSetや無関係の音声による事前学習に比べ,顕著に優れた一般化性が得られることがわかった。しかし,本研究の鍵となる知見は,鳥類,サンゴ礁,無関係なオーディオを利用したクロスドメイン混合が,サンゴ礁の汎用性を最大化することである。事前訓練されたネットワークであるSurfPerchは、最小限のアノテーションと計算コストで海洋PAMデータを自動解析するための強力な基盤を提供する。

関連論文リスト

Perch 2.0: The Bittern Lesson for Bioacoustics [7.540404494602192]
Perch(パーチ)は、バイオ音響学の訓練済みモデルである。教師付き方式で訓練され、何千もの発声種に対する既成の分類スコアと、移動学習のための強力な埋め込みの両方を提供する。この新しいリリースであるPerch 2.0では、鳥のみを対象としたトレーニングから、大規模なマルチタキサデータセットまで拡張しています。
論文参考訳（メタデータ） (2025-08-06T17:34:43Z)
Foundation Models for Bioacoustics -- a Comparative Review [0.9109149174920012]
本稿では, 生体音響基礎モデルについて, モデルアーキテクチャ, 事前学習計画, 訓練パラダイムなどの設計決定を徹底的に分析して検討する。 BEANSおよびBirdSetベンチマークから,分類タスクの選択基盤モデルを評価する。総合的な実験分析の結果,BirdSetベンチマークでは,大規模鳥の鳴き声データに基づく自己指導による学習が最高の成績を収めていることが明らかとなった。
論文参考訳（メタデータ） (2025-08-02T09:15:16Z)
U-DREAM: Unsupervised Dereverberation guided by a Reverberation Model [12.192022160630165]
本稿では,弱教師付きから完全教師なしまでの監督設定を施した最先端のデリバベーションモデルの訓練結果について検討する。既存のディープラーニングアプローチの多くは、通常、ペア化された乾式と残響式のデータを必要とするが、実際は入手が困難である。そこで, ディープニューラルネットワークを用いた残響入力から, 音響パラメータとドライ信号が推定される。
論文参考訳（メタデータ） (2025-07-17T12:26:18Z)
Can Masked Autoencoders Also Listen to Birds? [2.430300340530418]
Masked Autoencoders (MAEs) は、リッチな意味表現を学習することで、音声分類において競合する結果を示した。汎用モデルは、きめ細かいオーディオドメインに直接適用しても、うまく一般化できない。この研究は、このドメインギャップを埋めるには、ドメイン固有の事前トレーニングデータ以上のものが必要であることを実証している。
論文参考訳（メタデータ） (2025-04-17T12:13:25Z)
Semi-supervised classification of bird vocalizations [0.0]
鳥類の個体数の変化は生態系の広範な変化を示す可能性がある。時間重なり合う鳴き声を検出するための半教師付き音響鳥検知器を提案する。平均F0.5スコアは315のクラスで0.701で、110種の鳥類をホールドアウトテストセットで記録する。
論文参考訳（メタデータ） (2025-02-19T05:31:13Z)
Provably Efficient RLHF Pipeline: A Unified View from Contextual Bandits [59.30310692855397]
本稿では,RLHFパイプラインをコンテキスト的帯域幅の観点から統一したフレームワークを提案する。 RLHFプロセスは、(ポスト-)トレーニングとデプロイメントの2つのステージに分解します。次に,各ステージごとに新しいアルゴリズムを開発し,統計的および計算効率の両面で有意な改善を示す。
論文参考訳（メタデータ） (2025-02-11T02:36:01Z)
Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文参考訳（メタデータ） (2024-06-20T18:35:47Z)
Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳（メタデータ） (2024-03-11T16:22:41Z)
WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文参考訳（メタデータ） (2024-02-20T11:36:23Z)
Self-Supervised Learning for Few-Shot Bird Sound Classification [10.395255631261458]
音声における自己教師あり学習(SSL)は、様々な領域において大きな可能性を秘めている。本研究では,アノテーションを必要とせずに,音声録音から有意義な鳥の音の表現を抽出できることを実証する。
論文参考訳（メタデータ） (2023-12-25T22:33:45Z)
Noisy Self-Training with Synthetic Queries for Dense Retrieval [49.49928764695172]
合成クエリと組み合わせた,ノイズの多い自己学習フレームワークを提案する。実験結果から,本手法は既存手法よりも一貫した改善が得られた。我々の手法はデータ効率が良く、競争のベースラインより優れています。
論文参考訳（メタデータ） (2023-11-27T06:19:50Z)
Understanding and Mitigating the Label Noise in Pre-training on Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文参考訳（メタデータ） (2023-09-29T06:18:15Z)
Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文参考訳（メタデータ） (2023-09-15T13:50:16Z)
Efficient acoustic feature transformation in mismatched environments using a Guided-GAN [1.495380389108477]
本稿では,資源共有環境における音声認識システムを改善するための新しいフレームワークを提案する。音響入力機能を利用したGAN(Generative Adversarial Network)を用いて、ミスマッチしたデータの特徴を高める。 1時間未満のデータで、高品質なデータに基づいて訓練され、一致しないオーディオで評価されたASRシステムは、11.5%から19.7%の相対的な単語誤り率(WER)によって改善される。
論文参考訳（メタデータ） (2022-10-03T05:33:28Z)
Classification of animal sounds in a hyperdiverse rainforest using Convolutional Neural Networks [0.0]
受動的に記録された音場から機械学習アプローチによる自動種検出は有望な手法である。本研究では,ボルネオの熱帯林の音環境と,移動学習による畳み込みニューラルネットワークモデル(CNN)を用いた。以上の結果から,トランスファー学習とデータ拡張は,多くの稀な種を持つ小さなサウンドスケーププロジェクトにおいても,CNNを用いて声の分類が可能であることが示唆された。
論文参考訳（メタデータ） (2021-11-29T21:34:57Z)
Recognizing bird species in diverse soundscapes under weak supervision [0.2148535041822524]
複雑で多様なサウンドスケープにおける鳥の発声に対するロバストな分類手法を提案し,BirdCLEF 2021チャレンジにおいて第2位を獲得した。本稿では,新しい拡張法で補足された効率的なモデリングとトレーニングルーチンを用いることで,事前学習した畳み込みニューラルネットワークをフル活用する方法を説明する。
論文参考訳（メタデータ） (2021-07-16T06:54:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。