論文の概要: Balanced Deep CCA for Bird Vocalization Detection
- arxiv url: http://arxiv.org/abs/2211.09376v1
- Date: Thu, 17 Nov 2022 07:09:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 17:31:19.393014
- Title: Balanced Deep CCA for Bird Vocalization Detection
- Title(参考訳): 鳥の発声検出のためのバランスのとれた深部CA
- Authors: Sumit Kumar, B. Anshuman, Linus Ruettimann, Richard H.R. Hahnloser,
Vipul Arora
- Abstract要約: マルチモーダルデータのための新しい自己教師付き学習手法を開発した。
同時に記録したマイクロホン(音)信号と加速度計(振動)信号との相関(隠れ)を学習する。
- 参考スコア(独自算出の注目度): 5.635374645175903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event detection improves when events are captured by two different modalities
rather than just one. But to train detection systems on multiple modalities is
challenging, in particular when there is abundance of unlabelled data but
limited amounts of labeled data. We develop a novel self-supervised learning
technique for multi-modal data that learns (hidden) correlations between
simultaneously recorded microphone (sound) signals and accelerometer (body
vibration) signals. The key objective of this work is to learn useful
embeddings associated with high performance in downstream event detection tasks
when labeled data is scarce and the audio events of interest (songbird
vocalizations) are sparse. We base our approach on deep canonical correlation
analysis (DCCA) that suffers from event sparseness. We overcome the sparseness
of positive labels by first learning a data sampling model from the labelled
data and by applying DCCA on the output it produces. This method that we term
balanced DCCA (b-DCCA) improves the performance of the unsupervised embeddings
on the downstream supervised audio detection task compared to classsical DCCA.
Because data labels are frequently imbalanced, our method might be of broad
utility in low-resource scenarios.
- Abstract(参考訳): イベント検出は、イベントが1つではなく2つの異なるモダリティによってキャプチャされると改善される。
しかし、複数のモードで検出システムを訓練するには、特にラベル付きデータが豊富だがラベル付きデータが限られている場合、困難である。
我々は,マイクロホン(音)信号と加速度計(振動)信号の相関関係を学習する,マルチモーダルデータのための新しい自己教師学習手法を開発した。
本研究の主な目的は、ラベル付きデータが不足し、興味のある音声イベント(声帯発声)が希薄な場合、下流イベント検出タスクにおける高性能な埋め込みを学習することである。
我々は,事象の疎度に苦しむディープ・カノニカル相関分析(DCCA)に基づくアプローチを行った。
ラベル付きデータからデータサンプリングモデルを学習し,その出力にDCCAを適用することで,正のラベルの疎さを克服する。
本手法は,古典的なDCCAと比較して,下流の教師なし音声検出タスクにおける教師なし埋め込みの性能を向上させる。
データラベルは頻繁に不均衡であるため、この手法は低リソースシナリオにおいて広く有用である可能性がある。
関連論文リスト
- An accurate detection is not all you need to combat label noise in web-noisy datasets [23.020126612431746]
分離した超平面の直接推定により,OOD試料の正確な検出が可能であることを示す。
本稿では,線形分離を用いた雑音検出とSOTA(State-of-the-art-the-loss)アプローチを交互に行うハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2024-07-08T00:21:42Z) - Pretraining Representations for Bioacoustic Few-shot Detection using
Supervised Contrastive Learning [10.395255631261458]
バイオ音響応用において、ほとんどのタスクにはラベル付きトレーニングデータはほとんど含まれない。
教師付きコントラスト学習フレームワークを用いてデータ拡張を活用することにより、スクラッチからリッチな特徴抽出器を学習することができることを示す。
我々は検証セットで63.46%、テストセットで42.7%のFスコアを取得し、DCASEチャレンジで2位となった。
論文 参考訳(メタデータ) (2023-09-02T09:38:55Z) - Co-Learning Meets Stitch-Up for Noisy Multi-label Visual Recognition [70.00984078351927]
本稿では,多ラベル分類と長期学習の特徴に基づく雑音の低減に焦点をあてる。
よりクリーンなサンプルを合成し,マルチラベルノイズを直接低減するStitch-Up拡張を提案する。
ヘテロジニアス・コラーニング・フレームワークは、長い尾の分布とバランスの取れた分布の不整合を活用するためにさらに設計されている。
論文 参考訳(メタデータ) (2023-07-03T09:20:28Z) - Cross-Validation Is All You Need: A Statistical Approach To Label Noise Estimation [0.6612255136183889]
マシンラーニングモデルは、ノイズラベルの存在下でトレーニングされた場合、パフォーマンスが低下する。
これは、生存予測のような医療タスクに特に問題となる。
本稿では,2つの新しいラベルノイズ検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-24T14:50:20Z) - CaSP: Class-agnostic Semi-Supervised Pretraining for Detection and
Segmentation [60.28924281991539]
本稿では,タスク固有性バランスを向上するために,クラス非依存型半教師付き事前学習(CaSP)フレームワークを提案する。
我々は3.6Mの未ラベルデータを用いて、ImageNetで規定されたオブジェクト検出のベースラインよりも4.7%の顕著なパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2021-12-09T14:54:59Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Audio Tagging by Cross Filtering Noisy Labels [26.14064793686316]
そこで我々はCrossFilterという新しいフレームワークを提案し,音声タグ付けにおけるノイズラベル問題に対処する。
提案手法は最先端の性能を達成し,アンサンブルモデルを超えている。
論文 参考訳(メタデータ) (2020-07-16T07:55:04Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z) - Learning from Noisy Similar and Dissimilar Data [84.76686918337134]
ノイズSとDラベル付きデータから分類器を学習する方法を示す。
また、このような相互監督データからの学習と、通常のクラスラベルデータからの学習との間に重要な関連性を示す。
論文 参考訳(メタデータ) (2020-02-03T19:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。