論文の概要: Self-supervised Auxiliary Loss for Metric Learning in Music
Similarity-based Retrieval and Auto-tagging
- arxiv url: http://arxiv.org/abs/2304.07449v1
- Date: Sat, 15 Apr 2023 02:00:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 19:02:02.069910
- Title: Self-supervised Auxiliary Loss for Metric Learning in Music
Similarity-based Retrieval and Auto-tagging
- Title(参考訳): 音楽類似性に基づく検索と自動タグ付けにおけるメトリック学習のための自己教師付き補助損失
- Authors: Taketo Akama, Hiroaki Kitano, Katsuhiro Takematsu, Yasushi Miyajima,
and Natalia Polouliakh
- Abstract要約: 類似性に基づく検索課題に対処するために,自己教師付き学習アプローチに基づくモデルを提案する。
また, 微調整期間中の増員を控えることで, 良好な結果が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the realm of music information retrieval, similarity-based retrieval and
auto-tagging serve as essential components. Given the limitations and
non-scalability of human supervision signals, it becomes crucial for models to
learn from alternative sources to enhance their performance. Self-supervised
learning, which exclusively relies on learning signals derived from music audio
data, has demonstrated its efficacy in the context of auto-tagging. In this
study, we propose a model that builds on the self-supervised learning approach
to address the similarity-based retrieval challenge by introducing our method
of metric learning with a self-supervised auxiliary loss. Furthermore,
diverging from conventional self-supervised learning methodologies, we
discovered the advantages of concurrently training the model with both
self-supervision and supervision signals, without freezing pre-trained models.
We also found that refraining from employing augmentation during the
fine-tuning phase yields better results. Our experimental results confirm that
the proposed methodology enhances retrieval and tagging performance metrics in
two distinct scenarios: one where human-annotated tags are consistently
available for all music tracks, and another where such tags are accessible only
for a subset of tracks.
- Abstract(参考訳): 音楽情報検索の分野では、類似性に基づく検索と自動タグ付けが不可欠である。
人間の監視信号の制限と非スケーリング性を考えると、モデルが代替ソースから学習し、性能を高めることが重要である。
音楽音声データから得られる学習信号にのみ依存する自己教師型学習は,その効果を自動タグ付けの文脈で実証している。
本研究では,自己教師付き補助的損失を伴う計量学習手法を導入することにより,類似性に基づく検索課題に対処する自己教師型学習アプローチに基づくモデルを提案する。
さらに,従来の自己教師あり学習手法から逸脱し,事前学習モデルの凍結を伴わずに自己監督信号と監督信号の両方でモデルを同時に訓練する利点を見出した。
また, 微調整期間中の増員を控えることで, 良好な結果が得られた。
実験の結果,提案手法は,すべての楽曲に対して,人称タグが一貫して利用可能である場合と,そのタグが一部の楽曲に対してのみアクセス可能な場合の2つの異なるシナリオにおいて,検索とタグ付けのパフォーマンス指標を強化することが確認された。
関連論文リスト
- Equivariance-based self-supervised learning for audio signal recovery from clipped measurements [13.829249782527363]
クリップ計測から音声信号を復元する非線形逆問題に対する自己教師型学習について検討した。
提案手法は, 自己教師付き自己教師型復号法の性能を, 完全教師付き学習と良好に比較できることを示す。
論文 参考訳(メタデータ) (2024-09-03T06:12:01Z) - A Probabilistic Model Behind Self-Supervised Learning [53.64989127914936]
自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。
自己教師型学習のための生成潜在変数モデルを提案する。
対照的な方法を含む識別的SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示した。
論文 参考訳(メタデータ) (2024-02-02T13:31:17Z) - Revisiting Self-supervised Learning of Speech Representation from a
Mutual Information Perspective [68.20531518525273]
我々は、情報理論の観点から、既存の自己教師型音声の手法を詳しく検討する。
我々は線形プローブを用いて、対象情報と学習された表現の間の相互情報を推定する。
我々は、ラベルを使わずに、データの異なる部分間の相互情報を見積もる自己教師型の表現を評価する可能性を探る。
論文 参考訳(メタデータ) (2024-01-16T21:13:22Z) - Self-Supervised Learning for Audio-Based Emotion Recognition [1.7598252755538808]
自己教師付き学習は、教師付きラベルの不足にもかかわらず学習できる方法のファミリーである。
我々は,CMU-MOSEIの音響モダリティからの感情の分類に自己教師付き学習事前学習を適用した。
自己教師型学習は、すべてのメトリクスにわたるモデルの性能を一貫して改善する。
論文 参考訳(メタデータ) (2023-07-23T14:40:50Z) - Unsupervised 3D registration through optimization-guided cyclical
self-training [71.75057371518093]
最先端のディープラーニングベースの登録方法は、3つの異なる学習戦略を採用している。
本稿では,教師なし登録のための自己指導型学習パラダイムを提案する。
腹部, 肺の登録方法の評価を行い, 測定基準に基づく監督を一貫して上回り, 最先端の競争相手よりも優れていた。
論文 参考訳(メタデータ) (2023-06-29T14:54:10Z) - Music Instrument Classification Reprogrammed [79.68916470119743]
プログラム」とは、事前学習されたモデルの入力と出力の両方を修正・マッピングすることで、もともと異なるタスクをターゲットにした、事前学習された深層・複雑なニューラルネットワークを利用する手法である。
本研究では,異なるタスクで学習した表現のパワーを効果的に活用できることを実証し,結果として得られた再プログラムシステムは,訓練パラメータのごく一部で,同等あるいはそれ以上の性能を持つシステムでも実行可能であることを実証する。
論文 参考訳(メタデータ) (2022-11-15T18:26:01Z) - Active Learning of Ordinal Embeddings: A User Study on Football Data [4.856635699699126]
人間は本来、未知の類似性関数を使用してラベル付けされていないデータセットのインスタンス間の距離を計測する。
この研究はディープ・メトリック・ラーニングを使用して、大規模なフットボールの軌跡データセットのアノテーションからユーザ定義の類似性関数を学習する。
論文 参考訳(メタデータ) (2022-07-26T07:55:23Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Automatic Recall Machines: Internal Replay, Continual Learning and the
Brain [104.38824285741248]
ニューラルネットワークのリプレイには、記憶されたサンプルを使ってシーケンシャルなデータのトレーニングが含まれる。
本研究では,これらの補助サンプルをフライ時に生成する手法を提案する。
代わりに、評価されたモデル自体内の学習したサンプルの暗黙の記憶が利用されます。
論文 参考訳(メタデータ) (2020-06-22T15:07:06Z) - Embodied Self-supervised Learning by Coordinated Sampling and Training [14.107020105091662]
本稿では, 逆問題に対して, 対応する物理フォワードプロセスを用いて, 自己教師型アプローチを提案する。
提案手法は、反復的なサンプリングとトレーニングによって推論ネットワークを学習するために、分析バイシンセシス方式で動作する。
音声から調音情報を推測するために,音響-調音インバージョン問題に対処することで,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-06-20T14:05:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。