論文の概要: Self-Similarity-Based and Novelty-based loss for music structure
analysis
- arxiv url: http://arxiv.org/abs/2309.02243v1
- Date: Tue, 5 Sep 2023 13:49:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 14:21:37.842427
- Title: Self-Similarity-Based and Novelty-based loss for music structure
analysis
- Title(参考訳): 音楽構造解析のための自己相似性と新規性に基づく損失
- Authors: Geoffroy Peeters
- Abstract要約: 音楽境界検出のタスクに対する教師付きアプローチを提案する。
このアプローチでは、機能と畳み込みカーネルを同時に学習します。
自己注意による相対的特徴学習は,MSAの課題に有益であることを示す。
- 参考スコア(独自算出の注目度): 5.3900692419866285
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Music Structure Analysis (MSA) is the task aiming at identifying musical
segments that compose a music track and possibly label them based on their
similarity. In this paper we propose a supervised approach for the task of
music boundary detection. In our approach we simultaneously learn features and
convolution kernels. For this we jointly optimize -- a loss based on the
Self-Similarity-Matrix (SSM) obtained with the learned features, denoted by
SSM-loss, and -- a loss based on the novelty score obtained applying the
learned kernels to the estimated SSM, denoted by novelty-loss. We also
demonstrate that relative feature learning, through self-attention, is
beneficial for the task of MSA. Finally, we compare the performances of our
approach to previously proposed approaches on the standard RWC-Pop, and various
subsets of SALAMI.
- Abstract(参考訳): 音楽構造分析(英語: music structure analysis、msa)は、楽曲を構成する音楽セグメントを識別し、その類似性に基づいてラベル付けすることを目的としたタスクである。
本稿では,音楽境界検出のための教師ありアプローチを提案する。
このアプローチでは、機能と畳み込みカーネルを同時に学習します。
本研究では,SSM-lossで示される学習特徴を持つ自己相似行列(SSM)に基づく損失と,この学習カーネルを推定されたSSMに適用したノベルティスコアに基づく損失とを共同で最適化する。
また,MSAの課題に対して,自己注意による相対的特徴学習が有益であることを示す。
最後に,従来提案されていた標準RWC-PopとSALAMIの各種サブセットの性能を比較した。
関連論文リスト
- An Information Compensation Framework for Zero-Shot Skeleton-based Action Recognition [49.45660055499103]
ゼロショットの人間の骨格に基づく行動認識は、トレーニング中に見られるカテゴリ外の行動を認識するモデルを構築することを目的としている。
従来の研究では、シーケンスの視覚的空間分布と意味的空間分布の整合性に焦点が当てられていた。
強固で頑健な表現を得るために,新たな損失関数サンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-06-02T06:53:01Z) - "It's a Match!" -- A Benchmark of Task Affinity Scores for Joint
Learning [74.14961250042629]
MTL(Multi-Task Learning)は、その成功の条件を特徴づけることが、ディープラーニングにおいて依然としてオープンな問題である、と約束する。
共同学習におけるタスク親和性の推定は重要な取り組みである。
最近の研究は、訓練条件自体がMTLの結果に重大な影響を与えることを示唆している。
しかし,本研究では,タスク親和性評価手法の有効性を評価するためのベンチマークが欠落している。
論文 参考訳(メタデータ) (2023-01-07T15:16:35Z) - SSM-Net: feature learning for Music Structure Analysis using a
Self-Similarity-Matrix based loss [7.599399338954308]
我々は、深層エンコーダを訓練し、SSM (Self-Similarity-Matrix) という特徴を学習する。
RWC-Popデータセット上で、AUC(Area Under the Curve ROC)を用いて、このトレーニングパラダイムの使用を実証した。
論文 参考訳(メタデータ) (2022-11-15T13:48:11Z) - Joint Embedding Self-Supervised Learning in the Kernel Regime [21.80241600638596]
自己教師付き学習(SSL)は、データを分類するためのラベルにアクセスすることなく、データの有用な表現を生成する。
我々はこのフレームワークを拡張し,カーネルの機能空間に作用する線形写像によって埋め込みを構築するカーネル手法に基づくアルゴリズムを組み込む。
カーネルモデルを小さなデータセットで分析し、自己教師付き学習アルゴリズムの共通特徴を特定し、下流タスクにおける性能に関する理論的洞察を得る。
論文 参考訳(メタデータ) (2022-09-29T15:53:19Z) - SeCo: Separating Unknown Musical Visual Sounds with Consistency Guidance [88.0355290619761]
この作品は未知の楽器の分離に焦点を当てている。
本稿では,未知のカテゴリを分離できるセコ(SeCo)フレームワークを提案する。
本手法は,新たな楽曲カテゴリに適応する能力を示し,基本手法を顕著なマージンで上回る性能を示す。
論文 参考訳(メタデータ) (2022-03-25T09:42:11Z) - Barwise Compression Schemes for Audio-Based Music Structure Analysis [4.39160562548524]
音楽構造解析 (MSA) は、楽曲を複数の異なるセクションに分割する。
我々は、曲のオリジナル内容の簡易な表現により、構造がより容易に明らかにされるという仮説の下で、圧縮フレームワーク内のMSAにアプローチする。
本実験では,非教師なし圧縮方式により,最先端の教師付き手法に匹敵する性能を実現する。
論文 参考訳(メタデータ) (2022-02-10T12:23:57Z) - MAML is a Noisy Contrastive Learner [72.04430033118426]
モデルに依存しないメタラーニング(MAML)は、今日では最も人気があり広く採用されているメタラーニングアルゴリズムの1つである。
我々は、MAMLの動作メカニズムに対する新たな視点を提供し、以下に示すように、MAMLは、教師付きコントラスト目的関数を用いたメタラーナーに類似している。
このような干渉を軽減するため, 単純だが効果的な手法であるゼロ化手法を提案する。
論文 参考訳(メタデータ) (2021-06-29T12:52:26Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - Music Boundary Detection using Convolutional Neural Networks: A
comparative analysis of combined input features [2.123556187010023]
楽曲の構造の分析は人工知能の課題であり続けている。
異なるプーリング戦略から計算した入力を比較することで、これらの入力を前処理する一般的な方法を確立する。
また、楽曲の構造の限界を抽出する最も効率的な方法を確立するために、CNNに届ける最も効果的な入力の組み合わせを確立する。
論文 参考訳(メタデータ) (2020-08-17T14:20:51Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文 参考訳(メタデータ) (2020-01-06T18:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。