論文の概要: Semi-Supervised Convolutive NMF for Automatic Music Transcription
- arxiv url: http://arxiv.org/abs/2202.04989v1
- Date: Thu, 10 Feb 2022 12:38:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-12 00:17:19.486536
- Title: Semi-Supervised Convolutive NMF for Automatic Music Transcription
- Title(参考訳): 半監督型コンバーチブNMFによる音楽自動転写
- Authors: Haoran Wu, Axel Marmoret, J\'er\'emy E. Cohen
- Abstract要約: 本稿では,低ランク行列因数分解法,特に非負行列因数分解法を用いた半教師付き手法を提案する。
提案した半教師付きCNMF法は最先端の低ランク因数分解法より優れており,教師付き深層学習法より若干劣っていることを示す。
- 参考スコア(独自算出の注目度): 6.583111368144214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic Music Transcription, which consists in transforming an audio
recording of a musical performance into symbolic format, remains a difficult
Music Information Retrieval task. In this work, we propose a semi-supervised
approach using low-rank matrix factorization techniques, in particular
Convolutive Nonnegative Matrix Factorization. In the semi-supervised setting,
only a single recording of each individual notes is required.
We show on the MAPS dataset that the proposed semi-supervised CNMF method
performs better than state-of-the-art low-rank factorization techniques and a
little worse than supervised deep learning state-of-the-art methods, while
however suffering from generalization issues.
- Abstract(参考訳): 音楽演奏の音声録音をシンボリックな形式に変換することからなる自動音楽転写は、依然として難しい音楽情報検索課題である。
本研究では,低ランク行列分解,特に畳み込み非負行列分解を用いた半教師付き手法を提案する。
半教師付き設定では、個々の音符の1つの記録のみが必要である。
本稿では,提案する半教師付きcnmf法が最先端の低ランク因子分解技術よりも優れており,一般化に苦しむ一方で,教師付き深層学習法よりも若干劣っていることをmapsデータセットに示す。
関連論文リスト
- Sheet Music Transformer: End-To-End Optical Music Recognition Beyond
Monophonic Transcription [13.825822994127947]
Sheet Music Transformer(シート・ミュージック・トランスフォーマー)は、モノフォニック・ストラテジーのみに頼らずに複雑な楽譜を転写するために設計された最初のエンドツーエンドのOMRモデルである。
我々のモデルは2つのポリフォニック音楽データセットでテストされており、これらの複雑な音楽構造を効果的に扱えることが証明されている。
論文 参考訳(メタデータ) (2024-02-12T11:52:21Z) - DITTO: Diffusion Inference-Time T-Optimization for Music Generation [54.51336524107044]
Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:10:10Z) - Masked Audio Generation using a Single Non-Autoregressive Transformer [90.11646612273965]
MAGNeTは、複数のオーディオトークンストリーム上で直接動作するマスク付き生成シーケンスモデリング手法である。
テキスト・トゥ・ミュージック・アンド・テキスト・トゥ・オーディオ・ジェネレーションのタスクにおけるMAGNeTの有効性を実証する。
我々は、自己回帰と非自己回帰モデリングのトレードオフを指摘するとともに、MAGNeTを構成する各コンポーネントの重要性を強調した。
論文 参考訳(メタデータ) (2024-01-09T14:29:39Z) - Annotation-free Automatic Music Transcription with Scalable Synthetic
Data and Adversarial Domain Confusion [0.0]
そこで本研究では,MIDI-audio ペアデータの事前学習や対向領域の混乱を伴わない書き起こしモデルを提案する。
実験では、トレーニングデータセットがMIDIアノテーションを含まない実世界のアプリケーションシナリオ下での手法を評価する。
提案手法は,組合わせMIDI-audioの実際のデータセットを利用せずに,確立されたベースライン手法と比較して競争性能が向上した。
論文 参考訳(メタデータ) (2023-12-16T10:07:18Z) - Music Instrument Classification Reprogrammed [79.68916470119743]
プログラム」とは、事前学習されたモデルの入力と出力の両方を修正・マッピングすることで、もともと異なるタスクをターゲットにした、事前学習された深層・複雑なニューラルネットワークを利用する手法である。
本研究では,異なるタスクで学習した表現のパワーを効果的に活用できることを実証し,結果として得られた再プログラムシステムは,訓練パラメータのごく一部で,同等あるいはそれ以上の性能を持つシステムでも実行可能であることを実証する。
論文 参考訳(メタデータ) (2022-11-15T18:26:01Z) - Automatic Rule Induction for Efficient Semi-Supervised Learning [56.91428251227253]
半教師付き学習は、少量のラベル付きデータからNLPモデルを一般化できることを約束している。
事前訓練されたトランスモデルはブラックボックス相関エンジンとして機能し、説明が困難であり、時には信頼性に欠ける振る舞いをする。
本稿では,これらの課題に,簡易かつ汎用的なフレームワークであるAutomatic Rule Injection (ARI) を用いて対処することを提案する。
論文 参考訳(メタデータ) (2022-05-18T16:50:20Z) - Unaligned Supervision For Automatic Music Transcription in The Wild [1.2183405753834562]
NoteEMは、トランクレーバーを同時に訓練し、スコアを対応するパフォーマンスに合わせる方法である。
我々は、MAPSデータセットのSOTAノートレベル精度と、データセット間の評価において好適なマージンを報告した。
論文 参考訳(メタデータ) (2022-04-28T17:31:43Z) - Context-aware Automatic Music Transcription [10.957528713294874]
本稿では,文脈関連情報を組み込んだ自動音楽書き起こしシステムを提案する。
最先端の心理学研究を動機として,ATTシステムの精度向上手法を提案する。
論文 参考訳(メタデータ) (2022-03-30T13:36:17Z) - MT3: Multi-Task Multitrack Music Transcription [7.5947187537718905]
汎用トランスフォーマーモデルがマルチタスク自動音楽転写(AMT)を実現できることを示す。
この統合トレーニングフレームワークは、さまざまなデータセットにわたる高品質な書き起こし結果を実現する。
論文 参考訳(メタデータ) (2021-11-04T17:19:39Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - A framework to compare music generative models using automatic
evaluation metrics extended to rhythm [69.2737664640826]
本稿では,前回の研究で提示された,リズムを考慮せず,設計決定を下すための枠組みを取り上げ,単音素音楽作成における2つのrnnメモリセルの性能評価のためにリズムサポートを付加した。
モデルでは,音素変換の処理を考慮し,リズムサポートを付加した幾何学に基づく自動計測値を用いて,生成した楽曲の質を評価する。
論文 参考訳(メタデータ) (2021-01-19T15:04:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。