論文の概要: D3PIA: A Discrete Denoising Diffusion Model for Piano Accompaniment Generation From Lead sheet
- arxiv url: http://arxiv.org/abs/2602.03523v1
- Date: Tue, 03 Feb 2026 13:39:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.474118
- Title: D3PIA: A Discrete Denoising Diffusion Model for Piano Accompaniment Generation From Lead sheet
- Title(参考訳): D3PIA:鉛板からのピアノ伴奏生成のための離散拡散モデル
- Authors: Eunjin Choi, Hounsu Kim, Hayeon Bang, Taegyun Kwon, Juhan Nam,
- Abstract要約: ピアノロール表現におけるリードシートと伴奏の局所的アライメントを用いた離散拡散型ピアノ伴奏生成モデルD3PIAを提案する。
ピアノ伴奏生成のベンチマークであるPOP909データセットを用いて,本モデルの評価を行った。
- 参考スコア(独自算出の注目度): 18.81856284996403
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating piano accompaniments in the symbolic music domain is a challenging task that requires producing a complete piece of piano music from given melody and chord constraints, such as those provided by a lead sheet. In this paper, we propose a discrete diffusion-based piano accompaniment generation model, D3PIA, leveraging local alignment between lead sheet and accompaniment in piano-roll representation. D3PIA incorporates Neighborhood Attention (NA) to both encode the lead sheet and condition it for predicting note states in the piano accompaniment. This design enhances local contextual modeling by efficiently attending to nearby melody and chord conditions. We evaluate our model using the POP909 dataset, a widely used benchmark for piano accompaniment generation. Objective evaluation results demonstrate that D3PIA preserves chord conditions more faithfully compared to continuous diffusion-based and Transformer-based baselines. Furthermore, a subjective listening test indicates that D3PIA generates more musically coherent accompaniments than the comparison models.
- Abstract(参考訳): シンボリック・ミュージック・ドメインにおけるピアノ伴奏の生成は、リード・シートによって提供されるようなメロディや和音の制約から完全なピアノ音楽を作り出すことを必要とする困難な作業である。
本稿では,ピアノロール表現におけるリードシートと伴奏の局所的アライメントを利用した,離散拡散型ピアノ伴奏生成モデルD3PIAを提案する。
D3PIAは、隣り合う注意(NA)を、リードシートをエンコードし、ピアノ伴奏の音符状態を予測する条件の両方に組み込む。
この設計は、近隣のメロディやコード条件に効率的に対応することで、局所的な文脈モデリングを強化する。
ピアノ伴奏生成のベンチマークであるPOP909データセットを用いて,本モデルの評価を行った。
目的評価の結果,D3PIAは連続拡散に基づくベースラインやトランスフォーマーベースのベースラインに比べ,コード条件を忠実に保っていることがわかった。
さらに、主観的聴取テストでは、D3PIAは比較モデルよりも、より音楽的にコヒーレントな伴奏を生成する。
関連論文リスト
- PianoVAM: A Multimodal Piano Performance Dataset [56.318475235705954]
PianoVAMは、ビデオ、オーディオ、MIDI、手のランドマーク、指のラベル、リッチメタデータを含む包括的なピアノパフォーマンスデータセットである。
データセットはディクラヴィエピアノを使用して録音され、アマチュアピアニストの日々の練習セッション中にオーディオとMIDIをキャプチャした。
事前訓練されたポーズ推定モデルと半自動指先アノテーションアルゴリズムを用いて,手指のランドマークと指先ラベルを抽出した。
論文 参考訳(メタデータ) (2025-09-10T17:35:58Z) - Scaling Self-Supervised Representation Learning for Symbolic Piano Performance [52.661197827466886]
本研究では,多量のシンボリック・ピアノ転写を訓練した自己回帰型トランスフォーマモデルの能力について検討した。
比較的小型で高品質なサブセットをファインチューンモデルに使い、音楽の継続を生成、シンボリックな分類タスクを実行し、汎用的なコントラストMIDI埋め込みを生成する。
論文 参考訳(メタデータ) (2025-06-30T14:00:14Z) - D3RM: A Discrete Denoising Diffusion Refinement Model for Piano Transcription [7.108713005834857]
離散拡散モデルを用いたピアノの書き起こしのための新しいアーキテクチャを提案する。
提案手法は,F1スコアの点から,従来の拡散型ピアノ書き起こしモデルとベースラインモデルより優れていた。
論文 参考訳(メタデータ) (2025-01-09T08:44:06Z) - Sines, Transient, Noise Neural Modeling of Piano Notes [0.0]
3つのサブモジュールはピアノ録音からコンポーネントを学び、ハーモニック、トランジェント、ノイズ信号を生成する。
特異点から、三弦の異なる鍵と畳み込みに基づくネットワークとの結合をエミュレートする。
その結果、モデルがターゲットの部分分布と一致し、スペクトルの上部のエネルギーがより多くの課題をもたらすことを予測した。
論文 参考訳(メタデータ) (2024-09-10T13:48:18Z) - DITTO: Diffusion Inference-Time T-Optimization for Music Generation [49.90109850026932]
Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:10:10Z) - FP-Diffusion: Improving Score-based Diffusion Models by Enforcing the
Underlying Score Fokker-Planck Equation [72.19198763459448]
雑音が増大する傾向にあるデータ密度に対応する雑音条件スコア関数の族を学習する。
これらの摂動データ密度は、密度の時空間進化を管理する偏微分方程式(PDE)であるフォッカー・プランク方程式(Fokker-Planck equation, FPE)によって結合される。
我々は、摂動データ密度の雑音条件スコアを特徴付けるスコアFPEと呼ばれる対応する方程式を導出する。
論文 参考訳(メタデータ) (2022-10-09T16:27:25Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。