論文の概要: Anchored Cyclic Generation: A Novel Paradigm for Long-Sequence Symbolic Music Generation
- arxiv url: http://arxiv.org/abs/2604.05343v1
- Date: Tue, 07 Apr 2026 02:29:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.579624
- Title: Anchored Cyclic Generation: A Novel Paradigm for Long-Sequence Symbolic Music Generation
- Title(参考訳): Anchored Cyclic Generation:Long-Sequence Symbolic Music Generationの新しいパラダイム
- Authors: Boyu Cao, Lekai Qian, Dehan Li, Haoyu Gu, Mingda Xu, Qi Liu,
- Abstract要約: 本稿では,すでに特定されている音楽のアンカー機能を利用したアンコールサイクル生成(ACG)パラダイムを提案する。
ACGパラダイムに基づいた階層型アンコールサイクル生成(Hi-ACG)フレームワークを提案する。
長いシーケンスのシンボリックな音楽生成タスクにおいて、Hi-ACGフレームワークは主観的および客観的評価において既存の主流手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 5.110814852946552
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating long sequences with structural coherence remains a fundamental challenge for autoregressive models across sequential generation tasks. In symbolic music generation, this challenge is particularly pronounced, as existing methods are constrained by the inherent severe error accumulation problem of autoregressive models, leading to poor performance in music quality and structural integrity. In this paper, we propose the Anchored Cyclic Generation (ACG) paradigm, which relies on anchor features from already identified music to guide subsequent generation during the autoregressive process, effectively mitigating error accumulation in autoregressive methods. Based on the ACG paradigm, we further propose the Hierarchical Anchored Cyclic Generation (Hi-ACG) framework, which employs a systematic global-to-local generation strategy and is highly compatible with our specifically designed piano token, an efficient musical representation. The experimental results demonstrate that compared to traditional autoregressive models, the ACG paradigm achieves reduces cosine distance by an average of 34.7% between predicted feature vectors and ground-truth semantic vectors. In long-sequence symbolic music generation tasks, the Hi-ACG framework significantly outperforms existing mainstream methods in both subjective and objective evaluations. Furthermore, the framework exhibits excellent task generalization capabilities, achieving superior performance in related tasks such as music completion.
- Abstract(参考訳): 構造的コヒーレンスで長いシーケンスを生成することは、逐次生成タスクにおける自己回帰モデルの根本的な課題である。
シンボリック・ミュージック・ジェネレーションにおいて、既存の手法は自己回帰モデル固有の過度なエラー蓄積問題によって制約され、音楽の品質と構造的整合性が低下しているため、この課題は特に顕著である。
本稿では,すでに特定されている音楽のアンカー特性に頼って,自己回帰過程の後の生成を誘導するAnchored Cyclic Generation(ACG)パラダイムを提案し,自動回帰手法におけるエラー蓄積を効果的に軽減する。
ACGパラダイムに基づいた階層型アンコレッドサイクル生成(Hi-ACG)フレームワークも提案する。
実験の結果、従来の自己回帰モデルと比較して、ACGパラダイムは予測された特徴ベクトルと接地的意味ベクトルの間の平均34.7%のコサイン距離を減少させることがわかった。
長いシーケンスのシンボリックな音楽生成タスクにおいて、Hi-ACGフレームワークは主観的および客観的評価において既存の主流手法を著しく上回っている。
さらに、このフレームワークは優れたタスク一般化能力を示し、音楽の完成のような関連するタスクにおいて優れたパフォーマンスを達成する。
関連論文リスト
- GEMs: Breaking the Long-Sequence Barrier in Generative Recommendation with a Multi-Stream Decoder [54.64137490632567]
本稿では,長期的履歴からユーザのシーケンスをキャプチャする新しい統一フレームワークを提案する。
GEM(Generative Multi-streamer)は、ユーザのシーケンスを3つのストリームに分割する。
大規模産業データセットに対する大規模な実験により、GEMは推奨精度において最先端の手法を大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-14T06:42:56Z) - Chain-of-Goals Hierarchical Policy for Long-Horizon Offline Goal-Conditioned RL [25.40364932514488]
本稿では,自己回帰シーケンスモデルとして階層的意思決定を再構築する新しい枠組みを提案する。
CoGHPは、強いオフラインベースラインを一貫して上回り、長期タスクのパフォーマンスを改善している。
論文 参考訳(メタデータ) (2026-02-03T11:11:03Z) - HiGFA: Hierarchical Guidance for Fine-grained Data Augmentation with Diffusion Models [82.10385962490051]
生成拡散モデルは、データ拡張の約束を示す。
きめ細かいタスクにそれらを適用することは、重大な課題である。
HiGFAは階層的な信頼性駆動型オーケストレーションであり、多様なが忠実な合成画像を生成する。
論文 参考訳(メタデータ) (2025-11-16T10:46:16Z) - EchoGen: Generating Visual Echoes in Any Scene via Feed-Forward Subject-Driven Auto-Regressive Model [56.53617289548353]
EchoGenは、主観駆動生成機能を備えたVisual Auto-Regressive(VAR)モデルを強化する先駆的なフレームワークである。
対象の抽象的アイデンティティを抽出するためにセマンティックエンコーダを用いており、このエンコーダは分離されたクロスアテンションを通して注入され、全体の構成を導出する。
私たちの知る限りでは、EchoGenはVARモデル上に構築された最初のフィードフォワードの主観駆動フレームワークです。
論文 参考訳(メタデータ) (2025-09-30T11:45:48Z) - Via Score to Performance: Efficient Human-Controllable Long Song Generation with Bar-Level Symbolic Notation [5.793988399290161]
曲生成は音楽AIGCにおいて最も難しい問題とみなされている。
本稿では,人間編集可能なシンボリックスコアを用いた楽曲生成のための最初のモデルであるBar-level AI Composing Helper(BACH)を提案する。
BACHは、階層的な歌の構造に合わせて、トークン化戦略と象徴的な生成手順を導入する。
論文 参考訳(メタデータ) (2025-08-02T14:58:34Z) - Scaling Self-Supervised Representation Learning for Symbolic Piano Performance [52.661197827466886]
本研究では,多量のシンボリック・ピアノ転写を訓練した自己回帰型トランスフォーマモデルの能力について検討した。
比較的小型で高品質なサブセットをファインチューンモデルに使い、音楽の継続を生成、シンボリックな分類タスクを実行し、汎用的なコントラストMIDI埋め込みを生成する。
論文 参考訳(メタデータ) (2025-06-30T14:00:14Z) - Fast Autoregressive Models for Continuous Latent Generation [49.079819389916764]
自己回帰モデルは、特にNLPにおいて、シーケンシャルなデータ生成において顕著な成功を収めている。
最近の研究で、マスク付き自己回帰モデル(MAR)は拡散ヘッドを用いて連続空間内のトーケン分布をモデル化することによって量子化をバイパスする。
本稿では,MARの拡散ヘッドを軽量ショートカットヘッドに置き換える新しいフレームワークであるFast AutoRegressive Model (FAR)を提案する。
論文 参考訳(メタデータ) (2025-04-24T13:57:08Z) - Decoupled Sequence and Structure Generation for Realistic Antibody Design [45.72237864940556]
主要なパラダイムは、モデルに抗体配列と構造を候補として共同で生成するように訓練することである。
本稿では, 配列生成と構造予測を分離した抗体配列構造デカップリング(ASSD)フレームワークを提案する。
ASSDは様々な抗体設計実験で性能が向上し、合成に基づく目的は非自己回帰モデルのトークン反復を軽減した。
論文 参考訳(メタデータ) (2024-02-08T13:02:05Z) - FIGARO: Generating Symbolic Music with Fine-Grained Artistic Control [25.95359681751144]
本稿では,グローバルレベルできめ細かな制御可能生成が可能な自己教師型記述系列タスクを提案する。
そこで本研究では、ターゲットシーケンスに関する高レベル特徴を抽出し、対応する高レベル記述が与えられたシーケンスの条件分布を、シーケンス・ツー・シーケンス・モデリング・セットアップで学習する。
学習された高次特徴と、強い帰納バイアスとして機能するドメイン知識を組み合わせることで、制御可能なシンボリック音楽生成の最先端結果を実現し、トレーニング分布をはるかに越えて一般化する。
論文 参考訳(メタデータ) (2022-01-26T13:51:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。