論文の概要: Incorporating Structure and Chord Constraints in Symbolic Transformer-based Melodic Harmonization
- arxiv url: http://arxiv.org/abs/2512.07627v1
- Date: Mon, 08 Dec 2025 15:16:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.941682
- Title: Incorporating Structure and Chord Constraints in Symbolic Transformer-based Melodic Harmonization
- Title(参考訳): シンボリックトランスフォーマーを用いたメロディック調和における構造と弦の制約
- Authors: Maximos Kaliakatsos-Papakostas, Konstantinos Soiledis, Theodoros Tsamis, Dimos Makris, Vassilis Katsouros, Emilios Cambouropoulos,
- Abstract要約: 本稿では,メロディに予め定義されたコード制約,すなわち特定の位置にある所望のコードとメロディを入力として提供する場合について検討する。
このような制約にかかわる特異性について論じ、この問題に対処するためのアルゴリズムを提案する。
このアルゴリズムはB*と呼ばれ、ビームサーチとA*の側面とバックトラックを組み合わせて、事前訓練されたトランスフォーマーにコード制約を満たすように強制する。
- 参考スコア(独自算出の注目度): 2.087792589220897
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transformer architectures offer significant advantages regarding the generation of symbolic music; their capabilities for incorporating user preferences toward what they generate is being studied under many aspects. This paper studies the inclusion of predefined chord constraints in melodic harmonization, i.e., where a desired chord at a specific location is provided along with the melody as inputs and the autoregressive transformer model needs to incorporate the chord in the harmonization that it generates. The peculiarities of involving such constraints is discussed and an algorithm is proposed for tackling this task. This algorithm is called B* and it combines aspects of beam search and A* along with backtracking to force pretrained transformers to satisfy the chord constraints, at the correct onset position within the correct bar. The algorithm is brute-force and has exponential complexity in the worst case; however, this paper is a first attempt to highlight the difficulties of the problem and proposes an algorithm that offers many possibilities for improvements since it accommodates the involvement of heuristics.
- Abstract(参考訳): トランスフォーマーアーキテクチャは、シンボリック音楽の生成に大きな利点をもたらす。
本稿では, メロディ調和において予め定義されたコード制約, すなわち, 特定の位置にある所望のコードと, メロディを入力とし, 自己回帰変換器モデルが生成する和音にコードを統合する必要がある場合について検討する。
このような制約にかかわる特異性について論じ、この問題に対処するためのアルゴリズムを提案する。
このアルゴリズムはB*と呼ばれ、ビームサーチとA*の側面とバックトラックを組み合わせて、正しいバー内の正しいオンセット位置において、事前訓練されたトランスフォーマーにコード制約を満たすように強制する。
しかし,本論文は問題の難しさを強調するための最初の試みであり,ヒューリスティックスへの関与に対応するため,多くの可能性を提供するアルゴリズムを提案する。
関連論文リスト
- In-Context Algorithm Emulation in Fixed-Weight Transformers [13.585357287532588]
凍結したウェイトを持つ最小のトランスフォーマーは、コンテキスト内プロンプトによって幅広いアルゴリズムのクラスをエミュレートする。
1つの固定重2層アテンションモジュールは、プロンプトのみを通してタスク固有のクラスから全てのアルゴリズムをエミュレートする。
論文 参考訳(メタデータ) (2025-08-24T23:20:31Z) - ChordFormer: A Conformer-Based Architecture for Large-Vocabulary Audio Chord Recognition [1.2187048691454239]
和音認識は、音楽分析における和音の記述的性質により、音楽情報検索において重要な課題となる。
この研究は、大きな語彙に対する構造的コード認識(トリアード、ベース、セブンズなど)に取り組むために設計された、新しいコンバータベースのアーキテクチャであるChordFormerを提案する。
ChordFormerは最先端モデルより優れており、フレームワイドの精度が2%向上し、大語彙のコードデータセットではクラスワイドの精度が6%向上している。
論文 参考訳(メタデータ) (2025-02-17T14:35:16Z) - Music102: An $D_{12}$-equivariant transformer for chord progression accompaniment [0.0]
Music102は、$D_12$-equivariant Transformerによるコード進行伴奏の強化を目的とした高度なモデルである。
グループ理論とシンボリック音楽構造にインスパイアされたMusic102は、トランスポジションやリフレクション操作のような音楽対称性を活用し、これらの特性をトランスフォーマーアーキテクチャに統合する。
論文 参考訳(メタデータ) (2024-10-23T03:11:01Z) - Unifying Symbolic Music Arrangement: Track-Aware Reconstruction and Structured Tokenization [19.27890803128116]
自動マルチトラック音楽アレンジメントのための統合フレームワークを提案する。
中心となるのは、トークンレベルのアンタングルされたコンテンツとスタイルで動作するセグメントレベルの再構築目標である。
トラックワイズ・モデリングを支援するため,マルチトラック・シンボリック・ミュージックのための構造化トークン化手法であるREMI-zを導入する。
論文 参考訳(メタデータ) (2024-08-27T16:18:51Z) - GEC-DePenD: Non-Autoregressive Grammatical Error Correction with
Decoupled Permutation and Decoding [52.14832976759585]
文法的誤り訂正(GEC)は、通常自己回帰的なシーケンス・ツー・シーケンスモデルで解決される重要なNLPタスクである。
本稿では, アーキテクチャを置換ネットワークに分離する, GEC に対する非自己回帰的アプローチを提案する。
GECの既知の非自己回帰手法よりもネットワークが向上することを示す。
論文 参考訳(メタデータ) (2023-11-14T14:24:36Z) - Variational Quantum Harmonizer: Generating Chord Progressions and Other
Sonification Methods with the VQE Algorithm [0.1675245825272646]
本研究では、変分量子固有解法(VQE)アルゴリズムにより最適化された二次非拘束二項最適化(QUBO)問題の物理的ソナリゼーションを用いて検討する。
VQEは、量子コンピュータと古典最適化ルーチンの間の反復ループを用いて問題の解を近似する。
この実装は、変分量子調和器(VQH)という音楽インタフェースのプロトタイプの形で実現された。
論文 参考訳(メタデータ) (2023-09-21T16:58:35Z) - Cycle Encoding of a StyleGAN Encoder for Improved Reconstruction and
Editability [76.6724135757723]
GANインバージョンは、事前訓練されたGANの潜在空間に入力イメージを反転させることを目的としている。
GANの逆転の最近の進歩にもかかわらず、歪みと編集性の間のトレードオフを軽減するための課題は残されている。
本稿では、まず入力画像をピボットコードと呼ばれる潜在コードに反転させ、次に、入力画像を正確にピボットコードにマッピングできるようにジェネレータを変更する2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2022-07-19T16:10:16Z) - Symphony Generation with Permutation Invariant Language Model [57.75739773758614]
変分不変言語モデルに基づくシンフォニーネットという記号的シンフォニー音楽生成ソリューションを提案する。
シンフォニートークンの超長いシーケンスをモデル化するためのバックボーンとして、新しいトランスフォーマーデコーダアーキテクチャが導入された。
実験結果から,提案手法は人間の構成と比べ,コヒーレント,新規,複雑,調和的な交響曲を生成できることが示唆された。
論文 参考訳(メタデータ) (2022-05-10T13:08:49Z) - Discovering Non-monotonic Autoregressive Orderings with Variational
Inference [67.27561153666211]
我々は、訓練データから高品質な生成順序を純粋に検出する、教師なし並列化可能な学習装置を開発した。
エンコーダを非因果的注意を持つトランスフォーマーとして実装し、1つのフォワードパスで置換を出力する。
言語モデリングタスクにおける経験的結果から,我々の手法は文脈認識であり,一定の順序と競合する,あるいはより優れた順序を見つけることができる。
論文 参考訳(メタデータ) (2021-10-27T16:08:09Z) - A framework to compare music generative models using automatic
evaluation metrics extended to rhythm [69.2737664640826]
本稿では,前回の研究で提示された,リズムを考慮せず,設計決定を下すための枠組みを取り上げ,単音素音楽作成における2つのrnnメモリセルの性能評価のためにリズムサポートを付加した。
モデルでは,音素変換の処理を考慮し,リズムサポートを付加した幾何学に基づく自動計測値を用いて,生成した楽曲の質を評価する。
論文 参考訳(メタデータ) (2021-01-19T15:04:46Z) - RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement
Learning [69.20460466735852]
本稿では,オンライン伴奏生成のための深層強化学習アルゴリズムを提案する。
提案アルゴリズムは人体に応答し,メロディック,ハーモニック,多種多様な機械部品を生成する。
論文 参考訳(メタデータ) (2020-02-08T03:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。