論文の概要: Tonal parsimony in chord-sequence analysis: combining modulation cost and tonal vocabulary
- arxiv url: http://arxiv.org/abs/2606.03459v1
- Date: Tue, 02 Jun 2026 10:36:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 10:57:21.738596
- Title: Tonal parsimony in chord-sequence analysis: combining modulation cost and tonal vocabulary
- Title(参考訳): コードシーケンス解析における音節パシモニー--変調コストと音節語彙の組み合わせ
- Authors: François Pachet,
- Abstract要約: コード配列に対する局所音節の割り当てについて検討する。
標準的な動的プログラミング手法は変調を最小化するが、必然的に多くの音調中心を導入することができる。
我々は、この遷移のみの目的を、純最小語彙分析と音節パシモニーと比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the assignment of local tonalities to chord sequences, a task useful for harmonic analysis, composition, and jazz-oriented improvisation. Standard dynamic-programming approaches minimize modulations but can introduce unnecessarily many tonal centers. We compare this transition-only objective with pure minimum-vocabulary analysis and with tonal parsimony, which minimizes lexicographically the number of modulations and then the number of distinct tonalities. Although this joint objective is combinatorially hard in general, we give exact algorithms exploiting the fixed 24-tonality major/minor universe. On 31,032 LMD Chords sequences, tonal parsimony preserves the transition optimum while reducing tonal vocabulary in 55.8% of cases. With weighted jazz-substitution closure, it lowers mean tonalities from 3.802 to 3.206 and modulations from 16.728 to 12.141. On 1,555 annotated jazz standards, it improves compatible chord-scale agreement to 95.6%, supporting tractable professional-scale harmonic analysis.
- Abstract(参考訳): 和声分析,作曲,ジャズ指向の即興化に有用な課題である和音列への局所音節の割り当てについて検討する。
標準的な動的プログラミング手法は変調を最小化するが、必然的に多くの音調中心を導入することができる。
我々は、この遷移のみの目的を、純粋最小語彙解析と音節パシモニーと比較し、語彙的に変調の数と異なる音節の数を最小限に抑える。
この合同目的は一般には組み合わせが難しいが、固定された24トン長大小宇宙を利用する正確なアルゴリズムを与える。
31,032 LMD コード配列では、音節パシモニーは、音節の語彙を55.8%の症例で減少させながら、音節の最適な遷移を保っている。
ジャズ代替の重み付けにより、平均音節は3.802から3.206に減少し、変調は16.728から12.141に低下する。
1,555のアノテートされたジャズ標準では、互換性のあるコードスケールの契約を95.6%に改善し、トラクタブルなプロフェッショナルスケールのハーモニック分析をサポートする。
関連論文リスト
- Pay (Cross) Attention to the Melody: Curriculum Masking for Single-Encoder Melodic Harmonization [2.087792589220897]
我々は,複数のトレーニングステップにおいて,すべての調和トークンを隠蔽する訓練カリキュラムFF(Full-to-Full)を導入する。
複数の実験軸にまたがる事前カリキュラムに対して,本手法を系統的に評価した。
その結果、提案するFFカリキュラムは、ほぼすべての指標において、ベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2026-01-22T17:46:31Z) - Incorporating Structure and Chord Constraints in Symbolic Transformer-based Melodic Harmonization [2.087792589220897]
本稿では,メロディに予め定義されたコード制約,すなわち特定の位置にある所望のコードとメロディを入力として提供する場合について検討する。
このような制約にかかわる特異性について論じ、この問題に対処するためのアルゴリズムを提案する。
このアルゴリズムはB*と呼ばれ、ビームサーチとA*の側面とバックトラックを組み合わせて、事前訓練されたトランスフォーマーにコード制約を満たすように強制する。
論文 参考訳(メタデータ) (2025-12-08T15:16:33Z) - YingMusic-Singer: Zero-shot Singing Voice Synthesis and Editing with Annotation-free Melody Guidance [16.462715982402884]
SVS(Singing Voice Synthesis)は、音素レベルの正確なアライメントに強く依存しているため、実際の展開には制約が残っている。
メロディに追従した任意の歌詞を合成できるメロディ駆動のSVSフレームワークを提案する。
提案手法は,Diffusion Transformer (DiT) アーキテクチャ上に構築され,メロディ抽出モジュールに拡張されている。
論文 参考訳(メタデータ) (2025-12-04T13:25:33Z) - A correlation-permutation approach for speech-music encoders model merging [80.83944654755022]
本稿では,音楽エンコーダの内部層を音声エンコーダと整合させる相関置換手法を提案する。
この方法は、モデルの特徴的相互相関層を層単位で最大化する置換行列を計算する。
この作業により、独立に訓練されたエンコーダから統一されたオーディオモデルを作成することができる。
論文 参考訳(メタデータ) (2025-06-13T02:04:33Z) - Syntactic Control of Language Models by Posterior Inference [53.823006836309695]
言語モデルによって生成されたテキストの構文構造を制御することは、明快さ、スタイリスティックな一貫性、解釈可能性を必要とするアプリケーションにとって重要である。
後部推論に基づくサンプリングアルゴリズムは、生成中に対象の選挙区構造を効果的に強制することができると論じる。
提案手法では,提案分布からのサンプリングにより後続分布を推定するモンテカルロ法と,各生成したトークンが所望の構文構造に整合することを保証する統語タグを併用する。
論文 参考訳(メタデータ) (2025-06-08T14:01:34Z) - EquiBench: Benchmarking Large Language Models' Reasoning about Program Semantics via Equivalence Checking [58.15568681219339]
大規模言語モデル(LLM)を評価するための新しいベンチマークであるEquiBenchを紹介する。
このタスクは、プログラムのセマンティクスについて推論するモデルの能力を直接テストする。
19の最先端LCMを評価し、最も難しいカテゴリでは、最高の精度は63.8%と76.2%であり、50%のランダムベースラインよりわずかに高い。
論文 参考訳(メタデータ) (2025-02-18T02:54:25Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - DiffSinger: Diffusion Acoustic Model for Singing Voice Synthesis [53.19363127760314]
DiffSingerは、音楽スコアで調整されたメログラムにノイズを反復的に変換するパラメータ化されたマルコフチェーンです。
中国の歌唱データセットで行った評価は、DiffSingerが最先端のSVSワークを顕著な差で上回っていることを示している。
論文 参考訳(メタデータ) (2021-05-06T05:21:42Z) - Time-Frequency Scattering Accurately Models Auditory Similarities
Between Instrumental Playing Techniques [5.923588533979649]
音色知覚は楽器や演奏技術だけで提供されるものよりも柔軟な分類法で機能することを示す。
本稿では,楽器,ミュート,技法間の類似性のクラスタグラフを復元するマシンリスニングモデルを提案する。
論文 参考訳(メタデータ) (2020-07-21T16:37:15Z) - Automatic Melody Harmonization with Triad Chords: A Comparative Study [24.95868747256647]
本研究は,本課題に対する一組の標準的アプローチの性能を評価し,比較する比較研究である。
本研究のために新たに収集した9,226個のメロディ/コード対のデータセットを用いて,最大48個の三和弦について評価を行った。
論文 参考訳(メタデータ) (2020-01-08T03:47:33Z) - Exact Hard Monotonic Attention for Character-Level Transduction [76.66797368985453]
非単調なソフトアテンションを用いたニューラルシークエンス・ツー・シーケンスモデルは、しばしば一般的な単調モデルよりも優れていることを示す。
我々は、厳密な単調性を強制し、トランスデューサの学習中に協調して潜時アライメントを学習するハードアテンションシーケンス・ツー・シーケンス・モデルを開発した。
論文 参考訳(メタデータ) (2019-05-15T17:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。