論文の概要: Motifs, Phrases, and Beyond: The Modelling of Structure in Symbolic
Music Generation
- arxiv url: http://arxiv.org/abs/2403.07995v1
- Date: Tue, 12 Mar 2024 18:03:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 16:55:08.640321
- Title: Motifs, Phrases, and Beyond: The Modelling of Structure in Symbolic
Music Generation
- Title(参考訳): モチーフ, プラース, その他: シンボリック構造モデリング
音楽生成
- Authors: Keshav Bhandari, Simon Colton
- Abstract要約: 音楽構造をモデル化することは、シンボリック・ミュージック・コンポジションを生成する人工知能システムにとって重要な課題である。
本稿では,コヒーレント構造を取り入れた手法の進化を概観する。
我々は,すべての時代のアプローチを組み合わせることによる相乗効果を実現するために,いくつかの重要な方向性を概説する。
- 参考スコア(独自算出の注目度): 2.8062498505437055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modelling musical structure is vital yet challenging for artificial
intelligence systems that generate symbolic music compositions. This literature
review dissects the evolution of techniques for incorporating coherent
structure, from symbolic approaches to foundational and transformative deep
learning methods that harness the power of computation and data across a wide
variety of training paradigms. In the later stages, we review an emerging
technique which we refer to as "sub-task decomposition" that involves
decomposing music generation into separate high-level structural planning and
content creation stages. Such systems incorporate some form of musical
knowledge or neuro-symbolic methods by extracting melodic skeletons or
structural templates to guide the generation. Progress is evident in capturing
motifs and repetitions across all three eras reviewed, yet modelling the
nuanced development of themes across extended compositions in the style of
human composers remains difficult. We outline several key future directions to
realize the synergistic benefits of combining approaches from all eras
examined.
- Abstract(参考訳): 音楽構造をモデル化することは、シンボリック・ミュージック・コンポジションを生成する人工知能システムにとって重要な課題である。
本稿では,コヒーレントな構造を取り入れた手法の進化を,記号的アプローチから,多種多様な訓練パラダイムをまたいだ計算とデータのパワーを利用する基礎的および変換的深層学習手法まで,論じる。
後段では、音楽生成を高レベルな構造計画とコンテンツ生成段階に分解する「サブタスク分解」と呼ばれる新しい手法を概観する。
このようなシステムには、メロディック骨格や構造的テンプレートを抽出して生成を導くことで、ある種の音楽的知識やニューロシンボリックな手法が組み込まれている。
進歩は、レビューされた3つの時代のモチーフと反復を捉える上で明らかであるが、人間の作曲家のスタイルで拡張された作曲にまたがるテーマの微妙な展開をモデル化することは依然として困難である。
我々は,すべての時代のアプローチを組み合わせることによる相乗効果を実現するために,いくつかの重要な方向性を概説する。
関連論文リスト
- Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。
本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文 参考訳(メタデータ) (2024-08-26T15:13:14Z) - ComposerX: Multi-Agent Symbolic Music Composition with LLMs [51.68908082829048]
音楽の構成は、長い依存と調和の制約で情報を理解し、生成する能力を必要とする複雑なタスクである。
現在のLLMは、このタスクで簡単に失敗し、In-Context-LearningやChain-of-Thoughtsといったモダンな技術が組み込まれても、不適切な曲を生成する。
エージェントベースのシンボリック音楽生成フレームワークであるComposerXを提案する。
論文 参考訳(メタデータ) (2024-04-28T06:17:42Z) - Discrete, compositional, and symbolic representations through attractor dynamics [51.20712945239422]
我々は,思考の確率的言語(PLoT)に似た認知過程をモデル化するために,アトラクタダイナミクスを記号表現と統合した新しいニューラルシステムモデルを導入する。
我々のモデルは、連続表現空間を、事前定義されたプリミティブに頼るのではなく、教師なし学習を通じて、記号系の意味性と構成性の特徴を反映する、記号列に対応する引き付け状態を持つ離散盆地に分割する。
このアプローチは、認知操作の複雑な双対性を反映したより包括的なモデルを提供する、AIにおける表現力の証明された神経弁別可能な基質であるニューラルダイナミクスを通じて、シンボル処理とサブシンボル処理の両方を統合する統一的なフレームワークを確立する。
論文 参考訳(メタデータ) (2023-10-03T05:40:56Z) - Motif-Centric Representation Learning for Symbolic Music [5.781931021964343]
我々は、表現学習を通してモチーフとそのバリエーションの間の暗黙の関係を学習する。
正規化に基づくVICRegは事前学習に採用され、コントラスト学習は微調整に使用されている。
得られたモチーフ表現を可視化し、楽曲全体の構造を直感的に理解する。
論文 参考訳(メタデータ) (2023-09-19T13:09:03Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - A Recursive Bateson-Inspired Model for the Generation of Semantic Formal
Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。
このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。
このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文 参考訳(メタデータ) (2023-07-16T15:59:13Z) - WuYun: Exploring hierarchical skeleton-guided melody generation using
knowledge-enhanced deep learning [26.515527387450636]
WuYunは、生成された旋律の構造を改善するための知識に富んだディープラーニングアーキテクチャである。
音楽領域の知識を用いてメロディカルスケルトンを抽出し、シーケンシャルラーニングを用いて再構成する。
We demonstrate that WuYun can generate melodies with better long-term structure and musicality and improves other-of-the-art method by average 0.51。
論文 参考訳(メタデータ) (2023-01-11T14:33:42Z) - Music Composition with Deep Learning: A Review [1.7188280334580197]
創造性のある音楽を生成するための,現在のディープラーニングモデルの能力について分析する。
理論的観点からこれらのモデルと作曲過程を比較した。
論文 参考訳(メタデータ) (2021-08-27T13:53:53Z) - Sequence Generation using Deep Recurrent Networks and Embeddings: A
study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。
提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文 参考訳(メタデータ) (2020-12-02T14:19:19Z) - Learning Interpretable Representation for Controllable Polyphonic Music
Generation [5.01266258109807]
我々は、ポリフォニック音楽の2つの解釈可能な潜在要素である和音とテクスチャを効果的に学習する新しいアーキテクチャを設計する。
このようなコード・テクスチャ・ディコンタングルメントは,広い範囲の応用につながる制御可能な生成経路を提供することを示す。
論文 参考訳(メタデータ) (2020-08-17T07:11:16Z) - Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文 参考訳(メタデータ) (2020-01-06T18:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。