Fugu-MT 論文翻訳(概要): Motifs, Phrases, and Beyond: The Modelling of Structure in Symbolic Music Generation

論文の概要: Motifs, Phrases, and Beyond: The Modelling of Structure in Symbolic Music Generation

arxiv url: http://arxiv.org/abs/2403.07995v1
Date: Tue, 12 Mar 2024 18:03:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-14 16:55:08.640321
Title: Motifs, Phrases, and Beyond: The Modelling of Structure in Symbolic Music Generation
Title（参考訳）: モチーフ, プラース, その他: シンボリック構造モデリング音楽生成
Authors: Keshav Bhandari, Simon Colton
Abstract要約: 音楽構造をモデル化することは、シンボリック・ミュージック・コンポジションを生成する人工知能システムにとって重要な課題である。本稿では,コヒーレント構造を取り入れた手法の進化を概観する。我々は,すべての時代のアプローチを組み合わせることによる相乗効果を実現するために,いくつかの重要な方向性を概説する。
参考スコア（独自算出の注目度）: 2.8062498505437055
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Modelling musical structure is vital yet challenging for artificial intelligence systems that generate symbolic music compositions. This literature review dissects the evolution of techniques for incorporating coherent structure, from symbolic approaches to foundational and transformative deep learning methods that harness the power of computation and data across a wide variety of training paradigms. In the later stages, we review an emerging technique which we refer to as "sub-task decomposition" that involves decomposing music generation into separate high-level structural planning and content creation stages. Such systems incorporate some form of musical knowledge or neuro-symbolic methods by extracting melodic skeletons or structural templates to guide the generation. Progress is evident in capturing motifs and repetitions across all three eras reviewed, yet modelling the nuanced development of themes across extended compositions in the style of human composers remains difficult. We outline several key future directions to realize the synergistic benefits of combining approaches from all eras examined.
Abstract（参考訳）: 音楽構造をモデル化することは、シンボリック・ミュージック・コンポジションを生成する人工知能システムにとって重要な課題である。本稿では,コヒーレントな構造を取り入れた手法の進化を,記号的アプローチから,多種多様な訓練パラダイムをまたいだ計算とデータのパワーを利用する基礎的および変換的深層学習手法まで,論じる。後段では、音楽生成を高レベルな構造計画とコンテンツ生成段階に分解する「サブタスク分解」と呼ばれる新しい手法を概観する。このようなシステムには、メロディック骨格や構造的テンプレートを抽出して生成を導くことで、ある種の音楽的知識やニューロシンボリックな手法が組み込まれている。進歩は、レビューされた3つの時代のモチーフと反復を捉える上で明らかであるが、人間の作曲家のスタイルで拡張された作曲にまたがるテーマの微妙な展開をモデル化することは依然として困難である。我々は,すべての時代のアプローチを組み合わせることによる相乗効果を実現するために,いくつかの重要な方向性を概説する。

関連論文リスト

Selective Imperfection as a Generative Framework for Analysis, Creativity and Discovery [1.3537117504260623]
音が科学的プローブとしてどのように機能し,聴取が視聴のモードとなり,作曲が物質に対する青写真となるかを示す。我々は,科学と芸術は制約の下での世界構築の創造的な行為であり,振動はスケールをまたいだ共有文法組織構造であることを示す。
論文参考訳（メタデータ） (2025-12-30T11:14:51Z)
Discovering "Words" in Music: Unsupervised Learning of Compositional Sparse Code for Symbolic Music [50.87225308217594]
本稿では,記号的音楽データから「音楽単語」と呼ばれる繰り返しパターンを識別する教師なし機械学習アルゴリズムを提案する。本稿では,音楽単語発見の課題を統計的最適化問題として定式化し,二段階予測最大化(EM)に基づく学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-29T11:10:57Z)
Etude: Piano Cover Generation with a Three-Stage Approach -- Extract, strucTUralize, and DEcode [0.0]
ピアノカバー生成は、ポップソングをピアノアレンジメントに変換することを目的としている。既存のモデルは、オリジナルの曲と構造的な整合性を維持するのに失敗することが多い。構造的類似性を定義するため、リズム情報は不可欠である。本モデルでは, 適切な楽曲構造を保ち, 流音や音楽のダイナミクスを向上し, 高い制御可能な生成を支援するカバーを製作する。
論文参考訳（メタデータ） (2025-09-20T04:06:43Z)
Foundation Models for Music: A Survey [77.77088584651268]
ファンデーションモデル(FM)は音楽を含む様々な分野に大きな影響を与えている。本総説では,音楽の事前学習モデルと基礎モデルについて概観する。
論文参考訳（メタデータ） (2024-08-26T15:13:14Z)
ComposerX: Multi-Agent Symbolic Music Composition with LLMs [51.68908082829048]
音楽の構成は、長い依存と調和の制約で情報を理解し、生成する能力を必要とする複雑なタスクである。現在のLLMは、このタスクで簡単に失敗し、In-Context-LearningやChain-of-Thoughtsといったモダンな技術が組み込まれても、不適切な曲を生成する。エージェントベースのシンボリック音楽生成フレームワークであるComposerXを提案する。
論文参考訳（メタデータ） (2024-04-28T06:17:42Z)
Discrete, compositional, and symbolic representations through attractor dynamics [51.20712945239422]
我々は,思考の確率的言語(PLoT)に似た認知過程をモデル化するために,アトラクタダイナミクスを記号表現と統合した新しいニューラルシステムモデルを導入する。我々のモデルは、連続表現空間を、事前定義されたプリミティブに頼るのではなく、教師なし学習を通じて、記号系の意味性と構成性の特徴を反映する、記号列に対応する引き付け状態を持つ離散盆地に分割する。このアプローチは、認知操作の複雑な双対性を反映したより包括的なモデルを提供する、AIにおける表現力の証明された神経弁別可能な基質であるニューラルダイナミクスを通じて、シンボル処理とサブシンボル処理の両方を統合する統一的なフレームワークを確立する。
論文参考訳（メタデータ） (2023-10-03T05:40:56Z)
Motif-Centric Representation Learning for Symbolic Music [5.781931021964343]
我々は、表現学習を通してモチーフとそのバリエーションの間の暗黙の関係を学習する。正規化に基づくVICRegは事前学習に採用され、コントラスト学習は微調整に使用されている。得られたモチーフ表現を可視化し、楽曲全体の構造を直感的に理解する。
論文参考訳（メタデータ） (2023-09-19T13:09:03Z)
Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文参考訳（メタデータ） (2023-07-25T17:59:18Z)
A Recursive Bateson-Inspired Model for the Generation of Semantic Formal Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文参考訳（メタデータ） (2023-07-16T15:59:13Z)
WuYun: Exploring hierarchical skeleton-guided melody generation using knowledge-enhanced deep learning [26.515527387450636]
WuYunは、生成された旋律の構造を改善するための知識に富んだディープラーニングアーキテクチャである。音楽領域の知識を用いてメロディカルスケルトンを抽出し、シーケンシャルラーニングを用いて再構成する。 We demonstrate that WuYun can generate melodies with better long-term structure and musicality and improves other-of-the-art method by average 0.51。
論文参考訳（メタデータ） (2023-01-11T14:33:42Z)
Music Composition with Deep Learning: A Review [1.7188280334580197]
創造性のある音楽を生成するための,現在のディープラーニングモデルの能力について分析する。理論的観点からこれらのモデルと作曲過程を比較した。
論文参考訳（メタデータ） (2021-08-27T13:53:53Z)
Sequence Generation using Deep Recurrent Networks and Embeddings: A study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文参考訳（メタデータ） (2020-12-02T14:19:19Z)
Learning Interpretable Representation for Controllable Polyphonic Music Generation [5.01266258109807]
我々は、ポリフォニック音楽の2つの解釈可能な潜在要素である和音とテクスチャを効果的に学習する新しいアーキテクチャを設計する。このようなコード・テクスチャ・ディコンタングルメントは,広い範囲の応用につながる制御可能な生成経路を提供することを示す。
論文参考訳（メタデータ） (2020-08-17T07:11:16Z)
Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。 Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文参考訳（メタデータ） (2020-01-06T18:35:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。