論文の概要: Modeling Musical Structure with Artificial Neural Networks
- arxiv url: http://arxiv.org/abs/2001.01720v1
- Date: Mon, 6 Jan 2020 18:35:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 03:11:52.760313
- Title: Modeling Musical Structure with Artificial Neural Networks
- Title(参考訳): ニューラルネットワークを用いた音楽構造モデリング
- Authors: Stefan Lattner
- Abstract要約: 音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, artificial neural networks (ANNs) have become a universal
tool for tackling real-world problems. ANNs have also shown great success in
music-related tasks including music summarization and classification,
similarity estimation, computer-aided or autonomous composition, and automatic
music analysis. As structure is a fundamental characteristic of Western music,
it plays a role in all these tasks. Some structural aspects are particularly
challenging to learn with current ANN architectures. This is especially true
for mid- and high-level self-similarity, tonal and rhythmic relationships. In
this thesis, I explore the application of ANNs to different aspects of musical
structure modeling, identify some challenges involved and propose strategies to
address them. First, using probability estimations of a Restricted Boltzmann
Machine (RBM), a probabilistic bottom-up approach to melody segmentation is
studied. Then, a top-down method for imposing a high-level structural template
in music generation is presented, which combines Gibbs sampling using a
convolutional RBM with gradient-descent optimization on the intermediate
solutions. Furthermore, I motivate the relevance of musical transformations in
structure modeling and show how a connectionist model, the Gated Autoencoder
(GAE), can be employed to learn transformations between musical fragments. For
learning transformations in sequences, I propose a special predictive training
of the GAE, which yields a representation of polyphonic music as a sequence of
intervals. Furthermore, the applicability of these interval representations to
a top-down discovery of repeated musical sections is shown. Finally, a
recurrent variant of the GAE is proposed, and its efficacy in music prediction
and modeling of low-level repetition structure is demonstrated.
- Abstract(参考訳): 近年、ニューラルネットワーク(anns)は、現実世界の問題に取り組むための普遍的なツールとなっている。
annはまた、音楽の要約と分類、類似度推定、コンピュータ支援または自律的な構成、自動音楽分析を含む音楽関連のタスクで大きな成功を収めている。
構造は西洋音楽の基本的特徴であるため、これら全ての課題において重要な役割を果たしている。
いくつかの構造的な側面は、現在のANNアーキテクチャで学ぶことが特に難しい。
これは特に中・高水準の自己相似性、調性、リズムの関係において当てはまる。
本稿では,音楽構造モデリングのさまざまな側面へのANNの適用について検討し,課題の特定と対処戦略を提案する。
まず,制限ボルツマンマシン(RBM)の確率推定を用いて,メロディセグメンテーションに対する確率論的ボトムアップ手法を検討した。
次に、畳み込みRBMを用いたギブスサンプリングと中間解の勾配差最適化を組み合わせた、高レベルな構造テンプレートを音楽生成に導入するトップダウン手法を提案する。
さらに、構造モデリングにおける音楽変換の関連性を動機付け、コネクショナリストモデルであるGated Autoencoder(GAE)をいかにして音楽フラグメント間の変換を学習できるかを示す。
シーケンス変換を学習するために,多音楽曲の列を間隔の列として表現するgaeの特殊予測学習を提案する。
さらに、これらの区間表現の繰り返し区間のトップダウン発見への適用性を示す。
最後に、GAEの繰り返し変奏法を提案し、低レベルの繰り返し構造の予測とモデル化におけるその有効性を示す。
関連論文リスト
- MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - Graph-based Polyphonic Multitrack Music Generation [9.701208207491879]
本稿では,音楽のための新しいグラフ表現と,音楽グラフの構造と内容を別々に生成する深部変分オートエンコーダを提案する。
音楽グラフの構造と内容を分離することにより、特定のタイミングでどの楽器が演奏されているかを指定することで条件生成が可能となる。
論文 参考訳(メタデータ) (2023-07-27T15:18:50Z) - MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training [74.32603591331718]
本稿では,MLMスタイルの音響事前学習において,教師モデルと擬似ラベルを組み込んだ大規模自己教師型学習(MERT)を用いた音響音楽理解モデルを提案する。
実験結果から,本モデルでは14曲の楽曲理解タスクを一般化し,性能を向上し,SOTA(State-of-the-art)全体のスコアを達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T18:27:43Z) - Hierarchical Recurrent Neural Networks for Conditional Melody Generation
with Long-term Structure [0.0]
階層型リカレントニューラルネットワークを用いた条件付きメロディ生成モデルを提案する。
このモデルは、与えられたコード伴奏に基づいて長期構造を持つメロディーを生成する。
聴取試験の結果,CM-HRNNは長期的構造と総合評価においてアテンションRNNよりも優れていた。
論文 参考訳(メタデータ) (2021-02-19T08:22:26Z) - A framework to compare music generative models using automatic
evaluation metrics extended to rhythm [69.2737664640826]
本稿では,前回の研究で提示された,リズムを考慮せず,設計決定を下すための枠組みを取り上げ,単音素音楽作成における2つのrnnメモリセルの性能評価のためにリズムサポートを付加した。
モデルでは,音素変換の処理を考慮し,リズムサポートを付加した幾何学に基づく自動計測値を用いて,生成した楽曲の質を評価する。
論文 参考訳(メタデータ) (2021-01-19T15:04:46Z) - Sequence Generation using Deep Recurrent Networks and Embeddings: A
study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。
提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文 参考訳(メタデータ) (2020-12-02T14:19:19Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Music Generation with Temporal Structure Augmentation [0.0]
提案手法は,歌の結末をカウントダウンしたコネクショニスト生成モデルと,余分な入力特徴としてメーターマーカーを付加する。
LSTMセルを持つRNNアーキテクチャは、教師付きシーケンス学習設定でノッティンガムフォークミュージックデータセットに基づいて訓練される。
実験では、両方のアノテーションの予測性能が改善された。
論文 参考訳(メタデータ) (2020-04-21T19:19:58Z) - RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement
Learning [69.20460466735852]
本稿では,オンライン伴奏生成のための深層強化学習アルゴリズムを提案する。
提案アルゴリズムは人体に応答し,メロディック,ハーモニック,多種多様な機械部品を生成する。
論文 参考訳(メタデータ) (2020-02-08T03:53:52Z) - Continuous Melody Generation via Disentangled Short-Term Representations
and Structural Conditions [14.786601824794369]
ユーザが指定したシンボリックシナリオと過去の音楽コンテキストを組み合わせることで,メロディーを構成するモデルを提案する。
本モデルでは,8拍子の音符列を基本単位として長い旋律を生成でき,一貫したリズムパターン構造を他の特定の歌と共有することができる。
その結果,本モデルが生成する音楽は,顕著な繰り返し構造,豊かな動機,安定したリズムパターンを有する傾向が示唆された。
論文 参考訳(メタデータ) (2020-02-05T06:23:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。