論文の概要: Music Generation Using an LSTM
- arxiv url: http://arxiv.org/abs/2203.12105v1
- Date: Wed, 23 Mar 2022 00:13:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 09:35:17.079847
- Title: Music Generation Using an LSTM
- Title(参考訳): LSTMを用いた音楽生成
- Authors: Michael Conner, Lucas Gral, Kevin Adams, David Hunger, Reagan Strelow,
and Alexander Neuwirth
- Abstract要約: LSTM(Long Short-Term Memory)ネットワーク構造は、シリーズの次の出力の予測に非常に有用であることが証明されている。
Recurrent Neural Networks (RNN) を用いた音楽生成手法の実証
我々は、音楽生成におけるLSTMの直感、理論、応用に関する簡単な要約を提供し、この目標を達成するのに最適なネットワークを開発し、提示し、直面する問題や課題を特定し、対処し、今後のネットワーク改善の可能性を含める。
- 参考スコア(独自算出の注目度): 52.77024349608834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the past several years, deep learning for sequence modeling has grown in
popularity. To achieve this goal, LSTM network structures have proven to be
very useful for making predictions for the next output in a series. For
instance, a smartphone predicting the next word of a text message could use an
LSTM. We sought to demonstrate an approach of music generation using Recurrent
Neural Networks (RNN). More specifically, a Long Short-Term Memory (LSTM)
neural network. Generating music is a notoriously complicated task, whether
handmade or generated, as there are a myriad of components involved. Taking
this into account, we provide a brief synopsis of the intuition, theory, and
application of LSTMs in music generation, develop and present the network we
found to best achieve this goal, identify and address issues and challenges
faced, and include potential future improvements for our network.
- Abstract(参考訳): ここ数年、シーケンスモデリングのためのディープラーニングが人気を博してきた。
この目的を達成するために、LSTMネットワーク構造はシリーズの次の出力の予測に非常に有用であることが証明されている。
例えば、テキストメッセージの次の単語を予測するスマートフォンはLSTMを使用することができる。
Recurrent Neural Networks (RNN) を用いた音楽生成手法の実証を試みた。
具体的には、Long Short-Term Memory (LSTM) ニューラルネットワークである。
音楽の生成は、手作りでも生成でも、無数の部品があるため、非常に複雑な作業である。
これを考慮し、私たちは音楽生成におけるLSTMの直観、理論、応用の簡単な要約、この目標を達成するのに最適なネットワークの開発と提示、直面している問題と課題の特定と解決、そして、我々のネットワークの将来的な改善を含む。
関連論文リスト
- Music Emotion Prediction Using Recurrent Neural Networks [8.867897390286815]
本研究は,聴取者の感情状態に合うように音楽を調整することで,音楽レコメンデーションシステムを強化し,治療介入を支援することを目的とする。
ラッセルの感情クアドラントを用いて、音楽を4つの異なる感情領域に分類し、これらのカテゴリーを正確に予測できるモデルを開発する。
我々のアプローチは、Librosaを使って包括的なオーディオ機能を抽出し、標準RNN、双方向RNN、Long Short-Term Memory(LSTM)ネットワークなど、さまざまなリカレントニューラルネットワークアーキテクチャを適用します。
論文 参考訳(メタデータ) (2024-05-10T18:03:20Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - Recurrent Neural Networks and Long Short-Term Memory Networks: Tutorial
and Survey [9.092591746522483]
本稿では,Recurrent Neural Network (RNN), Long Short-Term Memory Network (LSTM)とその変種について述べる。
まず、動的システムとRNNの時間によるバックプロパゲーションから始めます。
本稿では,長期依存関係における勾配消滅と爆発の問題点について論じる。
そして、LSTMゲートと細胞、LSTMの歴史とバリエーション、およびGated Recurrent Units (GRU)を紹介する。
論文 参考訳(メタデータ) (2023-04-22T18:22:10Z) - Sign Language Recognition via Skeleton-Aware Multi-Model Ensemble [71.97020373520922]
手話は一般的に、聴覚障害者やミュート人がコミュニケーションするために使われる。
孤立手話認識(SLR)のためのGlobal Ensemble Model(GEM)を用いた新しいマルチモーダルフレームワークを提案する。
提案するSAM-SLR-v2 フレームワークは極めて有効であり,最先端の性能を高いマージンで達成している。
論文 参考訳(メタデータ) (2021-10-12T16:57:18Z) - Working Memory Connections for LSTM [51.742526187978726]
ワーキングメモリ接続は,様々なタスクにおけるLSTMの性能を常に向上することを示す。
数値的な結果は、細胞状態がゲート構造に含まれる価値のある情報を含んでいることを示唆している。
論文 参考訳(メタデータ) (2021-08-31T18:01:30Z) - Music Generation using Deep Learning [10.155748914174003]
提案したアプローチは、NottinghamデータセットからABCの表記を受け取り、ニューラルネットワークの入力として強化されるようにエンコードする。
主な目的は、任意の音符でニューラルネットワークを入力し、良い曲が生成されるまで、音符に基づいてネットワーク処理とシーケンスの増強を行うことである。
論文 参考訳(メタデータ) (2021-05-19T10:27:58Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - GANs & Reels: Creating Irish Music using a Generative Adversarial
Network [2.6604997762611204]
本稿では, 逐次成分を伴わない生成的逆数ネットワークを用いたメロディ生成手法を提案する。
音楽生成は、リカレントニューラルネットワークを使用して成功し、モデルが真正な鳴き声を生成するのに役立つシーケンス情報を学ぶ。
論文 参考訳(メタデータ) (2020-10-29T17:16:22Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z) - Attentional networks for music generation [5.012960295592238]
メロディック構造を再構成した古いスタイルの音楽、特にJAZZを生成するための深層学習に基づく音楽生成手法を提案する。
時系列データにおける長期的依存関係のモデル化の成功とビデオの場合の成功により、注目されるBi-LSTMは、音楽生成における自然な選択と早期利用の役割を果たす。
実験では,注目されたBi-LSTMが演奏された音楽の豊かさと技術的ニュアンスを維持することができることを確認した。
論文 参考訳(メタデータ) (2020-02-06T13:26:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。