Fugu-MT 論文翻訳(概要): BumbleBee: A Transformer for Music

論文の概要: BumbleBee: A Transformer for Music

arxiv url: http://arxiv.org/abs/2107.03443v1
Date: Wed, 7 Jul 2021 19:08:16 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-09 13:21:54.410877
Title: BumbleBee: A Transformer for Music
Title（参考訳）: BumbleBee:音楽用トランスフォーマー
Authors: Lucas Fenaux and Maria Juliana Quintero
Abstract要約: MIDI音楽データを生成するトランスフォーマーモデルであるBumbleBeeを紹介する。音楽変換器と長短項メモリ(LSTM)と比較する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We will introduce BumbleBee, a transformer model that will generate MIDI music data . We will tackle the issue of transformers applied to long sequences by implementing a longformer generative model that uses dilating sliding windows to compute the attention layers. We will compare our results to that of the music transformer and Long-Short term memory (LSTM) to benchmark our results. This analysis will be performed using piano MIDI files, in particular , the JSB Chorales dataset that has already been used for other research works (Huang et al., 2018)
Abstract（参考訳）: 私たちは、MIDI音楽データを生成するトランスフォーマーモデルであるBumbleBeeを紹介します。我々は,拡張スライディングウインドウを用いてアテンション層を計算するロングフォーム生成モデルを実装することで,長いシーケンスに適用されるトランスフォーマーの問題に取り組む。結果と音楽変換器と長短項メモリ(LSTM)を比較し,その結果をベンチマークする。この分析はピアノMIDIファイル、特に他の研究ですでに使われているJSB合唱団データセットを用いて行われる(Huang et al., 2018)。

関連論文リスト

Music Boomerang: Reusing Diffusion Models for Data Augmentation and Audio Manipulation [49.062766449989525]
音楽オーディオの生成モデルは、典型的にはテキストプロンプトやメロディのみに基づいて出力を生成するために使用される。画像領域に対して最近提案されたブーメランサンプリングでは,任意の事前学習拡散モデルを用いて,既存の例に近い出力を生成することができる。
論文参考訳（メタデータ） (2025-07-07T10:46:07Z)
Beat and Downbeat Tracking in Performance MIDI Using an End-to-End Transformer Architecture [2.8544822698499255]
動作MIDIにおけるビート・アンド・ダウンビート追跡のためのエンド・ツー・エンド・エンド・トランスフォーマーモデルを提案する。提案手法では,動的拡張やトークン化の最適化など,新しいデータ前処理手法を導入している。我々は,A-MAPS,ASAP,GuitarSet,Leducのデータセットを用いて,最先端の隠れマルコフモデル(HMM)とディープラーニングに基づくビートトラッキング手法との比較を行った。
論文参考訳（メタデータ） (2025-07-01T06:27:42Z)
Do we need more complex representations for structure? A comparison of note duration representation for Music Transformers [0.0]
そこで本研究では,既成のMusic Transformerモデルが,注釈のないMIDI情報のみを用いて,構造的類似度の測定を行うかどうかを問う。最も一般的な表現の微妙な微調整が、小さなが重要な改善をもたらすことを示す。
論文参考訳（メタデータ） (2024-10-14T13:53:11Z)
MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文参考訳（メタデータ） (2024-04-09T15:35:52Z)
Multi-view MidiVAE: Fusing Track- and Bar-view Representations for Long Multi-track Symbolic Music Generation [50.365392018302416]
長い多トラックのシンボリック・ミュージックを効果的にモデル化・生成するVAE手法の先駆者の一つであるMulti-view MidiVAEを提案する。我々は,ハイブリッドな変分符号化・復号化戦略を用いて,楽器の特徴と調和,および楽曲のグローバルおよびローカルな情報に焦点をあてる。
論文参考訳（メタデータ） (2024-01-15T08:41:01Z)
Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文参考訳（メタデータ） (2023-06-08T15:31:05Z)
Museformer: Transformer with Fine- and Coarse-Grained Attention for Music Generation [138.74751744348274]
本研究では,音楽生成に新たな細粒度・粗粒度対応トランスフォーマーであるMuseformerを提案する。具体的には、細かな注意を払って、特定のバーのトークンは、音楽構造に最も関係のあるバーのトークンに、直接参加する。粗い注意を払って、トークンは計算コストを減らすために、それぞれのトークンではなく他のバーの要約にのみ参加する。
論文参考訳（メタデータ） (2022-10-19T07:31:56Z)
The Power of Reuse: A Multi-Scale Transformer Model for Structural Dynamic Segmentation in Symbolic Music Generation [6.0949335132843965]
シンボリック・ミュージック・ジェネレーションは、生成モデルの文脈表現能力に依存している。粗大デコーダと細小デコーダを用いて,グローバルおよびセクションレベルのコンテキストをモデル化するマルチスケールトランスフォーマを提案する。本モデルは2つのオープンMIDIデータセットで評価され,実験により,同時代のシンボリック・ミュージック・ジェネレーション・モデルよりも優れた性能を示した。
論文参考訳（メタデータ） (2022-05-17T18:48:14Z)
Learning To Generate Piano Music With Sustain Pedals [36.9033909878202]
我々は、AILabs1k7データセットにおけるピアノ演奏の音声記録からペダル情報を取得するために、Kongらによって提案された転写モデルを用いている。次に、複合語変換器を改造して、ペダル関連トークンと他の音楽トークンを生成するトランスフォーマーデコーダを構築する。
論文参考訳（メタデータ） (2021-11-01T19:12:48Z)
MuseMorphose: Full-Song and Fine-Grained Music Style Transfer with Just One Transformer VAE [36.9033909878202]
トランスフォーマーと可変オートエンコーダ(VAE)は、シンボリック(例えばMIDI)ドメイン音楽生成に広く採用されている。本稿では,両強みを示す単一のモデルを構築するために,この2つをまとめることに興味がある。実験により、musemorphoseはrecurrent neural network(rnn)よりも多くのスタイル転送タスクで広く使われているメトリクスを先行技術で上回っていることが示されている。
論文参考訳（メタデータ） (2021-05-10T03:44:03Z)
PopMAG: Pop Music Accompaniment Generation [190.09996798215738]
単一シーケンスでの同時マルチトラック生成が可能なMUlti-track MIDI表現(MuMIDI)を提案する。 MuMIDIはシーケンス長を拡大し、長期音楽モデリングの新しい課題をもたらす。我々は,ポップミュージックの伴奏生成をPopMAGと呼ぶ。
論文参考訳（メタデータ） (2020-08-18T02:28:36Z)
Foley Music: Learning to Generate Music from Videos [115.41099127291216]
Foley Musicは、楽器を演奏する人々に関するサイレントビデオクリップのために、可愛らしい音楽を合成できるシステムだ。まず、ビデオから音楽生成に成功するための2つの重要な中間表現、すなわち、ビデオからのボディーキーポイントと、オーディオ録音からのMIDIイベントを識別する。身体の動きに応じてMIDIイベントシーケンスを正確に予測できるグラフ$-$Transformerフレームワークを提案する。
論文参考訳（メタデータ） (2020-07-21T17:59:06Z)
Pop Music Transformer: Beat-based Modeling and Generation of Expressive Pop Piano Compositions [37.66340344198797]
我々は、既存のトランスフォーマーモデルよりも優れたリズム構造でポップピアノ音楽を構成するポップ・ミュージック・トランスフォーマーを構築した。特に、入力データにメートル法構造を課すことにより、トランスフォーマーは音楽のビートバーフレーズ階層構造をより容易に認識できるようにする。
論文参考訳（メタデータ） (2020-02-01T14:12:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。