論文の概要: Pop2Piano : Pop Audio-based Piano Cover Generation
- arxiv url: http://arxiv.org/abs/2211.00895v1
- Date: Wed, 2 Nov 2022 05:42:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 14:59:15.959697
- Title: Pop2Piano : Pop Audio-based Piano Cover Generation
- Title(参考訳): Pop2Piano : ポップオーディオによるピアノカバー生成
- Authors: Jongho Choi, Kyogu Lee
- Abstract要約: 本稿では,Pop2Pianoについて紹介する。Pop2Pianoは,ポップミュージックの波形が与えられたピアノカバーを生成するトランスフォーマーネットワークである。
私たちの知る限りでは、メロディやコード抽出モジュールを使わずに、ポップオーディオから直接ピアノカバーを生成する最初のモデルです。
- 参考スコア(独自算出の注目度): 14.901465561297178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The piano cover of pop music is widely enjoyed by people. However, the
generation task of the pop piano cover is still understudied. This is partly
due to the lack of synchronized {Pop, Piano Cover} data pairs, which made it
challenging to apply the latest data-intensive deep learning-based methods. To
leverage the power of the data-driven approach, we make a large amount of
paired and synchronized {pop, piano cover} data using an automated pipeline. In
this paper, we present Pop2Piano, a Transformer network that generates piano
covers given waveforms of pop music. To the best of our knowledge, this is the
first model to directly generate a piano cover from pop audio without melody
and chord extraction modules. We show that Pop2Piano trained with our dataset
can generate plausible piano covers.
- Abstract(参考訳): ポップ音楽のピアノカバーは、人々に広く受け入れられている。
しかし、ポップピアノカバーの生成作業はまだ検討中である。
これは部分的には、同期した{pop, piano cover}データペアが欠如しているため、最新のデータ集約型ディープラーニングベースの手法の適用が困難になったためだ。
データ駆動方式のパワーを活用するため、自動パイプラインを用いて大量のペア化と同期化を施した「ポップ、ピアノカバー」データを作成する。
本稿では,ピアノカバーを生成するトランスフォーマーネットワークであるPop2Pianoについて述べる。
私たちの知る限りでは、このモデルはメロディやコード抽出モジュールを使わずにポップオーディオから直接ピアノカバーを生成する最初のモデルです。
当社のデータセットでトレーニングしたpop2pianoが,ピアノカバーを生成できることを示します。
関連論文リスト
- PIAST: A Multimodal Piano Dataset with Audio, Symbolic and Text [8.382511298208003]
PIAST(PIAST, PIano dataset with Audio, Symbolic, and Text)は、ピアノ音楽のデータセットである。
われわれはYouTubeから9,673曲を収集し、音楽の専門家による2,023曲の人間のアノテーションを追加した。
どちらも、オーディオ、テキスト、タグアノテーション、そして最先端のピアノの書き起こしとビート追跡モデルを利用したMIDIの書き起こしである。
論文 参考訳(メタデータ) (2024-11-04T19:34:13Z) - PianoMime: Learning a Generalist, Dexterous Piano Player from Internet Demonstrations [21.52466727496551]
インターネットデモを用いたピアノ演奏エージェントのトレーニングフレームワークであるPianoMimeを紹介した。
本研究では,任意の曲を演奏できるジェネラリストピアノ演奏エージェントを学習するために,これらのデモを活用している。
我々は、目に見えない曲でF1スコアの最大56%のポリシーを学習できることを示します。
論文 参考訳(メタデータ) (2024-07-25T16:37:07Z) - PianoBART: Symbolic Piano Music Generation and Understanding with Large-Scale Pre-Training [8.484581633133542]
PianoBARTは、BARTを象徴的なピアノ音楽の生成と理解の両方に使用する事前訓練されたモデルである。
我々は,PanoBARTの事前学習タスクに対して,情報漏洩や損失を防止できる多レベルオブジェクト選択戦略を考案した。
実験により、ピアノBARTは効率よく音楽パターンを学習し、高品質なコヒーレントな作品を生成する際、優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-06-26T03:35:54Z) - LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - Modeling Bends in Popular Music Guitar Tablatures [49.64902130083662]
タブラチュア表記はポピュラー音楽で広く使われ、ギター音楽のコンテンツの書き起こしや共有に使われている。
本論文は,音符のピッチを段階的にシフトできる屈曲に着目し,離散的な指板の物理的制限を回避する。
ポピュラー音楽の932個のリードギタータブラのコーパス上で実験を行い、決定木がF1スコア0.71と限られた偽陽性予測量で屈曲の発生をうまく予測することを示す。
論文 参考訳(メタデータ) (2023-08-22T07:50:58Z) - At Your Fingertips: Extracting Piano Fingering Instructions from Videos [45.643494669796866]
ビデオから指情報を自動的に抽出するAIタスクについて検討する。
ディープラーニングモジュールの組み合わせを用いて,このタスクを高精度に実行する方法を示す。
結果、90本の動画でシステムを実行し、高品質のピアノ指で150Kの音符を入力します。
論文 参考訳(メタデータ) (2023-03-07T09:09:13Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - The Piano Inpainting Application [0.0]
生成アルゴリズムは、提供された制御の制限、推論の禁止、ミュージシャンの生成への統合の欠如のために、依然としてアーティストによって広く使われていない。
本稿では,ピアノ演奏のインペインティングに着目した生成モデルであるピアノ・インペインティング・アプリケーション(PIA)について述べる。
論文 参考訳(メタデータ) (2021-07-13T09:33:11Z) - Towards Learning to Play Piano with Dexterous Hands and Touch [79.48656721563795]
そこで我々は,エージェントが機械可読音楽から直接学習して,模擬ピアノで器用な手でピアノを弾く方法を示した。
我々は、タッチ強化された報酬と、新しいタスクのカリキュラムを使用することで、これを実現する。
論文 参考訳(メタデータ) (2021-06-03T17:59:31Z) - PopMAG: Pop Music Accompaniment Generation [190.09996798215738]
単一シーケンスでの同時マルチトラック生成が可能なMUlti-track MIDI表現(MuMIDI)を提案する。
MuMIDIはシーケンス長を拡大し、長期音楽モデリングの新しい課題をもたらす。
我々は,ポップミュージックの伴奏生成をPopMAGと呼ぶ。
論文 参考訳(メタデータ) (2020-08-18T02:28:36Z) - POP909: A Pop-song Dataset for Music Arrangement Generation [10.0454303747519]
POP909はプロのミュージシャンが作成した909曲のピアノ編曲の複数バージョンを含むデータセットである。
データセットの本体は、音声メロディ、リード楽器メロディ、および元のオーディオファイルに整列したMIDIフォーマットで各曲のピアノ伴奏を含む。
我々はテンポ、ビート、キー、コードなどのアノテーションを提供し、テンポ曲線は手作業でラベル付けされ、その他はMIRアルゴリズムによって行われる。
論文 参考訳(メタデータ) (2020-08-17T08:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。