論文の概要: GuitarFlow: Realistic Electric Guitar Synthesis From Tablatures via Flow Matching and Style Transfer
- arxiv url: http://arxiv.org/abs/2510.21872v1
- Date: Thu, 23 Oct 2025 13:31:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.629941
- Title: GuitarFlow: Realistic Electric Guitar Synthesis From Tablatures via Flow Matching and Style Transfer
- Title(参考訳): GuitarFlow: フローマッチングとスタイル転送によるタブラチュアからのリアルな電気ギター合成
- Authors: Jackson Loth, Pedro Sarmento, Mark Sandler, Mathieu Barthet,
- Abstract要約: 本稿では,エレキギター合成に特化したモデルであるGuitarFlowを紹介する。
生成プロセスは、ユビキタスで直感的なギター固有の記号形式であるタブラを用いてガイドされる。
タトゥールから生成したギター・オーディオのリアリズムに顕著な改善が認められた。
- 参考スコア(独自算出の注目度): 7.72498447842112
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Music generation in the audio domain using artificial intelligence (AI) has witnessed steady progress in recent years. However for some instruments, particularly the guitar, controllable instrument synthesis remains limited in expressivity. We introduce GuitarFlow, a model designed specifically for electric guitar synthesis. The generative process is guided using tablatures, an ubiquitous and intuitive guitar-specific symbolic format. The tablature format easily represents guitar-specific playing techniques (e.g. bends, muted strings and legatos), which are more difficult to represent in other common music notation formats such as MIDI. Our model relies on an intermediary step of first rendering the tablature to audio using a simple sample-based virtual instrument, then performing style transfer using Flow Matching in order to transform the virtual instrument audio into more realistic sounding examples. This results in a model that is quick to train and to perform inference, requiring less than 6 hours of training data. We present the results of objective evaluation metrics, together with a listening test, in which we show significant improvement in the realism of the generated guitar audio from tablatures.
- Abstract(参考訳): 人工知能(AI)を用いたオーディオ領域の音楽生成は,近年着実に進展している。
しかし、いくつかの楽器、特にギターでは、制御可能な楽器合成は表現力に制限がある。
本稿では,エレキギター合成に特化したモデルであるGuitarFlowを紹介する。
生成プロセスは、ユビキタスで直感的なギター固有の記号形式であるタブラを用いてガイドされる。
タブチュアフォーマットは、ギター固有の演奏技法(例えば、曲が曲げられたり、弦が張られたり、レガート)を表現しやすく、MIDIのような他の一般的な音楽表記形式では表現が難しい。
我々のモデルは、簡単なサンプルベースの仮想楽器を用いて、まずタブラチュアをオーディオにレンダリングし、次にフローマッチングを用いて、仮想楽器の音響をよりリアルな音響の例に変換するためのスタイル転送を行う中間ステップに依存している。
これにより、トレーニングと推論を素早く行うことができ、6時間以内のトレーニングデータを必要とするモデルが得られる。
本研究では,聴取テストとともに客観的評価指標の結果を提示し,この結果から生成したギターオーディオの現実性に大きな改善が見られた。
関連論文リスト
- A Machine Learning Approach for MIDI to Guitar Tablature Conversion [21.416973100105633]
本稿では,MIDIをベースとした楽曲にギターの音節表記を割り当てる手法を提案する。
この戦略は機械学習に基づいており、フレットボード上で指がどれくらい伸びるかという基本的な仮定を必要とする。
提案手法は、ギターで演奏することができない、あるいは演奏できない音楽作品の書き起こしについても検討する。
論文 参考訳(メタデータ) (2025-10-12T14:01:01Z) - Transcribing Rhythmic Patterns of the Guitar Track in Polyphonic Music [46.69593319852797]
ポピュラーな410曲のリズミカルなパターンを書き起こし、ギターのトラックがそれらの書き起こしに従うカバーバージョンを記録しました。
分離されたギター・オーディオの個々のストラムを、事前訓練された基礎モデル(MERT)をバックボーンとして検出する。
ポリフォニック・ミュージックにおけるギター・トラックのリズミカル・パターンを極めて高精度に書き起こすことが可能であることを示す。
論文 参考訳(メタデータ) (2025-10-07T10:22:31Z) - SCORE-SET: A dataset of GuitarPro files for Music Phrase Generation and Sequence Learning [0.0]
このデータセットは、MAESTROとGiantMIDIのMIDIノートから派生したもので、リズムギターのトラックに適合している。
これらのトラックは、曲げ、スライド、ビブラート、パームミューティングなど、ギター演奏に典型的な様々な表現設定を含むように処理される。
論文 参考訳(メタデータ) (2025-07-24T18:13:12Z) - Scaling Self-Supervised Representation Learning for Symbolic Piano Performance [52.661197827466886]
本研究では,多量のシンボリック・ピアノ転写を訓練した自己回帰型トランスフォーマモデルの能力について検討した。
比較的小型で高品質なサブセットをファインチューンモデルに使い、音楽の継続を生成、シンボリックな分類タスクを実行し、汎用的なコントラストMIDI埋め込みを生成する。
論文 参考訳(メタデータ) (2025-06-30T14:00:14Z) - MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling [6.150307957212576]
シンボリックギターのタブリング推定のための新しいディープラーニングソリューションを提案する。
我々は、文字列に音符を割り当てるために、マスク付き言語モデリングパラダイムでエンコーダ・デコーダ変換モデルを訓練する。
このモデルは、まず25K以上のタブチュアのデータセットであるDadaGPで事前トレーニングされ、その後、プロが書き起こしたギター演奏のキュレートセットで微調整される。
論文 参考訳(メタデータ) (2024-08-09T12:25:23Z) - Expressive Acoustic Guitar Sound Synthesis with an Instrument-Specific
Input Representation and Diffusion Outpainting [9.812666469580872]
楽器への入力表現をカスタマイズした音響ギター音響合成モデルを提案する。
本研究では,長期的整合性のある音声を生成する拡散型アウトペイントを用いて提案手法を実装した。
提案モデルはベースラインモデルよりも音質が高く,よりリアルな音色を生成する。
論文 参考訳(メタデータ) (2024-01-24T14:44:01Z) - Modeling Bends in Popular Music Guitar Tablatures [49.64902130083662]
タブラチュア表記はポピュラー音楽で広く使われ、ギター音楽のコンテンツの書き起こしや共有に使われている。
本論文は,音符のピッチを段階的にシフトできる屈曲に着目し,離散的な指板の物理的制限を回避する。
ポピュラー音楽の932個のリードギタータブラのコーパス上で実験を行い、決定木がF1スコア0.71と限られた偽陽性予測量で屈曲の発生をうまく予測することを示す。
論文 参考訳(メタデータ) (2023-08-22T07:50:58Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - GTR-CTRL: Instrument and Genre Conditioning for Guitar-Focused Music
Generation with Transformers [14.025337055088102]
ギタータブ音楽生成にはDadaGPデータセット,GuitarProでは26万曲以上のコーパス,トークンフォーマットなどを用いています。
所望の楽器やジャンルに基づいてギタータブを生成するために,Transformer-XLディープラーニングモデルを条件付ける手法を提案する。
その結果、GTR-CTRL法は、無条件モデルよりもギター中心のシンボリック・ミュージック・ジェネレーションの柔軟性と制御性が高いことが示唆された。
論文 参考訳(メタデータ) (2023-02-10T17:43:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。