論文の概要: AMT-APC: Automatic Piano Cover by Fine-Tuning an Automatic Music Transcription Model
- arxiv url: http://arxiv.org/abs/2409.14086v1
- Date: Sat, 21 Sep 2024 09:51:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 03:44:25.323775
- Title: AMT-APC: Automatic Piano Cover by Fine-Tuning an Automatic Music Transcription Model
- Title(参考訳): AMT-APC:自動音楽転写モデルによるピアノカバーの自動調整
- Authors: Kazuma Komiya, Yoshihisa Fukuhara,
- Abstract要約: AMT-APCと呼ばれる学習アルゴリズムを提案する。
実験により, AMT-APCモデルは既存のどのモデルよりも正確なトラックを再現できることを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There have been several studies on automatically generating piano covers, and recent advancements in deep learning have enabled the creation of more sophisticated covers. However, existing automatic piano cover models still have room for improvement in terms of expressiveness and fidelity to the original. To address these issues, we propose a learning algorithm called AMT-APC, which leverages the capabilities of automatic music transcription models. By utilizing the strengths of well-established automatic music transcription models, we aim to improve the accuracy of piano cover generation. Our experiments demonstrate that the AMT-APC model reproduces original tracks more accurately than any existing models.
- Abstract(参考訳): ピアノカバーの自動生成に関する研究がいくつか行われており、近年のディープラーニングの進歩により、より洗練されたカバーの創出が可能になった。
しかし、既存の自動ピアノカバーモデルは、オリジナルの表現力と忠実さの観点から改善の余地がある。
これらの問題に対処するために,自動楽譜生成モデルの能力を活用したAMT-APCという学習アルゴリズムを提案する。
確立された自動楽譜生成モデルの強度を利用して,ピアノカバー生成の精度を向上させることを目的とする。
実験により, AMT-APCモデルは既存のどのモデルよりも正確なトラックを再現できることを示した。
関連論文リスト
- A Transformer-Based Visual Piano Transcription Algorithm [0.0]
視覚ピアノ転写(VPT)は、自動音楽転写(AMT)のマルチモーダルサブプロブレムである
本稿では,VPTのためのトランスフォーマーアーキテクチャを提案する。
提案するVPTシステムは,ピアノバウンディングボックス検出モデルとオンセットとピッチ検出モデルを組み合わせることで,ピアノ周辺の不完全な画像作物やわずかに傾斜した画像など,より自然的条件下での良好な動作を可能にする。
論文 参考訳(メタデータ) (2024-11-13T21:31:12Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - High Resolution Guitar Transcription via Domain Adaptation [6.8277374293345785]
そこで本研究では,高分解能ピアノ転写モデルを用いて新しいギター転写モデルを訓練する。
得られたモデルは、ゼロショットコンテキストでGuitarSetの最先端の転写結果を取得する。
論文 参考訳(メタデータ) (2024-02-23T10:56:47Z) - A Data-Driven Analysis of Robust Automatic Piano Transcription [16.686703489636734]
近年の進歩は、より正確なシステムを生み出すために、新しいニューラルネットワークアーキテクチャを適用することに焦点を当てている。
トレーニングデータの音響特性に対して,これらのモデルが非常に過度に適合することを示す。
トレーニングデータを見ることなく,MAPSデータセット上で88.4F1スコアの最先端のノートオンセット精度を実現する。
論文 参考訳(メタデータ) (2024-02-02T14:11:23Z) - DITTO: Diffusion Inference-Time T-Optimization for Music Generation [49.90109850026932]
Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:10:10Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training [74.32603591331718]
本稿では,MLMスタイルの音響事前学習において,教師モデルと擬似ラベルを組み込んだ大規模自己教師型学習(MERT)を用いた音響音楽理解モデルを提案する。
実験結果から,本モデルでは14曲の楽曲理解タスクを一般化し,性能を向上し,SOTA(State-of-the-art)全体のスコアを達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T18:27:43Z) - Transfer of knowledge among instruments in automatic music transcription [2.0305676256390934]
この研究は、ソフトウェアシンセサイザーが生成した合成音声データを使って、普遍的なモデルを訓練する方法を示す。
これは、他の楽器の転写モデルに迅速に適応するために、さらなる転写学習を行うための良い基盤である。
論文 参考訳(メタデータ) (2023-04-30T08:37:41Z) - Generative Modelling for Controllable Audio Synthesis of Expressive
Piano Performance [6.531546527140474]
ガウス混合変分オートエンコーダ(GM-VAE)に基づく可制御型ニューラルオーディオシンセサイザー
そこで本研究では,モデルが音声に対してきめ細かな形態変化を適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-06-16T12:54:41Z) - AutoFIS: Automatic Feature Interaction Selection in Factorization Models
for Click-Through Rate Prediction [75.16836697734995]
自動特徴相互作用選択(AutoFIS)と呼ばれる2段階のアルゴリズムを提案する。
AutoFISは、目標モデルを収束させるためにトレーニングするのと同等の計算コストで、因子化モデルに対する重要な特徴的相互作用を自動的に識別することができる。
AutoFISはHuawei App Storeレコメンデーションサービスのトレーニングプラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2020-03-25T06:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。