Fugu-MT 論文翻訳(概要): Advancing Multi-Instrument Music Transcription: Results from the 2025 AMT Challenge

論文の概要: Advancing Multi-Instrument Music Transcription: Results from the 2025 AMT Challenge

arxiv url: http://arxiv.org/abs/2603.27528v1
Date: Sun, 29 Mar 2026 05:41:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:45.004541
Title: Advancing Multi-Instrument Music Transcription: Results from the 2025 AMT Challenge
Title（参考訳）: マルチインスツルメンツによる楽曲の書き起こしの強化:2025 AMTチャレンジの結果から
Authors: Ojas Chaturvedi, Kayshav Bhardwaj, Tanay Gondil, Benjamin Shiue-Hal Chou, Kristen Yeon-Ji Yun, Yung-Hsiang Lu, Yujia Yan, Sungkyun Chang,
Abstract要約: 本稿では,マルチストラクチャリングの進歩をベンチマークするオンラインコンペである2025 Automatic Music Transcription (AMT) Challengeの結果について述べる。その結果、転写精度の向上とポリフォニーと音色変化の扱いの難しさの両面を浮き彫りにした。
参考スコア（独自算出の注目度）: 3.633068645069583
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper presents the results of the 2025 Automatic Music Transcription (AMT) Challenge, an online competition to benchmark progress in multi-instrument transcription. Eight teams submitted valid solutions; two outperformed the baseline MT3 model. The results highlight both advances in transcription accuracy and the remaining difficulties in handling polyphony and timbre variation. We conclude with directions for future challenges: broader genre coverage and stronger emphasis on instrument detection.
Abstract（参考訳）: 本稿では,マルチストラクチャリングの進歩をベンチマークするオンラインコンペである2025 Automatic Music Transcription (AMT) Challengeの結果について述べる。 8つのチームが有効なソリューションを提出し、2つのチームがベースラインMT3モデルを上回った。その結果、転写精度の向上とポリフォニーと音色変化の扱いの難しさの両面を浮き彫りにした。今後の課題として,幅広いジャンルをカバーし,楽器検出を強く重視する方向を定めている。

関連論文リスト

AIM 2025 Challenge on High FPS Motion Deblurring: Methods and Results [164.40213599684935]
本稿では,AIM 2025 High FPS Non-Uniform Motion Deblurring Challengeについて概説し,提案手法と最終結果について述べる。 68人の参加者が参加し、9つのチームが最終的に有効なエントリーを提出した。本稿では,高FPSシングルイメージモーションの劣化における最先端の進歩を徹底的に評価し,現場における顕著な進展を示す。
論文参考訳（メタデータ） (2025-09-08T15:22:35Z)
YourMT3+: Multi-instrument Music Transcription with Enhanced Transformer Architectures and Cross-dataset Stem Augmentation [15.9795868183084]
マルチストラクチャメント音楽の書き起こしは、ポリフォニック音楽の録音を各楽器に割り当てられた楽譜に変換することを目的としている。本稿では、マルチストラクチャメント音楽の書き起こし強化のためのモデルの組であるYourMT3+を紹介する。実験では,音声分離前処理装置の不要さを排除し,直接音声書き起こし機能を示す。
論文参考訳（メタデータ） (2024-07-05T19:18:33Z)
Sheet Music Transformer: End-To-End Optical Music Recognition Beyond Monophonic Transcription [13.960714900433269]
Sheet Music Transformer(シート・ミュージック・トランスフォーマー)は、モノフォニック・ストラテジーのみに頼らずに複雑な楽譜を転写するために設計された最初のエンドツーエンドのOMRモデルである。我々のモデルは2つのポリフォニック音楽データセットでテストされており、これらの複雑な音楽構造を効果的に扱えることが証明されている。
論文参考訳（メタデータ） (2024-02-12T11:52:21Z)
Optimizing Non-Autoregressive Transformers with Contrastive Learning [74.46714706658517]
非自己回帰変換器(NAT)は、逐次順序ではなく全ての単語を同時に予測することにより、自動回帰変換器(AT)の推論遅延を低減する。本稿では,データ分布ではなく,モデル分布からのサンプリングによるモダリティ学習の容易化を提案する。
論文参考訳（メタデータ） (2023-05-23T04:20:13Z)
MER 2023: Multi-label Learning, Modality Robustness, and Semi-Supervised Learning [90.17500229142755]
第1回マルチモーダル感情認識チャレンジ(MER 2023)は、ACMマルチメディアで成功した。本稿では、この課題の背景にある動機を紹介し、ベンチマークデータセットを説明し、参加者に関する統計情報を提供する。この高品質なデータセットは、特に中国の研究コミュニティにとって、マルチモーダルな感情認識の新しいベンチマークになり得ると考えています。
論文参考訳（メタデータ） (2023-04-18T13:23:42Z)
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models [57.80514758695275]
機械翻訳(MT)の品質を評価するために,大規模言語モデル(LLM)を用いることで,システムレベルでの最先端のパフォーマンスを実現する。我々はtextbftexttError Analysis Prompting (EAPrompt) と呼ばれる新しいプロンプト手法を提案する。本手法は,多次元品質指標 (MQM) とtextitproduces を用いて,システムレベルとセグメントレベルの両方で説明可能かつ信頼性の高いMT評価を行う。
論文参考訳（メタデータ） (2023-03-24T05:05:03Z)
MT3: Multi-Task Multitrack Music Transcription [7.5947187537718905]
汎用トランスフォーマーモデルがマルチタスク自動音楽転写(AMT)を実現できることを示す。この統合トレーニングフレームワークは、さまざまなデータセットにわたる高品質な書き起こし結果を実現する。
論文参考訳（メタデータ） (2021-11-04T17:19:39Z)
NTIRE 2021 Multi-modal Aerial View Object Classification Challenge [88.89190054948325]
CVPR の NTIRE 2021 ワークショップと共同で,MAVOC (Multi-modal Aerial View Object Classification) の最初の挑戦を紹介した。この課題は、EOとSAR画像を用いた2つの異なるトラックで構成されている。本コンペティションで提案した最上位の手法について検討し,その成果を目視テストセットで評価する。
論文参考訳（メタデータ） (2021-07-02T16:55:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。