論文の概要: Music Source Restoration with Ensemble Separation and Targeted Reconstruction
- arxiv url: http://arxiv.org/abs/2603.16926v1
- Date: Fri, 13 Mar 2026 07:40:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.260483
- Title: Music Source Restoration with Ensemble Separation and Targeted Reconstruction
- Title(参考訳): アンサンブル分離とターゲット再構成による音源復元
- Authors: Xinlong Deng, Yu Xia, Jie Jiang,
- Abstract要約: 初の音楽ソース復元(MSR)チャレンジは、完全に混成されたマスタード音楽からオリジナル、未処理の茎を回収することを目的としている。
まず、事前訓練された分離モデルのアンサンブルが予備的なソース推定を生成する。
そして、事前訓練されたBSRNNベースの復元モデルが、これらの見積を洗練させるためにターゲットの再構築を行う。
- 参考スコア(独自算出の注目度): 6.528712884168779
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Inaugural Music Source Restoration (MSR) Challenge targets the recovery of original, unprocessed stems from fully mixed and mastered music. Unlike conventional music source separation, MSR requires reversing complex production processes such as equalization, compression, reverberation, and other real-world degradations. To address MSR, we propose a two-stage system. First, an ensemble of pre-trained separation models produces preliminary source estimates. Then a set of pre-trained BSRNN-based restoration models performs targeted reconstruction to refine these estimates. On the official MSR benchmark, our system surpasses the baselines on all metrics, ranking second among all submissions. The code is available at https://github.com/xinghour/Music-source-restoration-CUPAudioGroup
- Abstract(参考訳): 初の音楽ソース復元(MSR)チャレンジは、完全に混成されたマスタード音楽からオリジナル、未処理の茎を回収することを目的としている。
従来の音楽ソースの分離とは異なり、MSRは等化、圧縮、残響、その他の現実世界の劣化といった複雑な生産プロセスを逆転させる必要がある。
MSRに対処するため,我々は2段階システムを提案する。
第一に、事前訓練された分離モデルのアンサンブルは、予備的なソース推定を生成する。
そして、事前訓練されたBSRNNベースの復元モデルが、これらの見積を洗練させるためにターゲットの再構築を行う。
公式のMSRベンチマークでは、我々のシステムは全てのメトリクスのベースラインを超え、全ての提出物の中で第2位にランクインしている。
コードはhttps://github.com/xinghour/Music-source-restoration-CUPAudioGroupで入手できる。
関連論文リスト
- Multi-Stage Music Source Restoration with BandSplit-RoFormer Separation and HiFi++ GAN [8.647179779228761]
音楽ソース復元(MSR)は、完全に混合された、マスターされたオーディオからオリジナル、未処理の楽器の復元を目標としている。
本技術報告では,MSR ICASSP Challenge 2025におけるCP-JKUチームのシステムについて述べる。
論文 参考訳(メタデータ) (2026-03-04T13:10:39Z) - Summary of The Inaugural Music Source Restoration Challenge [52.405241781545634]
Music Source Restoration (MSR)は、プロの混在したオーディオからオリジナル、未処理の楽器を復元することを目的としている。
MSR Challengeは、Multi-Mel-SNR、Zimtohrli、FAD-CLAPを用いたスタジオ生産混合物の客観的評価を特徴とする。
勝利システムは4.46dBのMulti-Mel-SNRと3.47のMOS-Overallを達成し、それぞれ第2位のシステムに対して91%と18%の相対的な改善を達成した。
論文 参考訳(メタデータ) (2026-01-07T19:31:06Z) - MoA-VR: A Mixture-of-Agents System Towards All-in-One Video Restoration [62.929029990341796]
実世界のビデオは、ノイズ、圧縮アーティファクト、低照度歪みなどの複雑な劣化に悩まされることが多い。
3つの協調エージェントによる人間のプロの推論・処理手順を模倣したMoA-VRを提案する。
具体的には、大規模かつ高解像度なビデオ劣化認識ベンチマークを構築し、視覚言語モデル(VLM)による劣化識別子を構築する。
論文 参考訳(メタデータ) (2025-10-09T17:42:51Z) - Music Source Restoration [20.814486236405823]
本稿では,理想化された音源分離と実世界の音楽制作のギャップを解消する新しい課題である音楽音源復元(MSR)を紹介する。
MSRモデルは、個別に劣化したソースの劣化和として混合され、元の劣化していない信号を回復することを目的としている。
MSRのデータがないため、RawStemsという、未処理のソース信号を持つ578曲のデータセットアノテーションを、8つのプライマリと17のセカンダリ楽器グループに分類し、合計で354.13時間である。
論文 参考訳(メタデータ) (2025-05-27T23:27:31Z) - Unleashing the Power of Natural Audio Featuring Multiple Sound Sources [54.38251699625379]
ユニバーサルサウンド分離は、混合音声から異なるイベントに対応するクリーンなオーディオトラックを抽出することを目的としている。
複雑な混合音声を複数の独立したトラックに分解するために,データエンジンを利用するフレームワークであるClearSepを提案する。
実験では、ClearSepは複数の音分離タスクで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-04-24T17:58:21Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - Benchmarks and leaderboards for sound demixing tasks [44.99833362998488]
音源分離タスクのための2つの新しいベンチマークを導入する。
これらのベンチマークでは、音のデミックスやアンサンブルなどの人気モデルを比較します。
また,特定の茎に最適な異なるモデルのアンサンブルに基づく,音声分離のための新しいアプローチも開発している。
論文 参考訳(メタデータ) (2023-05-12T14:00:26Z) - Blind Restoration of Real-World Audio by 1D Operational GANs [18.462912387382346]
Op-GAN(Operational Generative Adversarial Networks)による実世界の音声信号のブラインド復元手法を提案する。
提案手法はTIMIT-RAR(音声)とGTZAN-RAR(非音声)のベンチマークで広く評価されている。
平均SDRの改善は7.2dB以上と4.9dB以上である。
論文 参考訳(メタデータ) (2022-12-30T10:11:57Z) - Music Separation Enhancement with Generative Modeling [11.545349346125743]
本稿では,音源分離システムの出力向上を目的とした後処理モデル(Make it Sound Good)を提案する。
クラウドソースによる主観評価は,MSGが後処理したベースとドラムの音源推定を人間のリスナーが好んでいることを示している。
論文 参考訳(メタデータ) (2022-08-26T00:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。