論文の概要: Similarity-Guided Diffusion for Long-Gap Music Inpainting
- arxiv url: http://arxiv.org/abs/2509.16342v1
- Date: Fri, 19 Sep 2025 18:33:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:15.743005
- Title: Similarity-Guided Diffusion for Long-Gap Music Inpainting
- Title(参考訳): ロングギャップ・ミュージック・インペインティングにおける類似性誘導拡散
- Authors: Sean Turland, Eloi Moliner, Vesa Välimäki,
- Abstract要約: 拡散に基づく推論と類似性探索を組み合わせたハイブリッド手法であるSimDPS(Simisity-Guided Diffusion Posterior Smpling)を提案する。
ピアノ音楽の2-s間隔の塗装に対する主観評価は,SimDPS法が知覚的妥当性を高めることを示唆している。
- 参考スコア(独自算出の注目度): 9.785849733424554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Music inpainting aims to reconstruct missing segments of a corrupted recording. While diffusion-based generative models improve reconstruction for medium-length gaps, they often struggle to preserve musical plausibility over multi-second gaps. We introduce Similarity-Guided Diffusion Posterior Sampling (SimDPS), a hybrid method that combines diffusion-based inference with similarity search. Candidate segments are first retrieved from a corpus based on contextual similarity, then incorporated into a modified likelihood that guides the diffusion process toward contextually consistent reconstructions. Subjective evaluation on piano music inpainting with 2-s gaps shows that the proposed SimDPS method enhances perceptual plausibility compared to unguided diffusion and frequently outperforms similarity search alone when moderately similar candidates are available. These results demonstrate the potential of a hybrid similarity approach for diffusion-based audio enhancement with long gaps.
- Abstract(参考訳): 音楽のインペインティングは、破損した録音の欠落部分の再構築を目的としている。
拡散に基づく生成モデルは中距離ギャップの再構成を改善するが、多秒間隔での可聴性を維持するのに苦慮することが多い。
拡散に基づく推論と類似性探索を組み合わせたハイブリッド手法であるSimDPS(Simisity-Guided Diffusion Posterior Smpling)を提案する。
候補セグメントは、まず文脈的類似性に基づいてコーパスから取得され、その後、拡散過程を文脈的に一貫した再構成へと導く改良された可能性に組み込まれる。
2-s間隔のピアノ音楽の絵画化に関する主観的評価は,提案手法が無誘導拡散に比べて知覚的妥当性を高め,適度に類似した候補が利用できる場合にのみ類似度探索に優れることが示唆された。
これらの結果は、長いギャップを持つ拡散型音声強調のためのハイブリッド類似性アプローチの可能性を示している。
関連論文リスト
- Generalized Interpolating Discrete Diffusion [65.74168524007484]
仮面拡散はその単純さと有効性のために一般的な選択である。
ノイズ発生過程の設計において、より柔軟性の高い離散拡散(GIDD)を補間する新しいファミリを一般化する。
GIDDの柔軟性をエクスプロイトし、マスクと均一ノイズを組み合わせたハイブリッドアプローチを探索し、サンプル品質を向上する。
論文 参考訳(メタデータ) (2025-03-06T14:30:55Z) - Latent Swap Joint Diffusion for 2D Long-Form Latent Generation [38.434225760834146]
Swap Forward (SaFa) は、シームレスでコヒーレンスな長いスペクトルとパノラマを生成するためのモダリティに依存しない効率的な方法である。
SaFaは、既存のジョイント拡散法や、オーディオ生成におけるトレーニングベースの方法よりも大幅に優れています。
また、パノラマ生成にも適しており、2$sim$20$times$高速でモデル一般化性の向上で同等のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-02-07T18:02:47Z) - Zigzag Diffusion Sampling: Diffusion Models Can Self-Improve via Self-Reflection [28.82743020243849]
既存のテキストと画像の拡散モデルは、しばしば挑戦的なプロンプトに対して高い画質と高いプロンプトのアライメントを維持するのに失敗する。
本稿では, 交互に denoising と inversion を行う拡散自己回帰法を提案する。
我々は,新しい自己反射型拡散サンプリング法であるZigzag Diffusion Smpling (Z-Sampling) を導出した。
論文 参考訳(メタデータ) (2024-12-14T16:42:41Z) - Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas [33.334956022229846]
本稿では,Merge-Attend-Diffuse演算子を提案する。
具体的には、拡散経路をマージし、自己および横断的意図をプログラムし、集約された潜在空間で操作する。
提案手法は,生成した画像の入力プロンプトと視覚的品質との整合性を維持しつつ,セマンティック・コヒーレンスを増大させる。
論文 参考訳(メタデータ) (2024-08-28T09:22:32Z) - Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation [41.292644854306594]
DiffGesture (DiffGesture) という,拡散に基づく新しいフレームワークを提案する。
DiffGestureは、より優れたモードカバレッジとより強力なオーディオ相関を備えたコヒーレントなジェスチャーをレンダリングする、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-03-16T07:32:31Z) - DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.20339155618612]
DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文 参考訳(メタデータ) (2023-03-15T16:14:06Z) - VideoFusion: Decomposed Diffusion Models for High-Quality Video
Generation [88.49030739715701]
本研究は, フレームごとのノイズを, 全フレーム間で共有されるベースノイズ, 時間軸に沿って変化する残雑音に分解することで, 拡散過程を分解する。
様々なデータセットの実験により,ビデオフュージョンと呼ばれる我々の手法が,高品質なビデオ生成において,GANベースと拡散ベースの両方の選択肢を上回ることが確認された。
論文 参考訳(メタデータ) (2023-03-15T02:16:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。