論文の概要: Variational Test-time Optimization for Diffusion Synchronization
- arxiv url: http://arxiv.org/abs/2606.15614v2
- Date: Tue, 16 Jun 2026 01:32:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.735876
- Title: Variational Test-time Optimization for Diffusion Synchronization
- Title(参考訳): 拡散同期のための変分テスト時間最適化
- Authors: Hyunsoo Lee, Farrin Marouf Sofian, Kushagra Pandey, Stephan Mandt,
- Abstract要約: 協調生成は拡散モデルの適用性を拡張するための強力なパラダイムである。
我々は、最適制御に基づく同期フレームワークを数学的に導出し、拡散同期の原理的な説明を提供する。
我々の研究は、協調生成のための新しい基盤を確立し、事前学習された生成モデルを新しい協調生成設定に拡張するための原則的な道を開く。
- 参考スコア(独自算出の注目度): 22.76546399123399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative generation, which coordinates multiple diffusion trajectories to extend the capabilities of pretrained priors, has emerged as a powerful paradigm for extending the applicability of diffusion models. Among existing approaches, diffusion synchronization provides a scenario-agnostic solution by introducing general guidance mechanisms. However, current synchronization approaches rely heavily on heuristics and still require task-specific tailoring, which limits their generalizability and performance. In this work, we mathematically derive a synchronization framework based on optimal control, providing a principled explanation of diffusion synchronization. During sampling, we optimize control variables to guide multiple trajectories toward coherent solutions while remaining close to the underlying diffusion prior. Our method operates entirely at test-time without additional training, thereby enabling broad applicability across diverse generation scenarios when combined with strong pretrained priors. We demonstrate consistent improvements over baselines on three representative collaborative generation tasks, covering a wide range of modalities and applications. Beyond performance gains, our work establishes a novel foundation for collaborative generation, opening a principled path toward extending pretrained generative models to new collaborative generation settings.
- Abstract(参考訳): 複数の拡散軌道をコーディネートして事前学習前の能力を拡張するコラボレーティブ・ジェネレーションは,拡散モデルの適用性を高めるための強力なパラダイムとして登場した。
既存の手法の中で、拡散同期は一般的な誘導機構を導入することでシナリオに依存しない解を提供する。
しかし、現在の同期アプローチはヒューリスティックに大きく依存しており、その一般化性と性能を制限するタスク固有の調整が必要である。
本研究では、最適制御に基づく同期フレームワークを数学的に導出し、拡散同期の原理的な説明を提供する。
サンプリング中、制御変数を最適化して複数の軌道をコヒーレントな解へ誘導し、基礎となる拡散に近く留まる。
そこで本手法は,事前訓練の強い事前学習と組み合わせることで,様々なシナリオにまたがる適用性を実現する。
我々は3つの代表的協調生成タスクのベースラインよりも一貫した改善を示し、幅広いモダリティと応用をカバーしている。
性能向上以外にも、我々の研究は協調生成のための新しい基盤を確立し、事前学習された生成モデルを新しい協調生成設定に拡張するための原則的な道を開く。
関連論文リスト
- DiffusionOPD: A Unified Perspective of On-Policy Distillation in Diffusion Models [55.01951088768769]
DiffusionOPDはオンライン政策蒸留(OPD)に基づく拡散モデルのための新しいマルチタスクトレーニングパラダイムである
本研究では,DiffusionOPDがトレーニング効率と最終性能において,マルチリワードRLとカスケードRLのベースラインを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2026-05-14T16:49:09Z) - Beyond Confidence: Adaptive and Coherent Decoding for Diffusion Language Models [64.92045568376705]
コヒーレントコンテキストデコーディング(Coherent Contextual Decoding, CCD)は、2つのコアイノベーションに基づいて構築された新しい推論フレームワークである。
CCDは、歴史的文脈を活用してシーケンスコヒーレンスを高める軌道修正機構を採用している。
拡散ステップに基づく厳密なアロケーションの代わりに,各ステップのアンマスク予算を動的に調整する適応型サンプリング戦略を導入する。
論文 参考訳(メタデータ) (2025-11-26T09:49:48Z) - Projected Coupled Diffusion for Test-Time Constrained Joint Generation [49.69610867216755]
制約付きジョイント生成のための新しいテストタイムフレームワークであるProjected Coupled Diffusion (PCD)を提案する。
PCDは、拡散モデル間の協調を促進するために生成力学に結合したガイダンス項を導入し、各拡散ステップにプロジェクションステップを組み込んで厳しい制約を強制する。
その結果,過剰な計算コストを発生させることなく,結合効果の向上と制約満足度が保証された。
論文 参考訳(メタデータ) (2025-08-14T11:05:31Z) - SyncSDE: A Probabilistic Framework for Diffusion Synchronization [3.6560851081680426]
拡散同期がなぜ機能するのかを解析し、どこに焦点を合わせるべきかを明らかにするためのフレームワークを提案する。
タスク毎の最適相関モデルを特定し、従来の手法よりも優れた結果を得る。
論文 参考訳(メタデータ) (2025-03-27T14:40:53Z) - Preference-Guided Diffusion for Multi-Objective Offline Optimization [64.08326521234228]
オフライン多目的最適化のための優先誘導拡散モデルを提案する。
我々の指導は、ある設計が他の設計を支配する確率を予測するために訓練された選好モデルである。
本結果は,多種多様な高品質な解を生成する上での分類器誘導拡散モデルの有効性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-03-21T16:49:38Z) - Exploring the Boundary of Diffusion-based Methods for Solving Constrained Optimization [46.75288477458697]
本稿では,DiOptと呼ばれる連続制約最適化問題に対する拡散に基づく新しいフレームワークを提案する。
DiOptは2つの異なるフェーズで動作し、最初のウォームスタートフェーズは教師付き学習によって実装され、その後ブートストラップフェーズが続く。
問題の制約を厳格に満たしつつ、反復的に解を洗練し、目的関数を改善するように設計されている。
論文 参考訳(メタデータ) (2025-02-14T17:43:08Z) - FADAS: Towards Federated Adaptive Asynchronous Optimization [56.09666452175333]
フェデレートラーニング(FL)は、プライバシ保護機械学習のトレーニングパラダイムとして広く採用されている。
本稿では、非同期更新を適応的フェデレーション最適化と証明可能な保証に組み込む新しい手法であるFADASについて紹介する。
提案アルゴリズムの収束率を厳格に確立し,FADASが他の非同期FLベースラインよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2024-07-25T20:02:57Z) - Efficient Text-driven Motion Generation via Latent Consistency Training [21.348658259929053]
非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文 参考訳(メタデータ) (2024-05-05T02:11:57Z) - InterHandGen: Two-Hand Interaction Generation via Cascaded Reverse Diffusion [53.90516061351706]
両手インタラクションに先立って生成を学習する新しいフレームワークであるInterHandGenを提案する。
サンプリングにアンチペネティフィケーションと合成フリーガイダンスを組み合わせることで、プラウシブルな生成を可能にする。
本手法は, 妥当性と多様性の観点から, ベースライン生成モデルよりも有意に優れていた。
論文 参考訳(メタデータ) (2024-03-26T06:35:55Z) - Collaborative Diffusion for Multi-Modal Face Generation and Editing [34.16906110777047]
本稿では,事前学習した単モーダル拡散モデルと協調して複数モーダル顔の生成と編集を行うコラボレーティブ拡散について述べる。
具体的には、事前学習された各ユニモーダルモデルに対する空間的時間的影響関数を予測することにより、マルチモーダルな認知ステップを適応的に幻覚するメタネットワークである動的ディフューザを提案する。
論文 参考訳(メタデータ) (2023-04-20T17:59:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。