論文の概要: FVD: Inference-Time Alignment of Diffusion Models via Fleming-Viot Resampling
- arxiv url: http://arxiv.org/abs/2604.06779v1
- Date: Wed, 08 Apr 2026 07:50:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.406932
- Title: FVD: Inference-Time Alignment of Diffusion Models via Fleming-Viot Resampling
- Title(参考訳): FVD:Fleming-Viot再サンプリングによる拡散モデルの推論時間アライメント
- Authors: Shivanshu Shekhar, Sagnik Mukherjee, Jia Yi Zhang, Tong Zhang,
- Abstract要約: Fleming-Viot Diffusion (FVD) は, 連続モンテカルロ (SMC) を用いた拡散サンプリング装置でよく見られる多様性の崩壊を解決する推論時間アライメント法である。
FVDはフレミング・ヴィオットの人口動態にインスパイアされ、拡散アライメントのために設計された特別な生死機構によって、多項再サンプリングを置き換える。
- 参考スコア(独自算出の注目度): 18.997552937110548
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We introduce Fleming-Viot Diffusion (FVD), an inference-time alignment method that resolves the diversity collapse commonly observed in Sequential Monte Carlo (SMC) based diffusion samplers. Existing SMC-based diffusion samplers often rely on multinomial resampling or closely related resampling schemes, which can still reduce diversity and lead to lineage collapse under strong selection pressure. Inspired by Fleming-Viot population dynamics, FVD replaces multinomial resampling with a specialized birth-death mechanism designed for diffusion alignment. To handle cases where rewards are only approximately available and naive rebirth would collapse deterministic trajectories, FVD integrates independent reward-based survival decisions with stochastic rebirth noise. This yields flexible population dynamics that preserve broader trajectory support while effectively exploring reward-tilted distributions, all without requiring value function approximation or costly rollouts. FVD is fully parallelizable and scales efficiently with inference compute. Empirically, it achieves substantial gains across settings: on DrawBench it outperforms prior methods by 7% in ImageReward, while on class-conditional tasks it improves FID by roughly 14-20% over strong baselines and is up to 66 times faster than value-based approaches.
- Abstract(参考訳): Fleming-Viot Diffusion (FVD) は, 連続モンテカルロ (SMC) を用いた拡散サンプリング装置でよく見られる多様性の崩壊を解決する推論時間アライメント法である。
既存のSMCベースの拡散サンプリングは、しばしば多相再サンプリングや密接に関連する再サンプリング方式に依存しており、これは多様性を低減し、強い選択圧力下での系統崩壊につながる。
FVDはフレミング・ヴィオットの人口動態にインスパイアされ、拡散アライメントのために設計された特別な生死機構によって、多項再サンプリングを置き換える。
報酬がほぼ利用可能であり、単純再生が決定論的軌道を崩壊させるようなケースに対処するため、FVDは独立報酬に基づく生存決定を確率的再生雑音と統合する。
これにより、より広い軌道支持を維持しつつ、価値関数近似やコストのかかるロールアウトを必要とせず、報酬型分布を効果的に探索する柔軟な人口動態が得られる。
FVDは完全に並列化可能で、推論計算で効率よくスケールする。
DrawBenchでは、ImageRewardでは7%、クラス条件のタスクでは、強いベースラインよりも14~20%向上し、バリューベースのアプローチよりも66倍高速です。
関連論文リスト
- DiffusionDriveV2: Reinforcement Learning-Constrained Truncated Diffusion Modeling in End-to-End Autonomous Driving [65.7087560656003]
エンドツーエンドの自動運転のための生成拡散モデルは、しばしばモード崩壊に悩まされる。
強化学習を利用して低品質モードを制約し,優れた軌道探索を行うDiffusionDriveV2を提案する。
これにより、そのコアであるガウス混合モデル固有の多重モード性を維持しながら、全体的な出力品質が大幅に向上する。
論文 参考訳(メタデータ) (2025-12-08T17:29:52Z) - ReDDiT: Rehashing Noise for Discrete Visual Generation [53.813067778912]
離散拡散変圧器(終端型ReDDiT)のためのリハッシングノイズアプローチを提案する。
我々は、吸収状態を拡張し、離散拡散モデルの表現能力を向上させることを目的としている。
実験の結果、ReDDiTはベースラインモデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-05-26T08:17:20Z) - Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion [55.185588994883226]
VQ-LCMDは、学習を安定させる埋め込み空間内の連続空間潜在拡散フレームワークである。
VQ-LCMDは、関節埋め込み拡散変動下界と整合整合性(CM)損失を組み合わせた新しいトレーニング目標を使用する。
実験により,提案したVQ-LCMDは離散状態潜伏拡散モデルと比較して,FFHQ,LSUN教会,LSUNベッドルームにおいて優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2024-10-18T09:12:33Z) - Generative Fractional Diffusion Models [53.36835573822926]
我々は,その基礎となる力学に分数拡散過程を利用する,最初の連続時間スコアベース生成モデルを導入する。
実画像データを用いた評価では,GFDMはFIDが低い値で示されるように,画素幅の多様性と画質の向上を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:53:24Z) - Fast Diffusion Model [122.36693015093041]
拡散モデル(DM)は、複雑なデータ分布を捉える能力を持つ様々な分野に採用されている。
本稿では,DM最適化の観点から,高速拡散モデル (FDM) を提案する。
論文 参考訳(メタデータ) (2023-06-12T09:38:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。