論文の概要: OSCAR: Orthogonal Stochastic Control for Alignment-Respecting Diversity in Flow Matching
- arxiv url: http://arxiv.org/abs/2510.09060v1
- Date: Fri, 10 Oct 2025 07:07:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.299988
- Title: OSCAR: Orthogonal Stochastic Control for Alignment-Respecting Diversity in Flow Matching
- Title(参考訳): OSCAR:直交確率制御によるフローマッチングの多角性の検討
- Authors: Jingxuan Wu, Zhenglin Wan, Xingrui Yu, Yuzhe Yang, Bo An, Ivor Tsang,
- Abstract要約: フローベースのテキスト・ツー・イメージモデルは決定論的軌跡に従っており、ユーザーは様々なモードを見つけるために繰り返しサンプルを採取せざるを得ない。
本稿では,フロー自体を多様性に配慮した,トレーニング不要な推論時間制御機構を提案する。
- 参考スコア(独自算出の注目度): 14.664226708184676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flow-based text-to-image models follow deterministic trajectories, forcing users to repeatedly sample to discover diverse modes, which is a costly and inefficient process. We present a training-free, inference-time control mechanism that makes the flow itself diversity-aware. Our method simultaneously encourages lateral spread among trajectories via a feature-space objective and reintroduces uncertainty through a time-scheduled stochastic perturbation. Crucially, this perturbation is projected to be orthogonal to the generation flow, a geometric constraint that allows it to boost variation without degrading image details or prompt fidelity. Our procedure requires no retraining or modification to the base sampler and is compatible with common flow-matching solvers. Theoretically, our method is shown to monotonically increase a volume surrogate while, due to its geometric constraints, approximately preserving the marginal distribution. This provides a principled explanation for why generation quality is robustly maintained. Empirically, across multiple text-to-image settings under fixed sampling budgets, our method consistently improves diversity metrics such as the Vendi Score and Brisque over strong baselines, while upholding image quality and alignment.
- Abstract(参考訳): フローベースのテキスト・ツー・イメージモデルは決定論的トラジェクトリに従い、ユーザが繰り返しサンプリングして、さまざまなモードを見つけることを強制する。
本稿では,フロー自体を多様性に配慮した,トレーニング不要な推論時間制御機構を提案する。
提案手法は,特徴空間の目的によって軌跡間の横方向の広がりを同時に促進し,時間スケジュールの確率的摂動によって不確実性を再導入する。
重要なことに、この摂動は、画像の詳細を劣化させることなく変化を増大させる幾何学的制約である生成フローに直交するように予測されている。
本手法では, ベースサンプリング装置のリトレーニングや修正は必要とせず, 一般的なフローマッチング・ソルバと互換性がある。
理論的には,提案手法は体積代理を単調に増加させる一方で,その幾何学的制約により,辺分布を概ね保存することが示されている。
これは、なぜ世代品質が堅固に維持されているのかという原則的な説明を提供する。
固定サンプリング予算下での複数のテキスト・ツー・イメージ設定において,画像品質とアライメントを保ちながら,Vendi Score や Brisque などの多様性指標を高いベースラインで継続的に改善する。
関連論文リスト
- Measurement-Guided Consistency Model Sampling for Inverse Problems [2.217547045999963]
一貫性モデルは、単一または数ステップで高品質な生成を可能にする。
逆問題再構成に適した整合性サンプリング手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T16:53:07Z) - Purrception: Variational Flow Matching for Vector-Quantized Image Generation [79.74708247230218]
パーセプション(Purrception)はベクトル量子化画像生成のための変動流マッチング手法である。
本手法は,変分フローマッチングをベクトル量子化潜水器に適用し,コードブックの指標からカテゴリー後部を学習する。
これは連続的手法の幾何学的認識とカテゴリー的アプローチの離散的な監督を組み合わせる。
論文 参考訳(メタデータ) (2025-10-01T21:41:30Z) - Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。
本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - FFHFlow: Diverse and Uncertainty-Aware Dexterous Grasp Generation via Flow Variational Inference [36.02645364048733]
本稿では,多種多様な頑健なマルチフィンガーグリップを生成するフローベース変分フレームワークFFHFlowを提案する。
流れの可逆性と正確な確率を利用して、FFHFlowは部分的な観測において不確実性を形成する。
また,不確実性を考慮したランキング戦略を定式化することにより,識別的把握評価器をフロー可能性と統合する。
論文 参考訳(メタデータ) (2024-07-21T13:33:08Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。