論文の概要: Couple to Control: Joint Initial Noise Design in Diffusion Models
- arxiv url: http://arxiv.org/abs/2605.11311v1
- Date: Mon, 11 May 2026 22:56:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.466076
- Title: Couple to Control: Joint Initial Noise Design in Diffusion Models
- Title(参考訳): 連成制御:拡散モデルにおける連成初期雑音設計
- Authors: Jing Jia, Liyue Shen, Guanyang Wang,
- Abstract要約: 拡散モデルは通常、独立ガウスの初期ノイズから画像バッチを生成する。
この独立仮定は、より広範な結合ノイズ設計のクラスにおいて、一つの選択肢に過ぎないと論じる。
これにより、個々の種の選択や最適化から、マルチサンプルギャラリーの依存構造の設計まで、初期ノイズ制御が再編成される。
- 参考スコア(独自算出の注目度): 11.572377237874193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models typically generate image batches from independent Gaussian initial noises. We argue that this independence assumption is only one choice within a broader class of valid joint noise designs. Instead, one can specify a coupling of the initial noises: each noise remains marginally standard Gaussian, so the pretrained diffusion model receives the same single-sample input distribution, while the dependence across samples is chosen by design. This reframes initial-noise control from selecting or optimizing individual seeds to designing the dependence structure of a multi-sample gallery. This view gives a general framework for initial-noise design, covering several existing methods as special cases and leading naturally to new coupled-noise constructions. Coupled noise can improve generation on its own without adding sampling cost, and it is flexible enough to serve as a structured initialization for optimization-based pipelines when additional computation is available. Empirically, repulsive Gaussian coupling improves gallery diversity on SD1.5, SDXL, and SD3 while largely preserving prompt alignment and image quality. It matches or outperforms recent test-time noise-optimization baselines on several diversity metrics at the same sampling cost as independent generation. Subspace couplings also support fixed-object background generation, producing diverse, natural backgrounds compared with specialized inpainting baselines, with a tunable trade-off in foreground fidelity.
- Abstract(参考訳): 拡散モデルは通常、独立ガウス初期雑音から画像バッチを生成する。
この独立仮定は、より広範な結合ノイズ設計のクラスにおいて、一つの選択肢に過ぎないと論じる。
その代わりに、初期ノイズの結合を指定できる: 各ノイズは極端に標準のガウスであり、事前訓練された拡散モデルは同じ単一サンプルの入力分布を受け取り、サンプル間の依存は設計によって選択される。
これにより、個々の種の選択や最適化から、マルチサンプルギャラリーの依存構造の設計まで、初期ノイズ制御が再編成される。
この視点は、初期ノイズ設計のための一般的なフレームワークを提供し、いくつかの既存のメソッドを特別なケースとしてカバーし、自然に新しい結合ノイズ構造へと導く。
結合ノイズはサンプリングコストを増すことなく独自の生成を改善することができ、さらなる計算が可能になった場合、最適化ベースのパイプラインの構造化初期化として機能するのに十分な柔軟性がある。
実験的に、反発型ガウスカップリングはSD1.5、SDXL、SD3のギャラリーの多様性を向上するが、その大部分は即時アライメントと画質を保っている。
独立生成と同じサンプリングコストで、いくつかの多様性指標に基づいて、最近のテストタイムノイズ最適化ベースラインを適合または上回る。
サブスペース結合はまた、固定オブジェクトの背景生成をサポートし、特定の塗装ベースラインと比較して多様な自然な背景を生成し、前景の忠実さが調整可能なトレードオフをもたらす。
関連論文リスト
- It's Never Too Late: Noise Optimization for Collapse Recovery in Trained Diffusion Models [80.53672733210111]
基本モデルの忠実さを保ちつつモード崩壊を緩和する,単純な雑音最適化の目的を示す。
実験により,騒音の最適化は生成品質と多様性の点で優れた結果をもたらすことが示された。
論文 参考訳(メタデータ) (2025-12-31T19:47:49Z) - Learning High-Quality Initial Noise for Single-View Synthesis with Diffusion Models [10.275373477634217]
拡散モデルでは、ある種の高品質な初期ノイズパターンは、他のものよりも優れた生成結果をもたらす。
本稿では,ランダムノイズを直接高品質な雑音に変換するエンコーダ・デコーダネットワーク(EDN)に基づく学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-18T06:08:21Z) - NoiseAR: AutoRegressing Initial Noise Prior for Diffusion Models [50.51982871889886]
NoiseARは拡散モデルに先立つ自己回帰初期雑音の新しい手法である。
空間パッチやトークン上での自己回帰的確率的モデリングタスクとして,初期雑音先行パラメータの生成を定式化する。
実験により,ノイズレーダが初期雑音を発生させることで,サンプル品質が向上し,条件付き入力との整合性が向上することを示した。
論文 参考訳(メタデータ) (2025-06-02T05:32:35Z) - Be Decisive: Noise-Induced Layouts for Multi-Subject Generation [56.80513553424086]
複雑なプロンプトは被写体漏れを引き起こし、量、属性、視覚的特徴の不正確さを引き起こす。
本稿では,初期雑音から導出されるプロンプトに整合した空間配置を予測し,デノナイジング過程を通じて改良する手法を提案する。
提案手法では,各聴覚ステップにおける雑音誘発レイアウトを予測・改善するために,小さなニューラルネットワークを用いる。
論文 参考訳(メタデータ) (2025-05-27T17:54:24Z) - CCS: Controllable and Constrained Sampling with Diffusion Models via Initial Noise Perturbation [9.12693573953231]
生成出力の変化と初期雑音摂動のスケールの関係は拡散ODEサンプリングにより非常に線形である。
そこで我々は,新しい制御可能・制約付きサンプリング法 (CCS) と,所望の統計特性を持つ拡散モデルに対する新しい制御アルゴリズムを提案する。
その結果, CCS法は, 優れた試料品質と多様性を維持しつつ, より精密にサンプリングを制御できることが示唆された。
論文 参考訳(メタデータ) (2025-02-07T05:30:48Z) - Beyond Fixed Horizons: A Theoretical Framework for Adaptive Denoising Diffusions [1.9116784879310031]
本稿では, ノイズ発生過程とノイズ発生過程の両方において, 時間均質な構造を実現する新しい生成拡散モデルを提案する。
モデルの主な特徴は、ターゲットデータへの適応性であり、事前訓練された無条件生成モデルを使用して、様々な下流タスクを可能にする。
論文 参考訳(メタデータ) (2025-01-31T18:23:27Z) - Multi-scale Diffusion Denoised Smoothing [79.95360025953931]
ランダムな平滑化は、大規模モデルに敵対的ロバスト性を提供する、いくつかの具体的なアプローチの1つになっている。
本報告では, 分割平滑化におけるロバスト性と精度との現在のトレードオフに対処するスケーラブルな手法を提案する。
提案手法と拡散微細調整を併用したマルチスケール平滑化手法により,高騒音レベルで高い信頼性のロバスト性が得られることを示す。
論文 参考訳(メタデータ) (2023-10-25T17:11:21Z) - One-Dimensional Deep Image Prior for Curve Fitting of S-Parameters from
Electromagnetic Solvers [57.441926088870325]
Deep Image Prior(ディープ・イメージ・プライオリ、ディープ・イメージ・プライオリ、DIP)は、ランダムなd畳み込みニューラルネットワークの重みを最適化し、ノイズや過度な測定値からの信号に適合させる技術である。
本稿では,Vector Fitting (VF) の実装に対して,ほぼすべてのテスト例において優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-06T20:28:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。