論文の概要: Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation
- arxiv url: http://arxiv.org/abs/2502.01692v2
- Date: Wed, 05 Feb 2025 13:49:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 11:04:35.950603
- Title: Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation
- Title(参考訳): Fast Direct: ディフュージョンモデル生成のためのクエリ効率の良いオンラインブラックボックスガイダンス
- Authors: Kim Yong Tan, Yueming Lyu, Ivor Tsang, Yew-Soon Ong,
- Abstract要約: 既存の誘導拡散モデルは、事前コンパイルされたデータセットによるガイダンスモデルのトレーニングに依存するか、客観的関数を微分可能であるように要求する。
クエリ効率の良いオンラインブラックボックスターゲット生成のための,新しい,シンプルなアルゴリズムである textbfFast Direct を提案する。
我々のFast Directはデータ多様体上に擬似ターゲットを構築し、拡散モデルのノイズシーケンスを普遍的な方向で更新する。
- 参考スコア(独自算出の注目度): 27.773614349764234
- License:
- Abstract: Guided diffusion-model generation is a promising direction for customizing the generation process of a pre-trained diffusion-model to address the specific downstream tasks. Existing guided diffusion models either rely on training of the guidance model with pre-collected datasets or require the objective functions to be differentiable. However, for most real-world tasks, the offline datasets are often unavailable, and their objective functions are often not differentiable, such as image generation with human preferences, molecular generation for drug discovery, and material design. Thus, we need an \textbf{online} algorithm capable of collecting data during runtime and supporting a \textbf{black-box} objective function. Moreover, the \textbf{query efficiency} of the algorithm is also critical because the objective evaluation of the query is often expensive in the real-world scenarios. In this work, we propose a novel and simple algorithm, \textbf{Fast Direct}, for query-efficient online black-box target generation. Our Fast Direct builds a pseudo-target on the data manifold to update the noise sequence of the diffusion model with a universal direction, which is promising to perform query-efficient guided generation. Extensive experiments on twelve high-resolution ($\small {1024 \times 1024}$) image target generation tasks and six 3D-molecule target generation tasks show $\textbf{6}\times$ up to $\textbf{10}\times$ query efficiency improvement and $\textbf{11}\times$ up to $\textbf{44}\times$ query efficiency improvement, respectively. Our implementation is publicly available at: https://github.com/kimyong95/guide-stable-diffusion/tree/fast-direct
- Abstract(参考訳): 誘導拡散モデル生成は、訓練済み拡散モデルの生成プロセスをカスタマイズし、特定の下流タスクに対処するための有望な方向である。
既存の誘導拡散モデルは、事前コンパイルされたデータセットによるガイダンスモデルのトレーニングに依存するか、客観的関数を微分可能であるように要求する。
しかし、現実世界のほとんどのタスクではオフラインのデータセットは利用できないことが多く、人間の嗜好による画像生成、薬物発見のための分子生成、材料設計など、目的の機能は区別できないことが多い。
したがって、実行中にデータを収集し、目的関数であるtextbf{black-box} をサポートすることができる \textbf{online} アルゴリズムが必要である。
さらに、実際のシナリオでは、クエリの客観的評価が高価であるため、アルゴリズムの「textbf{query efficiency}」も重要である。
そこで本研究では,クエリ効率の高いオンラインブラックボックスターゲット生成のための,新規でシンプルなアルゴリズムである \textbf{Fast Direct} を提案する。
我々のFast Directはデータ多様体上に擬似ターゲットを構築し、拡散モデルのノイズシーケンスを普遍的な方向で更新する。
12の高解像度($\small {1024 \times 1024}$)イメージターゲット生成タスクと6つの3D分子ターゲット生成タスクに対する大規模な実験では、$\textbf{6}\times$ クエリ効率の改善と$\textbf{11}\times$ クエリ効率の改善がそれぞれ$\textbf{44}\times$ クエリ効率の改善が示されている。
私たちの実装は、https://github.com/kimyong95/guide-stable-diffusion/tree/fast-directで公開されています。
関連論文リスト
- Adaptively Controllable Diffusion Model for Efficient Conditional Image Generation [8.857237929151795]
本稿では,新たな適応フレームワークである$textitAdaptively Controllable Diffusion (AC-Diff) Model$を提案する。
AC-Diffは、文学拡散モデルと同じ性能を維持しつつ、平均生成ステップ数と実行時間を大幅に削減することが期待されている。
論文 参考訳(メタデータ) (2024-11-19T21:26:30Z) - Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [84.3224556294803]
拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文 参考訳(メタデータ) (2024-08-15T16:47:59Z) - Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.49868273653921]
拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。
最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。
提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文 参考訳(メタデータ) (2024-08-01T17:59:59Z) - Diffusion-BBO: Diffusion-Based Inverse Modeling for Online Black-Box Optimization [20.45482366024264]
オンラインブラックボックス最適化(BBO)は、ブラックボックスのオラクルをサンプル効率よく反復的にクエリすることで、目的関数を最適化することを目的としている。
Inverse surrogate modelとして条件付き拡散モデルを利用するサンプル効率の高いオンラインBBOフレームワークであるDiffusion-BBOを提案する。
論文 参考訳(メタデータ) (2024-06-30T06:58:31Z) - Improving GFlowNets for Text-to-Image Diffusion Alignment [48.42367859859971]
報酬を直接最大化するのではなく,比較的高い確率で高解像度画像を生成する手法を探索する。
提案手法は,大規模テキスト・画像拡散モデルと報酬情報とを効果的に一致させることができる。
論文 参考訳(メタデータ) (2024-06-02T06:36:46Z) - Gradient Guidance for Diffusion Models: An Optimization Perspective [45.6080199096424]
本稿では,ユーザ特定目的の最適化に向けて,事前学習した拡散モデルを適用するための勾配ガイダンスの形式について検討する。
我々は,その最適化理論とアルゴリズム設計を体系的に研究するために,誘導拡散の数学的枠組みを確立する。
論文 参考訳(メタデータ) (2024-04-23T04:51:02Z) - An Efficient Membership Inference Attack for the Diffusion Model by
Proximal Initialization [58.88327181933151]
本稿では,効率的なクエリベースのメンバシップ推論攻撃(MIA)を提案する。
実験結果から,提案手法は離散時間と連続時間の両方の拡散モデル上で,2つのクエリで競合性能を達成できることが示唆された。
我々の知る限り、本研究はテキスト音声タスクにおけるMIAへの拡散モデルのロバスト性について初めて研究するものである。
論文 参考訳(メタデータ) (2023-05-26T16:38:48Z) - DiffusionRet: Generative Text-Video Retrieval with Diffusion Model [56.03464169048182]
既存のテキストビデオ検索ソリューションは、条件付き可能性、すなわちp(candidates|query)の最大化に焦点を当てている。
我々は、このタスクを生成的視点から創造的に取り組み、テキストとビデオの相関関係を共同確率p(candidates,query)としてモデル化する。
これは拡散に基づくテキストビデオ検索フレームワーク(DiffusionRet)によって実現され、ノイズから徐々に関節分布を生成するプロセスとして検索タスクをモデル化する。
論文 参考訳(メタデータ) (2023-03-17T10:07:19Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。