論文の概要: Dual-Solver: A Generalized ODE Solver for Diffusion Models with Dual Prediction
- arxiv url: http://arxiv.org/abs/2603.03973v1
- Date: Wed, 04 Mar 2026 12:14:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.291543
- Title: Dual-Solver: A Generalized ODE Solver for Diffusion Models with Dual Prediction
- Title(参考訳): Dual-Solver: 2次予測付き拡散モデルのための一般化ODEソルバー
- Authors: Soochul Park, Yeon Ju Lee,
- Abstract要約: 学習可能なパラメータによって多段階のサンプルを一般化するDual-rを導入する。
2階局所精度を維持しながら、標準的な予測器・相関器構造を維持している。
FIDおよびCLIPスコアは、背骨全体にわたる低NFEレギュレーションで改善される。
- 参考スコア(独自算出の注目度): 0.26856688022781555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models achieve state-of-the-art image quality. However, sampling is costly at inference time because it requires a large number of function evaluations (NFEs). To reduce NFEs, classical ODE numerical methods have been adopted. Yet, the choice of prediction type and integration domain leads to different sampling behaviors. To address these issues, we introduce Dual-Solver, which generalizes multistep samplers through learnable parameters that continuously (i) interpolate among prediction types, (ii) select the integration domain, and (iii) adjust the residual terms. It retains the standard predictor-corrector structure while preserving second-order local accuracy. These parameters are learned via a classification-based objective using a frozen pretrained classifier (e.g., MobileNet or CLIP). For ImageNet class-conditional generation (DiT, GM-DiT) and text-to-image generation (SANA, PixArt-$α$), Dual-Solver improves FID and CLIP scores in the low-NFE regime ($3 \le$ NFE $\le 9$) across backbones.
- Abstract(参考訳): 拡散モデルは最先端の画像品質を達成する。
しかし、大量の関数評価(NFE)を必要とするため、サンプリングは推論時にコストがかかる。
NFEを減らすため、古典的ODE数値法が採用されている。
しかし、予測型と統合ドメインの選択は、異なるサンプリング動作をもたらす。
これらの問題に対処するため、Dual-Solverを導入し、連続的に学習可能なパラメータを通して多段階のサンプルを一般化する。
(i)予測型間の補間
(ii)統合ドメインを選択して
(三)残余項を調整すること。
2階局所精度を維持しながら、標準的な予測器・相関器構造を維持している。
これらのパラメータは、フリーズされた事前訓練された分類器(例えば、MobileNetやCLIP)を使用して、分類ベースの目的によって学習される。
ImageNetのクラス条件生成(DiT, GM-DiT)とテキスト・ツー・イメージ生成(SANA, PixArt-$α$)では、Dual-Solverは、バックボーン間の低NFEレギュレーション(3 \le$ NFE $\le 9$)において、FIDとCLIPスコアを改善している。
関連論文リスト
- Generalized Zero-Shot Learning for Point Cloud Segmentation with Evidence-Based Dynamic Calibration [12.973924671425074]
3Dポイントクラウドの一般化されたゼロショットセマンティックセマンティックセマンティックセマンティクスは、各ポイントを目に見えないクラスと見えないクラスの両方に分類することを目的としている。
これらのモデルの重大な課題は、バイアスのある予測を行う傾向にあり、しばしばトレーニング中に遭遇するクラスを好んでいることである。
E3DPC-GZSLを提案する。これは、見知らぬデータに対して、別個の分類器に頼ることなく、見知らぬクラスに対する過信予測を減らす。
論文 参考訳(メタデータ) (2025-09-10T04:37:00Z) - Adaptive Cubic Regularized Second-Order Latent Factor Analysis Model [14.755426957558868]
高次元および不完全HDIデータセットは、様々な現実世界のアプリケーションに広く普及している。
本稿では,情報不安定を緩和するための2つのアプローチを提案する。
ACRS HDIは、ALFが高速進行(SACR)モデルよりも高い表現を示すことを示した。
論文 参考訳(メタデータ) (2025-07-03T03:15:54Z) - Rule-based Evolving Fuzzy System for Time Series Forecasting: New Perspectives Based on Type-2 Fuzzy Sets Measures Approach [0.0]
実世界のデータは、ランダム性として知られる外部変数と相関できる不確実性や変動を含んでいる。
このタイプのデータを扱う既存の方法の1つは、進化しているファジィシステム(eFS)を使用することである。
ePL-KRLS-FSM+は,ファジィ論理と参加型学習(PL)を組み合わせ,ファジィ集合(FS)へのデータ変換を行うファジィモデリング手法である。
この改善により、データの不確実性をよりよく扱うためのタイプ2ファジィセットの作成と測定が可能になり、より精度の高いカオスデータを予測できるモデルを生成することができる。
論文 参考訳(メタデータ) (2025-02-05T22:27:20Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - DF2: Distribution-Free Decision-Focused Learning [30.288876294435294]
決定中心学習(DFL)は,予測列最適化問題に対する強力なアプローチとして登場した。
DFLはモデル誤差、サンプル平均近似誤差、近似誤差の3つのボトルネックに直面している。
本稿では,この3つのボトルネックを緩和する決定自由学習手法であるDF2を提案する。
論文 参考訳(メタデータ) (2023-08-11T00:44:46Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Transformers meet Stochastic Block Models: Attention with Data-Adaptive
Sparsity and Cost [53.746169882193456]
最近の研究は、自己注意の二次的コストを克服するために、様々なスパークアテンションモジュールを提案している。
本稿では,それぞれの注意を混合メンバーシップブロックモデルで表現することで,両方の問題を解決するモデルを提案する。
我々のモデルは、以前の効率的な変種とオリジナルのトランスフォーマーより優れており、十分に注目されています。
論文 参考訳(メタデータ) (2022-10-27T15:30:52Z) - Understanding Diffusion Models: A Unified Perspective [0.0]
拡散モデルは生成モデルとして素晴らしい能力を示している。
変動的視点と得点的視点の両方にわたる拡散モデルの理解をレビューし、デミスティフィケートし、統一する。
論文 参考訳(メタデータ) (2022-08-25T09:55:25Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - Message Passing Neural PDE Solvers [60.77761603258397]
我々は、バックプロップ最適化されたニューラル関数近似器で、グラフのアリーデザインのコンポーネントを置き換えるニューラルメッセージパッシング解決器を構築した。
本稿では, 有限差分, 有限体積, WENOスキームなどの古典的手法を表現的に含んでいることを示す。
本研究では, 異なる領域のトポロジ, 方程式パラメータ, 離散化などにおける高速, 安定, 高精度な性能を, 1次元, 2次元で検証する。
論文 参考訳(メタデータ) (2022-02-07T17:47:46Z) - A Distributed Optimisation Framework Combining Natural Gradient with
Hessian-Free for Discriminative Sequence Training [16.83036203524611]
本稿では、ニューラルネットワークトレーニングのための自然勾配およびヘッセンフリー(NGHF)最適化フレームワークを提案する。
これは、自然勾配(ng)法とヘッセンフリー(hf)や他の二次法からの局所曲率情報を組み合わせた線形共役勾配(cg)アルゴリズムに依存している。
さまざまな音響モデルタイプのマルチジャンル放送データセットで実験が報告されています。
論文 参考訳(メタデータ) (2021-03-12T22:18:34Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Set Based Stochastic Subsampling [85.5331107565578]
本稿では,2段階間ニューラルサブサンプリングモデルを提案する。
画像分類,画像再構成,機能再構築,少数ショット分類など,様々なタスクにおいて,低いサブサンプリング率で関連ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-25T07:36:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。