論文の概要: Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models
- arxiv url: http://arxiv.org/abs/2510.02300v1
- Date: Thu, 02 Oct 2025 17:59:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.286997
- Title: Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models
- Title(参考訳): 平衡マッチング:不必要エネルギーモデルによる生成モデリング
- Authors: Runqian Wang, Yilun Du,
- Abstract要約: EqMは、平衡力学の観点から構築された生成モデリングフレームワークである。
時間条件の速度を統一された平衡景観に置き換えることで、EqMは流れとエネルギーベースのモデルの間により緊密な橋渡しを提供する。
- 参考スコア(独自算出の注目度): 52.74448905289362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Equilibrium Matching (EqM), a generative modeling framework built from an equilibrium dynamics perspective. EqM discards the non-equilibrium, time-conditional dynamics in traditional diffusion and flow-based generative models and instead learns the equilibrium gradient of an implicit energy landscape. Through this approach, we can adopt an optimization-based sampling process at inference time, where samples are obtained by gradient descent on the learned landscape with adjustable step sizes, adaptive optimizers, and adaptive compute. EqM surpasses the generation performance of diffusion/flow models empirically, achieving an FID of 1.90 on ImageNet 256$\times$256. EqM is also theoretically justified to learn and sample from the data manifold. Beyond generation, EqM is a flexible framework that naturally handles tasks including partially noised image denoising, OOD detection, and image composition. By replacing time-conditional velocities with a unified equilibrium landscape, EqM offers a tighter bridge between flow and energy-based models and a simple route to optimization-driven inference.
- Abstract(参考訳): 平衡力学の観点から構築した生成モデリングフレームワークであるEquilibrium Matching (EqM)を紹介する。
EqMは従来の拡散とフローベースの生成モデルにおける非平衡、時間条件のダイナミクスを捨て、代わりに暗黙のエネルギー景観の平衡勾配を学ぶ。
このアプローチにより、最適化に基づくサンプリング処理を推論時に適用でき、そこでは、調整可能なステップサイズ、適応オプティマイザ、適応計算を用いて、学習したランドスケープへの勾配降下によってサンプルを得る。
EqMは拡散/フローモデルの生成性能を実証的に上回り、ImageNet 256$\times$256で1.90のFIDを達成した。
EqMは理論上、データ多様体から学習し、サンプリングすることが正当化される。
生成以外にも、EqMは、部分的にノイズのある画像のデノイング、OOD検出、画像合成などのタスクを自然に処理するフレキシブルなフレームワークである。
時間条件の速度を統一された平衡景観に置き換えることで、EqMはフローとエネルギーベースのモデルの間のより緊密なブリッジを提供し、最適化駆動推論への簡単な経路を提供する。
関連論文リスト
- Composition and Alignment of Diffusion Models using Constrained Learning [79.36736636241564]
拡散モデルは、複雑な分布からサンプルを採取する能力により、生成的モデリングにおいて普及している。
i) 拡散モデルを微調整して報酬と整合させるアライメントと、(ii) 予め訓練された拡散モデルを組み合わせて、それぞれが生成した出力に望ましい属性を強調する合成である。
本稿では,共役モデルが報酬制約を満たすこと,あるいは(潜在的に複数の)事前学習モデルに近づき続けることを強制することによって,拡散モデルのアライメントと構成を統一する制約付き最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-26T15:06:30Z) - SESaMo: Symmetry-Enforcing Stochastic Modulation for Normalizing Flows [0.0]
本稿では,Symmetry-Enforcecing Modulation (SESaMo)を紹介する。
SESaMoは、誘導変調と呼ばれる新しい技術により、バイアス(例えば対称性)を正規化フローに組み込むことを可能にする。
数値実験では、8-ガウス混合モデルと物理的に関連する場理論を含む様々なシナリオでSESaMoをベンチマークした。
論文 参考訳(メタデータ) (2025-05-26T07:34:11Z) - Energy-Based Diffusion Language Models for Text Generation [126.23425882687195]
エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。
我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文 参考訳(メタデータ) (2024-10-28T17:25:56Z) - Variational Potential Flow: A Novel Probabilistic Framework for Energy-Based Generative Modelling [10.926841288976684]
エネルギーをベースとした新しい生成フレームワークVAPOについて述べる。
VAPOは、勾配(流れ)が前のサンプルを導くポテンシャルエネルギー関数を学習することを目的としており、その密度の進化は近似的なデータ準同相性に従う。
イメージはポテンシャルエネルギーをトレーニングした後、ガウスのサンプルを初期化し、固定時間間隔で電位フローを管理するODEを解くことで生成することができる。
論文 参考訳(メタデータ) (2024-07-21T18:08:12Z) - Flow map matching with stochastic interpolants: A mathematical framework for consistency models [15.520853806024943]
フローマップマッチングは、基礎となる生成モデルの2時間フローマップを学ぶための原則化されたフレームワークである。
FMMは,高速サンプリングのための既存手法の幅広いクラスを統一し,拡張することを示す。
論文 参考訳(メタデータ) (2024-06-11T17:41:26Z) - Deep Equilibrium Diffusion Restoration with Parallel Sampling [120.15039525209106]
拡散モデルに基づく画像復元(IR)は、拡散モデルを用いて劣化した画像から高品質な(本社)画像を復元し、有望な性能を達成することを目的としている。
既存のほとんどの手法では、HQイメージをステップバイステップで復元するために長いシリアルサンプリングチェーンが必要であるため、高価なサンプリング時間と高い計算コストがかかる。
本研究では,拡散モデルに基づくIRモデルを異なる視点,すなわちDeqIRと呼ばれるDeQ(Deep equilibrium)固定点系で再考することを目的とする。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Variational Diffusion Models [33.0719137062396]
本稿では,画像密度推定ベンチマークの最先端可能性を求める拡散モデルについて紹介する。
差分下界 (VLB) は, 拡散したデータの信号対雑音比において, 著しく短い表現に単純化されることを示す。
論文 参考訳(メタデータ) (2021-07-01T17:43:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。