論文の概要: Masked Diffusion Models as Energy Minimization
- arxiv url: http://arxiv.org/abs/2509.13866v1
- Date: Wed, 17 Sep 2025 09:57:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.81306
- Title: Masked Diffusion Models as Energy Minimization
- Title(参考訳): エネルギー最小化としてのマスケ拡散モデル
- Authors: Sitong Chen, Shen Nie, Jiacheng Sun, Zijin Feng, Zhenguo Li, Ji-Rong Wen, Chongxuan Li,
- Abstract要約: 仮面拡散モデル(MDMs)は、離散的最適輸送におけるエネルギー問題に対する解である。
MDMの構造の下では、3つの異なるエネルギー(運動学、条件運動学、測地学)が数学的に等価であることを示す。
この統合はMDMの理論的基礎を明らかにするだけでなく、サンプリングの実践的な改善も動機付けている。
- 参考スコア(独自算出の注目度): 102.84400389614262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a systematic theoretical framework that interprets masked diffusion models (MDMs) as solutions to energy minimization problems in discrete optimal transport. Specifically, we prove that three distinct energy formulations--kinetic, conditional kinetic, and geodesic energy--are mathematically equivalent under the structure of MDMs, and that MDMs minimize all three when the mask schedule satisfies a closed-form optimality condition. This unification not only clarifies the theoretical foundations of MDMs, but also motivates practical improvements in sampling. By parameterizing interpolation schedules via Beta distributions, we reduce the schedule design space to a tractable 2D search, enabling efficient post-training tuning without model modification. Experiments on synthetic and real-world benchmarks demonstrate that our energy-inspired schedules outperform hand-crafted baselines, particularly in low-step sampling settings.
- Abstract(参考訳): 本稿では,離散的最適輸送におけるエネルギー最小化問題の解法として,マスク拡散モデル(MDM)を解釈する体系的理論的枠組みを提案する。
具体的には、3つの異なるエネルギー定式化 – 運動学、条件運動学、測地学のエネルギー – が、MDMの構造の下で数学的に等価であること、マスクスケジュールが閉形式最適条件を満たす場合に、MDMが3つ全てを最小化することを証明している。
この統合はMDMの理論的基礎を明らかにするだけでなく、サンプリングの実践的な改善も動機付けている。
ベータ分布を介して補間スケジュールをパラメータ化することにより、トラクタブルな2次元探索にスケジュール設計空間を縮小し、モデル修正なしに効率的な後トレーニングチューニングを可能にする。
人工的および実世界のベンチマークの実験では、私たちのエネルギーにインスパイアされたスケジュールは手作りのベースライン、特に低段階のサンプリング設定よりも優れています。
関連論文リスト
- Low-Bit, High-Fidelity: Optimal Transport Quantization for Flow Matching [0.0]
Flow Matching (FM) 生成モデルは、効率的なシミュレーションなしのトレーニングと決定論的サンプリングを提供するが、その実践的展開は高精度なパラメータ要求によって困難である。
我々は、最適輸送(OT)に基づくポストトレーニング量子化をFMモデルに適用し、量子化とオリジナルウェイトの間の2-ワッサーシュタイン距離を最小化し、その一様、一様、対数量子化スキームに対する効果を体系的に比較する。
論文 参考訳(メタデータ) (2025-11-14T15:49:36Z) - VEDA: 3D Molecular Generation via Variance-Exploding Diffusion with Annealing [4.288647933894182]
VEDAは分散拡散とアニーリングを組み合わせて3D構造を生成するフレームワークである。
QM9とGEOM-DRUGSデータセットでは、VEDAはフローベースモデルのサンプリング効率と一致する。
VEDAの生成した構造は、緩和エネルギーによって測定されるように、驚くほど安定である。
論文 参考訳(メタデータ) (2025-11-11T05:45:37Z) - Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models [52.74448905289362]
EqMは、平衡力学の観点から構築された生成モデリングフレームワークである。
時間条件の速度を統一された平衡景観に置き換えることで、EqMは流れとエネルギーベースのモデルの間により緊密な橋渡しを提供する。
論文 参考訳(メタデータ) (2025-10-02T17:59:06Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - Energy-Weighted Flow Matching: Unlocking Continuous Normalizing Flows for Efficient and Scalable Boltzmann Sampling [42.79674268979455]
エネルギー重み付きフローマッチングはボルツマン分布をモデル化するための連続正規化フローを可能にする新しいトレーニング目標である。
我々のアルゴリズムは、最先端のエネルギーのみの手法と競合するサンプル品質を示す。
論文 参考訳(メタデータ) (2025-09-03T21:16:03Z) - Flow Matching Meets PDEs: A Unified Framework for Physics-Constrained Generation [21.321570407292263]
本稿では,PDE残差と代数的関係の両方の物理制約をフローマッチングの対象に組み込む生成フレームワークである物理ベースフローマッチングを提案する。
提案手法では,FMよりも高精度な物理残差を最大8倍に抑えながら,分布精度では既存アルゴリズムよりも明らかに優れていることを示す。
論文 参考訳(メタデータ) (2025-06-10T09:13:37Z) - Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.82616476928464]
仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。
我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。
一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文 参考訳(メタデータ) (2024-09-04T17:48:19Z) - QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning [52.157939524815866]
本稿では,不均衡な活性化分布を量子化困難の原因として同定する。
我々は,これらの分布を,より量子化しやすいように微調整することで調整することを提案する。
本手法は3つの高解像度画像生成タスクに対して有効性を示す。
論文 参考訳(メタデータ) (2024-02-06T03:39:44Z) - Learning Energy-Based Prior Model with Diffusion-Amortized MCMC [89.95629196907082]
非収束短距離MCMCを用いた事前及び後方サンプリングによる潜時空間EMM学習の一般的な実践は、さらなる進歩を妨げている。
本稿では,MCMCサンプリングのための単純だが効果的な拡散型アモータイズ手法を導入し,それに基づく潜時空間EMMのための新しい学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-05T00:23:34Z) - MCMC-Correction of Score-Based Diffusion Models for Model Composition [2.682859657520006]
拡散モデルは、スコアやエネルギー関数の観点からパラメータ化することができる。
スコア関数の行積分に基づく新しいMH型受入規則を導入する。
論文 参考訳(メタデータ) (2023-07-26T07:50:41Z) - 3D wind field profiles from hyperspectral sounders: revisiting
optic-flow from a meteorological perspective [0.0]
本稿では, 垂直分解型3次元大気運動ベクトル(AMV)データをフォアキャスト方式で抽出するための効率的な光フローアルゴリズムを提案する。
この再帰法は, 実大気観測における現状の光学的流れアルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-09T10:14:25Z) - Modiff: Action-Conditioned 3D Motion Generation with Denoising Diffusion
Probabilistic Models [58.357180353368896]
本稿では,現実的で多様な3D骨格に基づく運動生成問題に対処するために,拡散確率モデル(DDPM)の利点を生かした条件付きパラダイムを提案する。
我々はDDPMを用いてカテゴリ的動作で条件付けられた動作列の可変数を合成する先駆的な試みである。
論文 参考訳(メタデータ) (2023-01-10T13:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。