論文の概要: Learning Energy-Based Models from Stochastic Interpolants using Spatiotemporal Differences
- arxiv url: http://arxiv.org/abs/2605.26850v1
- Date: Tue, 26 May 2026 11:07:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.900007
- Title: Learning Energy-Based Models from Stochastic Interpolants using Spatiotemporal Differences
- Title(参考訳): 時空間差を用いた確率補間器からのエネルギーモデル学習
- Authors: Hanlin Yu, RuiKang OuYang, Partha Kaushik, Arto Klami, Michael U. Gutmann, Omar Chehab,
- Abstract要約: データサンプルからエネルギーベースのモデルを学ぶことは、機械学習における中心的な問題である。
共同時間差によるエネルギー学習の枠組みであるstNCEを提案する。
画像および分子の実験は、最先端密度推定法と競合する性能を示す。
- 参考スコア(独自算出の注目度): 10.869979743542125
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning an energy-based model from data samples is a central problem in machine learning. Many recent and popular methods, such as denoising score matching for training energy-based diffusion models, use stochastic interpolants to corrupt data samples at different noise levels indexed by a time variable. This defines a joint density over both the data space and time, and most methods learn its energy through either spatial or temporal differences. We identify distinct failure modes for both of these approaches. To solve them, we propose Spatiotemporal Noise-Contrastive Estimation (stNCE), a framework for learning the energy through joint spatiotemporal differences. stNCE unifies many existing methods and leads to new training objectives. Experiments on images and molecules demonstrate performance competitive with state-of-the-art density estimation methods.
- Abstract(参考訳): データサンプルからエネルギーベースのモデルを学ぶことは、機械学習における中心的な問題である。
エネルギーベース拡散モデルのトレーニングのためのスコアマッチングのデノレーションなど、近年人気の高い多くの手法では、確率補間剤を用いて、時間変数によってインデックスされた異なるノイズレベルのデータサンプルを破損させる。
これはデータ空間と時間の両方の結合密度を定義し、ほとんどの手法は空間的または時間的差によってそのエネルギーを学習する。
これら2つのアプローチの異なる障害モードを特定します。
そこで我々は,共同時空間差によるエネルギー学習の枠組みである時空間雑音コントラスト推定(stNCE)を提案する。
stNCEは多くの既存のメソッドを統一し、新しいトレーニング目標へと導く。
画像および分子の実験は、最先端密度推定法と競合する性能を示す。
関連論文リスト
- From discrete-time policies to continuous-time diffusion samplers: Asymptotic equivalences and faster training [16.299508349934754]
本研究では,Boltzmann分布から対象サンプルにアクセスすることなく,ニューラルネットワークの微分方程式(拡散モデル)を学習する問題について検討する。
このようなモデルの既存の訓練方法は、生成過程とノイズ発生過程の時間反転を強制する。
トレーニング中の粗い時間離散化の適切な選択は、サンプル効率と時間局所目標の使用を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2025-01-10T18:18:25Z) - Improved off-policy training of diffusion samplers [93.66433483772055]
本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文 参考訳(メタデータ) (2024-02-07T18:51:49Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - How Much is Enough? A Study on Diffusion Times in Score-based Generative
Models [76.76860707897413]
現在のベストプラクティスは、フォワードダイナミクスが既知の単純なノイズ分布に十分に近づくことを確実にするために大きなTを提唱している。
本稿では, 理想とシミュレーションされたフォワードダイナミクスのギャップを埋めるために補助モデルを用いて, 標準的な逆拡散過程を導出する方法について述べる。
論文 参考訳(メタデータ) (2022-06-10T15:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。