論文の概要: R-ParVI: Particle-based variational inference through lens of rewards
- arxiv url: http://arxiv.org/abs/2502.20482v1
- Date: Thu, 27 Feb 2025 19:50:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:42:21.326362
- Title: R-ParVI: Particle-based variational inference through lens of rewards
- Title(参考訳): R-ParVI:報酬レンズによる粒子に基づく変分推論
- Authors: Yongchao Huang,
- Abstract要約: 部分的に既知の密度をサンプリングするために, 報酬誘導, 勾配のないParVI法を提案する。
R-ParVIは、確率モデルのクラスに対して、高速で、柔軟で、スケーラブルで、推論を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: A reward-guided, gradient-free ParVI method, \textit{R-ParVI}, is proposed for sampling partially known densities (e.g. up to a constant). R-ParVI formulates the sampling problem as particle flow driven by rewards: particles are drawn from a prior distribution, navigate through parameter space with movements determined by a reward mechanism blending assessments from the target density, with the steady state particle configuration approximating the target geometry. Particle-environment interactions are simulated by stochastic perturbations and the reward mechanism, which drive particles towards high density regions while maintaining diversity (e.g. preventing from collapsing into clusters). R-ParVI offers fast, flexible, scalable and stochastic sampling and inference for a class of probabilistic models such as those encountered in Bayesian inference and generative modelling.
- Abstract(参考訳): 部分的に既知の密度(例えば定数まで)をサンプリングするために、報酬誘導で勾配のないParVI法である \textit{R-ParVI} を提案する。
R-ParVI は、粒子が先行分布から引き出され、目標密度から評価をブレンドする報酬機構によって決定された運動によってパラメータ空間をナビゲートし、目標幾何を近似する定常状態粒子構成である。
粒子-環境相互作用は確率的摂動と、多様性を維持しながら粒子を高密度領域へと誘導する報酬機構によってシミュレートされる。
R-ParVIは、ベイズ的推論や生成モデルのような確率的モデルのクラスに対して、高速で、柔軟で、スケーラブルで確率的なサンプリングと推論を提供する。
関連論文リスト
- Semi-Implicit Functional Gradient Flow [30.32233517392456]
近似系として摂動粒子を用いる関数勾配ParVI法を提案する。
対応する関数勾配流は、スコアマッチングによって推定できるが、強い理論的収束を保証する。
論文 参考訳(メタデータ) (2024-10-23T15:00:30Z) - Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Variational Inference Using Material Point Method [0.0]
MPM-ParVIは変分推論のための勾配に基づく粒子サンプリング法である。
確率モデルのクラスに対する決定論的サンプリングと推論を提供する。
論文 参考訳(メタデータ) (2024-07-26T17:19:50Z) - Variational Inference via Smoothed Particle Hydrodynamics [0.0]
滑らかな粒子流体力学に基づく新しい変分推論法を提案する。
高速で、柔軟で、スケーラブルで、決定論的なサンプリングと、確率モデルのクラスに対する推論を提供する。
論文 参考訳(メタデータ) (2024-07-12T11:38:41Z) - Dynamical Measure Transport and Neural PDE Solvers for Sampling [77.38204731939273]
本研究では, 対象物へのトラクタブル密度関数の移動として, 確率密度からサンプリングする作業に取り組む。
物理インフォームドニューラルネットワーク(PINN)を用いて各偏微分方程式(PDE)の解を近似する。
PINNはシミュレーションと離散化のない最適化を可能にし、非常に効率的に訓練することができる。
論文 参考訳(メタデータ) (2024-07-10T17:39:50Z) - Electrostatics-based particle sampling and approximate inference [0.0]
静電気学とニュートン力学の原理に基づく新しい粒子に基づくサンプリングおよび近似推論法が導入された。
より一般的な推論問題において、離散時間離散空間のアルゴリズム設計が使用される。
論文 参考訳(メタデータ) (2024-06-28T16:53:06Z) - On the Trajectory Regularity of ODE-based Diffusion Sampling [79.17334230868693]
拡散に基づく生成モデルは微分方程式を用いて、複素データ分布と抽出可能な事前分布の間の滑らかな接続を確立する。
本稿では,拡散モデルのODEに基づくサンプリングプロセスにおいて,いくつかの興味深い軌道特性を同定する。
論文 参考訳(メタデータ) (2024-05-18T15:59:41Z) - Sampling in Unit Time with Kernel Fisher-Rao Flow [0.0]
非正規化対象密度からサンプリングするための平均場ODEと対応する相互作用粒子系(IPS)を導入する。
IPSは勾配のない閉形式であり、参照密度からサンプリングし、(正規化されていない)ターゲット-参照密度比を計算する能力のみを必要とする。
論文 参考訳(メタデータ) (2024-01-08T13:43:56Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - Sampling with Mollified Interaction Energy Descent [57.00583139477843]
モーフィファイド相互作用エネルギー降下(MIED)と呼ばれる新しい最適化に基づくサンプリング手法を提案する。
MIEDは、モル化相互作用エネルギー(MIE)と呼ばれる確率測度に関する新しいクラスのエネルギーを最小化する
我々は,制約のないサンプリング問題に対して,我々のアルゴリズムがSVGDのような既存の粒子ベースアルゴリズムと同等に動作することを示す。
論文 参考訳(メタデータ) (2022-10-24T16:54:18Z) - Flow-based sampling in the lattice Schwinger model at criticality [54.48885403692739]
フローベースアルゴリズムは、格子場理論への応用のためのフィールド分布の効率的なサンプリングを提供することができる。
フェルミオン質量の臨界値におけるシュウィンガーモデルにおけるロバストな流れに基づくサンプリングの数値的な実演を行う。
論文 参考訳(メタデータ) (2022-02-23T19:00:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。