論文の概要: Diffusion posterior sampling for simulation-based inference in tall data settings
- arxiv url: http://arxiv.org/abs/2404.07593v1
- Date: Thu, 11 Apr 2024 09:23:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 14:29:24.102745
- Title: Diffusion posterior sampling for simulation-based inference in tall data settings
- Title(参考訳): 高精度データ設定におけるシミュレーションに基づく推論のための拡散後サンプリング
- Authors: Julia Linhart, Gabriel Victorino Cardoso, Alexandre Gramfort, Sylvain Le Corff, Pedro L. C. Rodrigues,
- Abstract要約: シミュレーションベース推論(SBI)はこの文脈で際立っているのは、深層生成モデルのトレーニングにシミュレーションのデータセットを必要とすることである。
本研究では,複数の観測値が利用可能であり,それらの共有情報を活用してモデルのパラメータをよりよく推測することのできる,背の高いデータ拡張について考察する。
提案手法は,近年盛んに行われているスコアベース拡散文学の成果に基づいて構築され,個々の観測に基づいて学習したスコアネットワークの情報を用いて,高度データ後部分布を推定することができる。
- 参考スコア(独自算出の注目度): 53.17563688225137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Determining which parameters of a non-linear model could best describe a set of experimental data is a fundamental problem in science and it has gained much traction lately with the rise of complex large-scale simulators (a.k.a. black-box simulators). The likelihood of such models is typically intractable, which is why classical MCMC methods can not be used. Simulation-based inference (SBI) stands out in this context by only requiring a dataset of simulations to train deep generative models capable of approximating the posterior distribution that relates input parameters to a given observation. In this work, we consider a tall data extension in which multiple observations are available and one wishes to leverage their shared information to better infer the parameters of the model. The method we propose is built upon recent developments from the flourishing score-based diffusion literature and allows us to estimate the tall data posterior distribution simply using information from the score network trained on individual observations. We compare our method to recently proposed competing approaches on various numerical experiments and demonstrate its superiority in terms of numerical stability and computational cost.
- Abstract(参考訳): 非線形モデルのどのパラメータが実験データの集合を最もよく記述できるかを決定することは科学の基本的な問題であり、近年は複雑な大規模シミュレータ(ブラックボックスシミュレータ)の台頭によって大きな注目を集めている。
このようなモデルの可能性は通常難解であり、古典的なMCMC法は使用できない。
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後続分布を近似できる深層生成モデルの訓練にシミュレーションのデータセットを必要とするだけで、この文脈で際立っている。
本研究では,複数の観測値が利用可能であり,それらの共有情報を活用してモデルのパラメータをよりよく推測することのできる,背の高いデータ拡張について考察する。
提案手法は,近年盛んになっているスコアベース拡散文学の成果に基づいて構築され,個々の観測に基づいて学習したスコアネットワークの情報を用いて,高度データ後部分布を推定することができる。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
関連論文リスト
- Learning Coupled Subspaces for Multi-Condition Spike Data [8.114880112033644]
神経科学では、研究者は複数の条件下で実験を行い、高次元スパイクトレインデータセットの形で神経応答を得る。
実験条件空間上でスムーズなチューニング関数を学習するための非パラメトリックベイズ手法を提案する。
論文 参考訳(メタデータ) (2024-10-24T20:44:28Z) - Embed and Emulate: Contrastive representations for simulation-based inference [11.543221890134399]
本稿では,新しいシミュレーションベース推論(SBI)手法であるEmbed and Emulate(E&E)を紹介する。
E&Eはデータと対応する高速エミュレータの低次元潜伏埋め込みを潜伏空間に学習する。
本研究では,現実的なパラメータ推定タスクにおいて,既存の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-27T02:37:01Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Simulation-based inference using surjective sequential neural likelihood
estimation [50.24983453990065]
主観的逐次的ニューラルネットワーク類似度推定はシミュレーションに基づく推論の新しい手法である。
データを低次元空間に埋め込むことで、SSNLは高次元データセットに適用する際の従来の可能性ベースの手法が抱えるいくつかの問題を解く。
論文 参考訳(メタデータ) (2023-08-02T10:02:38Z) - Nonparametric likelihood-free inference with Jensen-Shannon divergence
for simulator-based models with categorical output [1.4298334143083322]
シミュレータに基づく統計モデルに対する自由な推論は、機械学習と統計のコミュニティの両方において、関心の高まりを招いている。
本稿では、Jensen-Shannon- divergenceの計算特性を用いて、モデルパラメータに対する推定、仮説テスト、信頼区間の構築を可能にする理論的結果のセットを導出する。
このような近似はより集中的なアプローチの素早い代替手段であり、シミュレーターベースモデルの多種多様な応用には魅力的である。
論文 参考訳(メタデータ) (2022-05-22T18:00:13Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Approximate Bayesian Computation with Path Signatures [0.5156484100374059]
本稿では,時系列データ間の距離を構築するための自然候補としてパスシグネチャを導入する。
実験により, 従来の時系列モデルよりも高精度なベイズ後方推定が可能であることが示された。
論文 参考訳(メタデータ) (2021-06-23T17:25:43Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Predicting Multidimensional Data via Tensor Learning [0.0]
本研究では,本データセットの内在的多次元構造を保持するモデルを開発する。
モデルパラメータを推定するために、オルタネート・リースト・スクエアスアルゴリズムを開発した。
提案モデルは,予測文献に存在するベンチマークモデルより優れている。
論文 参考訳(メタデータ) (2020-02-11T11:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。