論文の概要: Flow-Based Likelihoods for Non-Gaussian Inference
- arxiv url: http://arxiv.org/abs/2007.05535v2
- Date: Fri, 6 Nov 2020 17:33:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 22:45:54.551691
- Title: Flow-Based Likelihoods for Non-Gaussian Inference
- Title(参考訳): 非ガウシアン推論のためのフローベース確率
- Authors: Ana Diaz Rivero and Cora Dvorkin
- Abstract要約: 我々は、多くの科学的分析において重要な仮定を回避するためのデータ駆動可能性の使用について検討する。
有限標本サイズによるサンプリング誤差と同程度の精度で再現可能であることを示す。
データ内のさまざまなレベルのNGをキャプチャ可能な一連のテストを導入することで、従来のデータ駆動可能性の成功と失敗は、データのNG構造に結びつくことができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate the use of data-driven likelihoods to bypass a key assumption
made in many scientific analyses, which is that the true likelihood of the data
is Gaussian. In particular, we suggest using the optimization targets of
flow-based generative models, a class of models that can capture complex
distributions by transforming a simple base distribution through layers of
nonlinearities. We call these flow-based likelihoods (FBL). We analyze the
accuracy and precision of the reconstructed likelihoods on mock Gaussian data,
and show that simply gauging the quality of samples drawn from the trained
model is not a sufficient indicator that the true likelihood has been learned.
We nevertheless demonstrate that the likelihood can be reconstructed to a
precision equal to that of sampling error due to a finite sample size. We then
apply FBLs to mock weak lensing convergence power spectra, a cosmological
observable that is significantly non-Gaussian (NG). We find that the FBL
captures the NG signatures in the data extremely well, while other commonly
used data-driven likelihoods, such as Gaussian mixture models and independent
component analysis, fail to do so. This suggests that works that have found
small posterior shifts in NG data with data-driven likelihoods such as these
could be underestimating the impact of non-Gaussianity in parameter
constraints. By introducing a suite of tests that can capture different levels
of NG in the data, we show that the success or failure of traditional
data-driven likelihoods can be tied back to the structure of the NG in the
data. Unlike other methods, the flexibility of the FBL makes it successful at
tackling different types of NG simultaneously. Because of this, and
consequently their likely applicability across datasets and domains, we
encourage their use for inference when sufficient mock data are available for
training.
- Abstract(参考訳): 本研究では,多くの科学的解析における重要な仮定をバイパスするために,データ駆動確率の利用について検討する。
特に、非線形の層を通して単純な基底分布を変換して複雑な分布を捉えることができるモデルであるフローベース生成モデルの最適化ターゲットの利用を提案する。
フローベース可能性 (FBL) と呼ぶ。
モックガウスデータを用いて再構成された可能性の精度と精度を解析し、訓練されたモデルから抽出されたサンプルの品質を単純に計測することは、真の可能性が学習された十分な指標ではないことを示す。
しかし,サンプルサイズが有限であることから,サンプリング誤差と同程度の精度で再現可能であることを示す。
次に、弱レンズ収束パワースペクトル(宇宙観測可能な非ガウス(NG))をモックにFBLを適用する。
FBLはデータ中のNGシグネチャを極めてよく捉えているのに対し、ガウス混合モデルや独立成分分析など、データ駆動の可能性が一般的である。
このことは、NGデータにデータ駆動可能性のある小さな後方シフトを発見した研究は、パラメータ制約における非ガウス性の影響を過小評価する可能性があることを示唆している。
データ内のさまざまなレベルのNGをキャプチャ可能な一連のテストを導入することで、従来のデータ駆動可能性の成功と失敗は、データ内のNGの構造に結びつくことができることを示す。
他の方法とは異なり、FBLの柔軟性は異なる種類のNGを同時に扱うことに成功している。
このため、データセットとドメインにまたがる適用可能性が高く、十分なモックデータがトレーニングに利用できる場合、推論に使用することを推奨します。
関連論文リスト
- A Priori Uncertainty Quantification of Reacting Turbulence Closure Models using Bayesian Neural Networks [0.0]
反応流モデルにおける不確実性を捉えるためにベイズニューラルネットワークを用いる。
我々は、BNNモデルが、データ駆動クロージャモデルの不確実性の構造に関するユニークな洞察を提供することができることを示した。
このモデルの有効性は,様々な火炎条件と燃料からなるデータセットに対する事前評価によって実証される。
論文 参考訳(メタデータ) (2024-02-28T22:19:55Z) - Learning Multivariate CDFs and Copulas using Tensor Factorization [39.24470798045442]
データの多変量分布を学習することは、統計学と機械学習における中核的な課題である。
本研究では,多変量累積分布関数(CDF)を学習し,混合確率変数を扱えるようにすることを目的とする。
混合確率変数の合同CDFの任意のグリッドサンプリング版は、単純ベイズモデルとして普遍表現を許容することを示す。
提案モデルの性能を,回帰,サンプリング,データ計算を含むいくつかの合成および実データおよびアプリケーションで実証する。
論文 参考訳(メタデータ) (2022-10-13T16:18:46Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - ManiFlow: Implicitly Representing Manifolds with Normalizing Flows [145.9820993054072]
正規化フロー(NF)は、複雑な実世界のデータ分布を正確にモデル化することが示されているフレキシブルな明示的な生成モデルである。
摂動分布から標本を与えられた多様体上の最も可能性の高い点を復元する最適化目的を提案する。
最後に、NFsの明示的な性質、すなわち、ログのような勾配とログのような勾配から抽出された表面正規化を利用する3次元点雲に焦点を当てる。
論文 参考訳(メタデータ) (2022-08-18T16:07:59Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Copula Flows for Synthetic Data Generation [0.5801044612920815]
確率モデルを合成データ生成器として用いることを提案する。
密度推定の手法として,シミュレーションと実データの両方をベンチマークした。
論文 参考訳(メタデータ) (2021-01-03T10:06:23Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Data-driven learning of robust nonlocal physics from high-fidelity
synthetic data [3.9181541460605116]
非局所モデルに対する主要な課題は、それらを第一原理から導き出す解析的複雑さであり、しばしばそれらの使用は後続法として正当化される。
本研究では、データから非局所モデルを取り出し、これらの課題を回避し、結果のモデルフォームに対するデータ駆動的正当化を提供する。
論文 参考訳(メタデータ) (2020-05-17T22:53:14Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。