論文の概要: Scalable Bayesian inference for the generalized linear mixed model
- arxiv url: http://arxiv.org/abs/2403.03007v2
- Date: Tue, 16 Apr 2024 17:47:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-17 22:46:16.363291
- Title: Scalable Bayesian inference for the generalized linear mixed model
- Title(参考訳): 一般化線形混合モデルに対するスケーラブルベイズ推論
- Authors: Samuel I. Berchuck, Felipe A. Medeiros, Sayan Mukherjee, Andrea Agazzi,
- Abstract要約: 本稿では,AIとベイズ推論の交点に統計的推論アルゴリズムを導入する。
我々のアルゴリズムは、相関データの処理に対処する新しい貢献を伴う勾配MCMCの拡張である。
我々はこのアルゴリズムを大規模な電子健康記録データベースに適用する。
- 参考スコア(独自算出の注目度): 2.45365913654612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generalized linear mixed model (GLMM) is a popular statistical approach for handling correlated data, and is used extensively in applications areas where big data is common, including biomedical data settings. The focus of this paper is scalable statistical inference for the GLMM, where we define statistical inference as: (i) estimation of population parameters, and (ii) evaluation of scientific hypotheses in the presence of uncertainty. Artificial intelligence (AI) learning algorithms excel at scalable statistical estimation, but rarely include uncertainty quantification. In contrast, Bayesian inference provides full statistical inference, since uncertainty quantification results automatically from the posterior distribution. Unfortunately, Bayesian inference algorithms, including Markov Chain Monte Carlo (MCMC), become computationally intractable in big data settings. In this paper, we introduce a statistical inference algorithm at the intersection of AI and Bayesian inference, that leverages the scalability of modern AI algorithms with guaranteed uncertainty quantification that accompanies Bayesian inference. Our algorithm is an extension of stochastic gradient MCMC with novel contributions that address the treatment of correlated data (i.e., intractable marginal likelihood) and proper posterior variance estimation. Through theoretical and empirical results we establish our algorithm's statistical inference properties, and apply the method in a large electronic health records database.
- Abstract(参考訳): 一般化線形混合モデル(GLMM)は相関データを扱うための一般的な統計手法であり、バイオメディカルデータ設定を含むビッグデータが一般的であるアプリケーション領域で広く利用されている。
本論文の焦点は,統計推論を次のように定義するGLMMに対するスケーラブルな統計的推論である。
一 人口パラメータの推定、及び
二 不確実性の有無における科学的仮説の評価
人工知能(AI)学習アルゴリズムは、スケーラブルな統計的推定において優れているが、不確実な定量化を含むことは滅多にない。
対照的にベイズ推論は、不確実な定量化が後部分布から自動的に生じるため、完全な統計的推測を提供する。
残念なことに、マルコフ・チェイン・モンテカルロ (MCMC) を含むベイジアン推論アルゴリズムは、ビッグデータ設定において計算的に難解になる。
本稿では,AIとベイジアン推論の交点に統計的推論アルゴリズムを導入し,ベイジアン推論に付随する不確実性定量化を保証した現代AIアルゴリズムのスケーラビリティを活用する。
提案アルゴリズムは確率勾配MCMCの拡張であり, 相関データ(すなわち, 難解な辺縁確率)の処理と適切な後方偏差推定に対処する新しい寄与がある。
理論的および実証的な結果を通じて,我々のアルゴリズムの統計的推測特性を確立し,この手法を大規模電子健康記録データベースに適用する。
関連論文リスト
- A sparse PAC-Bayesian approach for high-dimensional quantile prediction [0.0]
本稿では,高次元量子化予測のための確率論的機械学習手法を提案する。
擬似ベイズ的フレームワークとスケールした学生tとランゲヴィン・モンテカルロを併用して効率的な計算を行う。
その効果はシミュレーションや実世界のデータを通じて検証され、そこでは確立された頻繁な手法やベイズ的手法と競合する。
論文 参考訳(メタデータ) (2024-09-03T08:01:01Z) - Uncertainty quantification in metric spaces [3.637162892228131]
本稿では、応答が分離可能な距離空間で値を取る回帰モデルのための新しい不確実性定量化フレームワークを提案する。
提案アルゴリズムは,大規模データセットを効率的に処理し,使用する予測ベースモデルに依存しない。
論文 参考訳(メタデータ) (2024-05-08T15:06:02Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Distributed Semi-Supervised Sparse Statistical Inference [6.685997976921953]
縮退推定器は高次元モデルパラメータの統計的推測において重要なツールである。
従来の手法では、すべてのマシンで偏りのある推定器を計算する必要がある。
ラベル付きデータと非ラベル付きデータを統合した効率的なマルチラウンド分散脱バイアス推定器を開発した。
論文 参考訳(メタデータ) (2023-06-17T17:30:43Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - Statistical and Computational Trade-offs in Variational Inference: A
Case Study in Inferential Model Selection [27.817156428797567]
変分推論は、古典的マルコフ連鎖モンテカルロの代替として人気がある。
本研究では,変分推論における統計的および計算的トレードオフについて,推論モデル選択におけるケーススタディを用いて検討する。
計算予算が固定された場合、低ランク推論モデルは、高い統計的近似誤差を持つ変分後部を生成することを証明した。
論文 参考訳(メタデータ) (2022-07-22T17:16:05Z) - BayesIMP: Uncertainty Quantification for Causal Data Fusion [52.184885680729224]
本研究では,複数の因果グラフに関連するデータセットを組み合わせ,対象変数の平均処理効果を推定する因果データ融合問題について検討する。
本稿では、確率積分とカーネル平均埋め込みのアイデアを組み合わせて、再生されたカーネルヒルベルト空間における干渉分布を表現するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-07T10:14:18Z) - Distributed Learning of Finite Gaussian Mixtures [21.652015112462]
有限ガウス混合系の分散学習における分割・対数アプローチについて検討する。
新しい推定器は整合性を示し、いくつかの一般的な条件下ではルート-nの整合性を保持する。
シミュレーションおよび実世界のデータに基づく実験により、提案手法はグローバル推定器と同等の統計的性能を有することが示された。
論文 参考訳(メタデータ) (2020-10-20T16:17:47Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。