論文の概要: Missingness-aware Data Imputation via AI-powered Bayesian Generative Modeling
- arxiv url: http://arxiv.org/abs/2605.01676v1
- Date: Sun, 03 May 2026 02:22:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.880746
- Title: Missingness-aware Data Imputation via AI-powered Bayesian Generative Modeling
- Title(参考訳): AIを用いたベイジアン生成モデルによるミスネス認識データインプット
- Authors: Qiao Liu,
- Abstract要約: ベイズ生成モデルを用いたAIによる欠落データ計算手法であるMissBGMを提案する。
MissBGMはデータ生成と欠落のメカニズムを明示的にかつ共同でモデル化し、命令に対する原則的な不確実性を提供します。
我々の理論的分析は、MissBGMの欠落値の推定は穏やかな仮定の下で一貫して収束していることを示している。
- 参考スコア(独自算出の注目度): 4.232182005146145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing data imputation remains a fundamental challenge in modern data science, especially when uncertainty quantification is essential. In this work, we propose MissBGM, an AI-powered missing data imputation method via Bayesian generative modeling that bridges the expressive flexibility of neural networks with the statistical rigor of Bayesian inference. Unlike existing methods that often focus on point estimates or treat the missingness mechanism implicitly, MissBGM explicitly and jointly models the data-generating and missingness mechanisms, providing principled posterior uncertainty over imputations rather than a single point estimate. We develop a stochastic optimization framework with alternating updates among missing values, model parameters, and latent variables until convergence. Our theoretical analysis shows that estimates of missing values from MissBGM converge consistently under mild assumptions. Empirically, we demonstrate that MissBGM achieves superior performance over traditional imputers and recent neural network-based methods across extensive experimental settings. These results establish MissBGM as a principled and scalable solution for modern missing data imputation. The code for MissBGM is open sourced at https://github.com/liuq-lab/MissBGM.
- Abstract(参考訳): データ計算の欠如は、特に不確実な定量化が不可欠である場合、現代データ科学における根本的な課題である。
本研究では,ベイジアン推論の統計的厳密さでニューラルネットワークの表現的柔軟性を橋渡しする,ベイジアン生成モデルを用いたAIによる欠落データ計算手法であるMissBGMを提案する。
点推定や欠落メカニズムを暗黙的に扱う既存の方法とは異なり、MissBGMはデータ生成および欠落機構を明示的にモデル化し、単一の点推定ではなく、インプットに対する原則的な後続不確実性を提供する。
コンバージェンスまで、欠落値、モデルパラメータ、潜伏変数の更新を交互に行う確率最適化フレームワークを開発した。
我々の理論的分析は、MissBGMの欠落値の推定は穏やかな仮定の下で一貫して収束していることを示している。
実験により、MissBGMは従来のインプタや最近のニューラルネットワークベースの手法よりも広範な実験環境において優れた性能を発揮することを示した。
これらの結果は、MissBGMを、現代の欠落データ計算のための原則的でスケーラブルなソリューションとして確立している。
MissBGMのコードはhttps://github.com/liuq-lab/MissBGMで公開されている。
関連論文リスト
- Uncertainty Quantification for Deep Regression using Contextualised Normalizing Flows [1.8899300124593648]
本稿では,予測間隔と完全条件付き予測分布の両方を生成する新しい不確実性定量化手法であるMCNFを紹介する。
MCNFは、基礎となるトレーニングされた予測モデル上で動作するため、予測モデルの再トレーニングは不要である。
我々は、MCNFに基づく不確実性推定が十分に校正され、最先端の不確実性定量化手法と競合し、下流の意思決定タスクに対してよりリッチな情報を提供する実験的な証拠を提供する。
論文 参考訳(メタデータ) (2025-11-30T11:08:40Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Principled Input-Output-Conditioned Post-Hoc Uncertainty Estimation for Regression Networks [1.4671424999873808]
不確実性は安全性に敏感なアプリケーションでは重要であるが、予測性能に悪影響を及ぼすため、市販のニューラルネットワークから排除されることが多い。
本稿では,従来の入力と凍結モデルの両方に補助モデルを適用することにより,回帰タスクにおけるポストホック不確実性推定のための理論的基盤となるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-01T09:13:27Z) - Understanding the Trade-offs in Accuracy and Uncertainty Quantification: Architecture and Inference Choices in Bayesian Neural Networks [0.276240219662896]
有望な理論的結果にもかかわらず、最もよく使われる後部近似の性質はしばしば疑問視される。
現代の深層モデルの次元は、識別可能性の欠如と相まって、マルコフ連鎖モンテカルロ(MCMC)は後部を完全に探索することができない。
変分推論は計算複雑性の改善による恩恵を受けるが、サンプリングベース推論のマルチモーダル保証は欠如している。
変分近似の積み重ねとアンサンブルにより、MCMCに匹敵する精度が大幅に低減された。
論文 参考訳(メタデータ) (2025-03-14T18:55:48Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - A Hierarchical Variational Neural Uncertainty Model for Stochastic Video
Prediction [45.6432265855424]
本稿では,モデルの予測不確かさの原理的定量化であるニューラル不確実性量化器(NUQ)を紹介する。
提案するフレームワークは,最先端モデルと比較して効果的に訓練する。
論文 参考訳(メタデータ) (2021-10-06T00:25:22Z) - NeuMiss networks: differentiable programming for supervised learning
with missing values [0.0]
線形性仮定の下で最適予測器の解析形式を導出する。
我々はNeuMissネットワークという新しい原則アーキテクチャを提案する。
パラメータの数と、欠落したデータパターンの数に依存しない計算複雑性の両方で、予測精度が良い。
論文 参考訳(メタデータ) (2020-07-03T11:42:25Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。