論文の概要: Bayesian Data Sketching for Varying Coefficient Regression Models
- arxiv url: http://arxiv.org/abs/2506.00270v1
- Date: Fri, 30 May 2025 22:09:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 01:42:09.17201
- Title: Bayesian Data Sketching for Varying Coefficient Regression Models
- Title(参考訳): 変動係数回帰モデルのためのベイズデータスケッチ
- Authors: Rajarshi Guhaniyogi, Laura Baracaldo, Sudipto Banerjee,
- Abstract要約: 本研究では, 様々な係数モデルに対するベイジアンデータスケッチを導入し, 大きなサンプルサイズで表される計算課題を回避した。
提案手法は,大規模関数型データを解析するための既存手法と相違する。
圧縮されたデータに様々な係数回帰モデルの確立された方法とアルゴリズムを適用することができる。
- 参考スコア(独自算出の注目度): 1.6727186769396276
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Varying coefficient models are popular for estimating nonlinear regression functions in functional data models. Their Bayesian variants have received limited attention in large data applications, primarily due to prohibitively slow posterior computations using Markov chain Monte Carlo (MCMC) algorithms. We introduce Bayesian data sketching for varying coefficient models to obviate computational challenges presented by large sample sizes. To address the challenges of analyzing large data, we compress the functional response vector and predictor matrix by a random linear transformation to achieve dimension reduction and conduct inference on the compressed data. Our approach distinguishes itself from several existing methods for analyzing large functional data in that it requires neither the development of new models or algorithms, nor any specialized computational hardware while delivering fully model-based Bayesian inference. Well-established methods and algorithms for varying coefficient regression models can be applied to the compressed data.
- Abstract(参考訳): ヴァリング係数モデルは、関数型データモデルにおける非線形回帰関数の推定に人気がある。
ベイズ変種は、主にマルコフ連鎖モンテカルロ (MCMC) アルゴリズムを用いた計算が不当に遅いために、大規模データアプリケーションにおいて限られた注目を集めている。
本研究では, 様々な係数モデルに対するベイジアンデータスケッチを導入し, 大きなサンプルサイズで表される計算課題を回避した。
大規模データ解析の課題に対処するため,関数応答ベクトルと予測行列をランダムな線形変換により圧縮し,次元の縮小と圧縮データに対する推論を行う。
提案手法は,新しいモデルやアルゴリズムの開発も特別な計算ハードウェアも必要とせず,完全なモデルベースベイズ推論を実現するため,大規模関数データの解析方法と相違する。
圧縮されたデータに様々な係数回帰モデルの確立された方法とアルゴリズムを適用することができる。
関連論文リスト
- Branch and Bound to Assess Stability of Regression Coefficients in Uncertain Models [0.6990493129893112]
提案アルゴリズムは,数学的な結果のサポート,サンプルアプリケーション,コンピュータコードへのリンクなどとともに導入する。
これは、研究者が高次元データを要約し、不確実なモデルにおける回帰係数の安定性を評価するのに役立つ。
論文 参考訳(メタデータ) (2024-08-19T01:37:14Z) - Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Approximate Gibbs Sampler for Efficient Inference of Hierarchical Bayesian Models for Grouped Count Data [0.0]
本研究は、推定精度を維持しつつ、HBPRMを効率的に学習するための近似ギブスサンプリング器(AGS)を開発した。
実データと合成データを用いた数値実験により,AGSの優れた性能を示した。
論文 参考訳(メタデータ) (2022-11-28T21:00:55Z) - RMFGP: Rotated Multi-fidelity Gaussian process with Dimension Reduction
for High-dimensional Uncertainty Quantification [12.826754199680474]
マルチフィデリティモデリングは、少量の正確なデータしか入手できない場合でも、正確な推測を可能にする。
高忠実度モデルと1つ以上の低忠実度モデルを組み合わせることで、多忠実度法は興味のある量の正確な予測を行うことができる。
本稿では,回転多要素ガウス過程の回帰に基づく新しい次元削減フレームワークとベイズ能動学習手法を提案する。
論文 参考訳(メタデータ) (2022-04-11T01:20:35Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。