論文の概要: Spike-and-Slab Generalized Additive Models and Scalable Algorithms for
High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2110.14449v1
- Date: Wed, 27 Oct 2021 14:11:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 14:43:57.562787
- Title: Spike-and-Slab Generalized Additive Models and Scalable Algorithms for
High-Dimensional Data
- Title(参考訳): 高次元データに対するスパイク・アンド・スラブ一般化付加モデルとスケーラブルアルゴリズム
- Authors: Boyi Guo, Byron C. Jaeger, A.K.M. Fazlur Rahman, D. Leann Long,
Nengjun Yi
- Abstract要約: 本稿では,高次元データに対応するため,階層型一般化加法モデル(GAM)を提案する。
曲線の適切な縮退と滑らか化関数線型空間と非線形空間の分離に対する平滑化ペナルティを考察する。
2つの決定論的アルゴリズム、EM-Coordinate Descent と EM-Iterative Weighted Least Squares は異なるユーティリティ向けに開発された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There are proposals that extend the classical generalized additive models
(GAMs) to accommodate high-dimensional data ($p>>n$) using group sparse
regularization. However, the sparse regularization may induce excess shrinkage
when estimating smoothing functions, damaging predictive performance. Moreover,
most of these GAMs consider an "all-in-all-out" approach for functional
selection, rendering them difficult to answer if nonlinear effects are
necessary. While some Bayesian models can address these shortcomings, using
Markov chain Monte Carlo algorithms for model fitting creates a new challenge,
scalability. Hence, we propose Bayesian hierarchical generalized additive
models as a solution: we consider the smoothing penalty for proper shrinkage of
curve interpolation and separation of smoothing function linear and nonlinear
spaces. A novel spike-and-slab spline prior is proposed to select components of
smoothing functions. Two scalable and deterministic algorithms, EM-Coordinate
Descent and EM-Iterative Weighted Least Squares, are developed for different
utilities. Simulation studies and metabolomics data analyses demonstrate
improved predictive or computational performance against state-of-the-art
models, mgcv, COSSO and sparse Bayesian GAM. The software implementation of the
proposed models is freely available via an R package BHAM.
- Abstract(参考訳): 群スパース正規化を用いた高次元データ(p>>n$)に対応するために、古典的一般化加法モデル(GAM)を拡張する提案がある。
しかし、スパース正規化は、スムージング関数の推定時に過剰な収縮を引き起こし、予測性能を損なう可能性がある。
さらに、これらのGAMの多くは、機能選択のための「オール・イン・オール・アウト」アプローチを考えており、非線形効果が必要な場合、答えが難しい。
いくつかのベイジアンモデルはこれらの欠点に対処できるが、マルコフ連鎖モンテカルロアルゴリズムをモデルフィッティングに用いると、新しい挑戦、スケーラビリティが生まれる。
したがって, ベイズ階層的一般化加法モデルを解として提案する: 曲線補間の適切な収縮と平滑化関数の線型空間と非線形空間の分離に対する平滑化ペナルティを考える。
平滑化関数の成分を選択するために,新しいスパイク・アンド・スラブスプラインが提案されている。
2つのスケーラブルで決定論的アルゴリズム、EM-Coordinate DescentとEM-Iterative Weighted Least Squareが異なるユーティリティ向けに開発された。
シミュレーション研究とメタボロミクスデータ解析により,最先端モデル,mgcv,COSSO,スパースベイズGAMに対する予測・計算性能が向上した。
提案したモデルのソフトウェア実装は、RパッケージのBHAMで自由に利用できる。
関連論文リスト
- SIGMA: Scale-Invariant Global Sparse Shape Matching [50.385414715675076]
非剛体形状の正確なスパース対応を生成するための新しい混合整数プログラミング(MIP)法を提案する。
いくつかの挑戦的な3Dデータセットに対して,スパースな非剛性マッチングの最先端結果を示す。
論文 参考訳(メタデータ) (2023-08-16T14:25:30Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Joint Graph Learning and Model Fitting in Laplacian Regularized
Stratified Models [5.933030735757292]
ラプラシア正規化成層モデル(Laplacian regularized Stratified Model、LRSM)は、サブプロブレムの明示的または暗黙的なネットワーク構造を利用するモデルである。
本稿では,LRSMにおけるグラフ重みの重要性と感度を示し,その感度が任意に大きいことを示す。
本稿では,1つの最適化問題を解くことで,モデルパラメータを適合させながらグラフを共同学習する汎用的手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T06:06:29Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - T-LoHo: A Bayesian Regularization Model for Structured Sparsity and
Smoothness on Graphs [0.0]
グラフ構造化データでは、構造化されたスパーシリティと滑らかさが団結する傾向にある。
グラフィカルな関係を持つ高次元パラメータに先立って提案する。
構造された空間と滑らかさを同時に検出するために使用します。
論文 参考訳(メタデータ) (2021-07-06T10:10:03Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Slice Sampling for General Completely Random Measures [74.24975039689893]
本稿では, 後続推定のためのマルコフ連鎖モンテカルロアルゴリズムについて, 補助スライス変数を用いてトランケーションレベルを適応的に設定する。
提案アルゴリズムの有効性は、いくつかの一般的な非パラメトリックモデルで評価される。
論文 参考訳(メタデータ) (2020-06-24T17:53:53Z) - Estimation of sparse Gaussian graphical models with hidden clustering
structure [8.258451067861932]
隠れクラスタリング構造を持つスパースガウス図形モデルを推定するモデルを提案する。
対称なガウス・シーデルに基づく乗算器の交互方向法を開発した。
合成データと実データの両方に関する数値実験により,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-04-17T08:43:31Z) - Bayesian System ID: Optimal management of parameter, model, and
measurement uncertainty [0.0]
システム識別(ID)の確率的定式化の頑健さを,スパース,ノイズ,間接データに対して評価した。
従来手法の目的関数面と比較して,ログ後部は幾何学的特性が向上したことを示す。
論文 参考訳(メタデータ) (2020-03-04T22:48:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。