論文の概要: Scalable Estimation for Structured Additive Distributional Regression
- arxiv url: http://arxiv.org/abs/2301.05593v1
- Date: Fri, 13 Jan 2023 14:59:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 15:11:19.859415
- Title: Scalable Estimation for Structured Additive Distributional Regression
- Title(参考訳): 構造付き付加分布回帰のスケーラブル推定
- Authors: Nikolaus Umlauf, Johannes Seiler, Mattias Wetscher, Thorsten Simon,
Stefan Lang, Nadja Klein
- Abstract要約: 本稿では,勾配降下の考え方に基づいて,従来のノートパソコン上の任意の量のデータを扱うことができる新しいバックフィッティングアルゴリズムを提案する。
大規模なシミュレーション研究と、オーストリアにおける雷数予測の非常に困難でユニークな例を用いて、性能を評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, fitting probabilistic models have gained importance in many areas
but estimation of such distributional models with very large data sets is a
difficult task. In particular, the use of rather complex models can easily lead
to memory-related efficiency problems that can make estimation infeasible even
on high-performance computers. We therefore propose a novel backfitting
algorithm, which is based on the ideas of stochastic gradient descent and can
deal virtually with any amount of data on a conventional laptop. The algorithm
performs automatic selection of variables and smoothing parameters, and its
performance is in most cases superior or at least equivalent to other
implementations for structured additive distributional regression, e.g.,
gradient boosting, while maintaining low computation time. Performance is
evaluated using an extensive simulation study and an exceptionally challenging
and unique example of lightning count prediction over Austria. A very large
dataset with over 9 million observations and 80 covariates is used, so that a
prediction model cannot be estimated with standard distributional regression
methods but with our new approach.
- Abstract(参考訳): 近年,確率モデルの適合性が重要視されているが,大規模データセットを用いた分布モデルの推定は難しい課題である。
特に、かなり複雑なモデルを使用することで、メモリ関連の効率上の問題が生じやすくなり、高性能なコンピュータでも推定が不可能になる。
そこで我々は,確率勾配勾配に基づく新しいバックフィッティングアルゴリズムを提案し,従来のノートパソコン上の任意の量のデータを扱うことができる。
このアルゴリズムは変数の自動選択やパラメータの平滑化を行うが、ほとんどの場合、その性能は計算時間を低く保ちながら、例えば勾配向上などの構造的加法分布回帰の他の実装よりも優れているか、少なくとも同等である。
性能は、広範囲なシミュレーション研究と、オーストリアにおける雷数予測の非常に困難で独特な例を用いて評価される。
900万以上の観測と80の共変量を持つ非常に大きなデータセットを用いて、予測モデルを標準分布回帰法ではなく、我々の新しいアプローチで推定する。
関連論文リスト
- Uncertainty estimation in satellite precipitation spatial prediction by combining distributional regression algorithms [3.8623569699070353]
データマージによって降水データセットを作成するエンジニアリングタスクに対して,分散回帰の概念を導入する。
本研究では,空間予測だけでなく,一般の予測問題にも有用な新しいアンサンブル学習手法を提案する。
論文 参考訳(メタデータ) (2024-06-29T05:58:00Z) - A Provably Accurate Randomized Sampling Algorithm for Logistic Regression [2.7930955543692817]
本稿では,ロジスティック回帰問題に対する単純なランダム化サンプリングに基づくアルゴリズムを提案する。
正確な近似は、観測総数よりもはるかに小さい試料で達成できることを示す。
概して、ロジスティック回帰における推定確率を効率的に近似するためにランダム化サンプリング手法を用いる可能性に光を当てている。
論文 参考訳(メタデータ) (2024-02-26T06:20:28Z) - Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood
Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。
理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。
シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文 参考訳(メタデータ) (2023-06-05T21:08:34Z) - Bayesian score calibration for approximate models [0.0]
そこで本研究では, バイアスを低減し, より正確な不確実性定量化を実現するために, 近似後部サンプルを調整するための新しい手法を提案する。
我々のアプローチでは、(固定された)少数の複雑なモデルシミュレーションしか必要とせず、数値的に安定である。
論文 参考訳(メタデータ) (2022-11-10T06:00:58Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z) - Robust Gaussian Process Regression with a Bias Model [0.6850683267295248]
既存のほとんどのアプローチは、重い尾の分布から誘導される非ガウス的確率に、外れやすいガウス的確率を置き換えるものである。
提案手法は、未知の回帰関数の雑音および偏りの観測として、外れ値をモデル化する。
バイアス推定に基づいて、ロバストなGP回帰を標準のGP回帰問題に還元することができる。
論文 参考訳(メタデータ) (2020-01-14T06:21:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。