論文の概要: Gaussian Processes for Missing Value Imputation
- arxiv url: http://arxiv.org/abs/2204.04648v1
- Date: Sun, 10 Apr 2022 10:46:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 15:59:10.842392
- Title: Gaussian Processes for Missing Value Imputation
- Title(参考訳): 価値計算の欠如に対するガウス過程
- Authors: Bahram Jafrasteh, Daniel Hern\'andez-Lobato, Sim\'on Pedro
Lubi\'an-L\'opez, Isabel Benavente-Fern\'andez
- Abstract要約: 各次元における欠落値を他の次元のすべての変数を用いて予測するために用いられるスパースGPの階層的構成を示す。
GPを欠くアプローチ(MGP)は同時に訓練され、観測された全ての値が失われることを意味する。
MGPを1つのプライベート臨床データセットと4つのUCIデータセットで評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing values are common in many real-life datasets. However, most of the
current machine learning methods can not handle missing values. This means that
they should be imputed beforehand. Gaussian Processes (GPs) are non-parametric
models with accurate uncertainty estimates that combined with sparse
approximations and stochastic variational inference scale to large data sets.
Sparse GPs can be used to compute a predictive distribution for missing data.
Here, we present a hierarchical composition of sparse GPs that is used to
predict missing values at each dimension using all the variables from the other
dimensions. We call the approach missing GP (MGP). MGP can be trained
simultaneously to impute all observed missing values. Specifically, it outputs
a predictive distribution for each missing value that is then used in the
imputation of other missing values. We evaluate MGP in one private clinical
data set and four UCI datasets with a different percentage of missing values.
We compare the performance of MGP with other state-of-the-art methods for
imputing missing values, including variants based on sparse GPs and deep GPs.
The results obtained show a significantly better performance of MGP.
- Abstract(参考訳): 多くの実生活データセットでは欠落値が一般的である。
しかし、現在の機械学習手法のほとんどは、欠落した値を処理できない。
これは、事前に説明すべきであることを意味する。
ガウス過程(英: Gaussian Processs、GP)は、厳密な不確実性推定とスパース近似と確率的変分推論スケールを組み合わせた非パラメトリックモデルである。
スパースGPは、欠落したデータの予測分布を計算するのに使うことができる。
本稿では,各次元の欠落値を予測するために,他の次元の変数すべてを用いて,スパースgpsの階層的構成を示す。
我々はこの手法を欠落GP (MGP) と呼ぶ。
MGPは同時に訓練され、観測された全ての欠落した値をインプットすることができる。
具体的には、他の欠落した値の計算に使用される各欠落値の予測分布を出力する。
MGPを1つのプライベート臨床データセットと4つのUCIデータセットで評価した。
我々は,MGPの性能を,スパースGPとディープGPに基づく変種を含む,他の最先端手法と比較した。
その結果, MGPの性能は有意に向上した。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Leveraging Locality and Robustness to Achieve Massively Scalable
Gaussian Process Regression [1.3518297878940662]
GPN(Nest-Nighbour)予測の強靭性特性と制限挙動を探索することによって,新しい視点を導入する。
データサイズnが大きくなるにつれて、推定パラメータとGPモデル仮定の精度は、GPnn予測精度とますます無関係になる。
この不正確さの源泉を補正することができ、高い計算コストで精度の高い不確実性対策と正確な予測を両立できることを示す。
論文 参考訳(メタデータ) (2023-06-26T14:32:46Z) - Scaling Gaussian Process Optimization by Evaluating a Few Unique
Candidates Multiple Times [119.41129787351092]
GPに基づく逐次ブラックボックス最適化は,複数の評価ステップの候補解に固執することで効率よく行うことができることを示す。
GP-UCB と GP-EI の2つのよく確立されたGP-Opt アルゴリズムを改良し,バッチ化された GP-Opt の規則を適応させる。
論文 参考訳(メタデータ) (2022-01-30T20:42:14Z) - Non-Gaussian Gaussian Processes for Few-Shot Regression [71.33730039795921]
乱変数ベクトルの各成分上で動作し,パラメータを全て共有する可逆なODEベースのマッピングを提案する。
NGGPは、様々なベンチマークとアプリケーションに対する競合する最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-10-26T10:45:25Z) - Incremental Ensemble Gaussian Processes [53.3291389385672]
本稿では,EGPメタラーナーがGP学習者のインクリメンタルアンサンブル(IE-) GPフレームワークを提案し,それぞれが所定のカーネル辞書に属するユニークなカーネルを持つ。
各GP専門家は、ランダムな特徴ベースの近似を利用してオンライン予測とモデル更新を行い、そのスケーラビリティを生かし、EGPメタラーナーはデータ適応重みを生かし、熟練者ごとの予測を合成する。
新たなIE-GPは、EGPメタラーナーおよび各GP学習者内における構造化力学をモデル化することにより、時間変化関数に対応するように一般化される。
論文 参考訳(メタデータ) (2021-10-13T15:11:25Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - MuyGPs: Scalable Gaussian Process Hyperparameter Estimation Using Local
Cross-Validation [1.2233362977312945]
本稿では,新しいGPハイパーパラメータ推定法であるMuyGPを提案する。
MuyGPsは、データの最も近い隣人構造を利用する事前のメソッドの上に構築される。
提案手法は, 解法と予測値の平均二乗誤差の両方において, 既知の競合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-29T18:10:21Z) - A Hamiltonian Monte Carlo Model for Imputation and Augmentation of
Healthcare Data [0.6719751155411076]
変数や質問のデータが収集されないか利用できないため、ほとんどすべての臨床研究に不足する値が存在します。
既存のモデルは通常、プライバシの懸念を考慮せず、複数の機能にまたがる固有の相関を利用していない。
本研究では, 欠落値のインプットと高次元医療データへの付加的サンプル生成に対するベイズ的アプローチを提案する。
論文 参考訳(メタデータ) (2021-03-03T11:57:42Z) - Sparse Gaussian Process Variational Autoencoders [24.86751422740643]
既存のGP-DGMにおける推論のアプローチは、点に基づくスパースGP近似をサポートしない。
我々は,スパースGP近似のパラメータ化に部分的推論ネットワークを用いることで特徴付けられるスパースガウス過程変動オートエンコーダ(GP-VAE)を開発した。
論文 参考訳(メタデータ) (2020-10-20T10:19:56Z) - MOGPTK: The Multi-Output Gaussian Process Toolkit [71.08576457371433]
ガウス過程(GP)を用いたマルチチャネルデータモデリングのためのPythonパッケージMOGPTKを提案する。
このツールキットの目的は、研究者、データサイエンティスト、実践者にもMOGP(multi-output GP)モデルを利用できるようにすることである。
論文 参考訳(メタデータ) (2020-02-09T23:34:49Z) - On the consistency of supervised learning with missing values [15.666860186278782]
多くのアプリケーション設定において、データは分析を難しくするエントリを欠いている。
ここでは、教師あり学習の設定について考察する。トレーニングデータとテストデータの両方に、欠落した値が現れるときにターゲットを予測する。
本研究では,学習前の平均値など,一定値が得られない場合に一定であることを示す。
論文 参考訳(メタデータ) (2019-02-19T07:27:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。