論文の概要: HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection
- arxiv url: http://arxiv.org/abs/2206.07769v1
- Date: Wed, 15 Jun 2022 19:10:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 14:01:35.303234
- Title: HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection
- Title(参考訳): HyperImpute: 自動モデル選択による一般化反復計算
- Authors: Daniel Jarrett, Bogdan Cebere, Tennison Liu, Alicia Curth, Mihaela van
der Schaar
- Abstract要約: カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
- 参考スコア(独自算出の注目度): 77.86861638371926
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider the problem of imputing missing values in a dataset. One the one
hand, conventional approaches using iterative imputation benefit from the
simplicity and customizability of learning conditional distributions directly,
but suffer from the practical requirement for appropriate model specification
of each and every variable. On the other hand, recent methods using deep
generative modeling benefit from the capacity and efficiency of learning with
neural network function approximators, but are often difficult to optimize and
rely on stronger data assumptions. In this work, we study an approach that
marries the advantages of both: We propose *HyperImpute*, a generalized
iterative imputation framework for adaptively and automatically configuring
column-wise models and their hyperparameters. Practically, we provide a
concrete implementation with out-of-the-box learners, optimizers, simulators,
and extensible interfaces. Empirically, we investigate this framework via
comprehensive experiments and sensitivities on a variety of public datasets,
and demonstrate its ability to generate accurate imputations relative to a
strong suite of benchmarks. Contrary to recent work, we believe our findings
constitute a strong defense of the iterative imputation paradigm.
- Abstract(参考訳): データセットに欠けている値を暗示する問題を考える。
一方、反復的インプテーションを用いた従来のアプローチは、直接学習条件分布の単純さとカスタマイズ性から恩恵を受けるが、各変数と各変数の適切なモデル仕様の実用的な要求に苦しむ。
一方, ニューラルネットワーク関数近似器を用いた学習の能力と効率から, 深層生成モデルを用いた最近の手法は有用であるが, より強力なデータ仮定を最適化し, 頼りにすることが困難であることが多い。
本研究では,カラムワイズモデルとそのハイパーパラメータを適応的かつ自動的に構成する一般化反復型計算フレームワークである*HyperImpute*を提案する。
実際に我々は,アウトオブボックス学習者,オプティマイザ,シミュレータ,拡張可能なインターフェースを備えた具体的な実装を提供する。
実験的に、このフレームワークを、様々な公開データセットに関する総合的な実験と感性を通して検討し、強力なベンチマークに対して正確な計算結果を生成する能力を示す。
最近の研究とは対照的に、我々はこの発見が反復的インプテーションパラダイムを強く擁護していると信じている。
関連論文リスト
- Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.2669490431145]
PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文 参考訳(メタデータ) (2024-05-28T11:30:19Z) - Fairer and More Accurate Tabular Models Through NAS [14.147928131445852]
本稿では,多目的ニューラルアーキテクチャサーチ (NAS) とハイパーパラメータ最適化 (HPO) を,表データの非常に困難な領域への最初の応用として提案する。
我々はNASで精度のみに最適化されたモデルが、本質的に公正な懸念に対処できないことをしばしば示している。
公平性、正確性、あるいは両方において、最先端のバイアス緩和手法を一貫して支配するアーキテクチャを作成します。
論文 参考訳(メタデータ) (2023-10-18T17:56:24Z) - Efficient Learning of Accurate Surrogates for Simulations of Complex Systems [0.0]
サンプリング駆動サンプリングによって強化されたオンライン学習手法を提案する。
モデル応答面上のすべての旋回点がトレーニングデータに含まれることを保証する。
本手法を核物質のシミュレーションに適用し,高精度なサロゲートを確実に自動生成できることを実証する。
論文 参考訳(メタデータ) (2022-07-11T20:51:11Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Model-agnostic and Scalable Counterfactual Explanations via
Reinforcement Learning [0.5729426778193398]
本稿では,最適化手順をエンドツーエンドの学習プロセスに変換する深層強化学習手法を提案する。
実世界のデータを用いた実験により,本手法はモデルに依存しず,モデル予測からのフィードバックのみに依存することがわかった。
論文 参考訳(メタデータ) (2021-06-04T16:54:36Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z) - Nonparametric Estimation in the Dynamic Bradley-Terry Model [69.70604365861121]
カーネルのスムース化に依存する新しい推定器を開発し、時間とともにペア比較を前処理する。
モデルに依存しない設定における推定誤差と余剰リスクの両方について時間変化のオラクル境界を導出する。
論文 参考訳(メタデータ) (2020-02-28T21:52:49Z) - Monotonic Cardinality Estimation of Similarity Selection: A Deep
Learning Approach [22.958342743597044]
類似度選択の基数推定にディープラーニングを活用する可能性について検討する。
本稿では,任意のデータ型や距離関数に適用可能な,新規で汎用的な手法を提案する。
論文 参考訳(メタデータ) (2020-02-15T20:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。