論文の概要: Sharing pattern submodels for prediction with missing values
- arxiv url: http://arxiv.org/abs/2206.11161v1
- Date: Wed, 22 Jun 2022 15:09:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 14:56:04.187035
- Title: Sharing pattern submodels for prediction with missing values
- Title(参考訳): 欠落値を用いた予測のためのパターンサブモデル共有
- Authors: Lena Stempfle and Fredrik Johansson
- Abstract要約: 欠落する値は、機械学習の多くのアプリケーションでは避けられない。
テスト時に欠落した値に対して頑健な予測を行うパターンサブモデルを共有することを提案する。
不足そのものが予測可能である場合でも、共有が確実に最適である場合を特定する。
- 参考スコア(独自算出の注目度): 2.28438857884398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing values are unavoidable in many applications of machine learning and
present a challenge both during training and at test time. When variables are
missing in recurring patterns, fitting separate pattern submodels have been
proposed as a solution. However, independent models do not make efficient use
of all available data. Conversely, fitting a shared model to the full data set
typically relies on imputation which may be suboptimal when missingness depends
on unobserved factors. We propose an alternative approach, called sharing
pattern submodels, which make predictions that are a) robust to missing values
at test time, b) maintains or improves the predictive power of pattern
submodels, and c) has a short description enabling improved interpretability.
We identify cases where sharing is provably optimal, even when missingness
itself is predictive and when the prediction target depends on unobserved
variables. Classification and regression experiments on synthetic data and two
healthcare data sets demonstrate that our models achieve a favorable trade-off
between pattern specialization and information sharing.
- Abstract(参考訳): 機械学習の多くのアプリケーションでは、欠落する値は避けられず、トレーニング中もテスト時にも課題を提示します。
繰り返しパターンに変数が欠けている場合、別のパターンサブモデルがソリューションとして提案されている。
しかし、独立したモデルは利用可能なデータをすべて効率的に利用するわけではない。
逆に、共有モデルを完全なデータセットに適合させるには、通常、欠如が観測されていない要因に依存する場合に最適でないインプテーションに依存する。
我々は、パターンのサブモデルを共有するという別のアプローチを提案している。
a) テスト時に欠落した値に対して堅牢である
b) パターンサブモデルの予測力を維持又は改善する
c) 解釈性を改善するための短い説明がある。
不足そのものが予測可能であり、予測対象が観測されていない変数に依存する場合であっても、共有が確実に最適である場合を特定する。
合成データと2つの医療データを用いた分類と回帰実験により,モデルがパターンの特殊化と情報共有のトレードオフを良好に達成できることを実証した。
関連論文リスト
- MINTY: Rule-based Models that Minimize the Need for Imputing Features
with Missing Values [10.591844776850857]
MINTYは、1つまたはそれ以上が欠落しているとき、相互の代替として機能する変数間の解離という形でルールを学ぶ方法である。
合成および実世界のデータセットを用いた実験において、MINTYの価値を実証し、その予測性能がベースラインに匹敵するか好適かを見出す。
論文 参考訳(メタデータ) (2023-11-23T17:09:12Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Investigating Ensemble Methods for Model Robustness Improvement of Text
Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。
適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文 参考訳(メタデータ) (2022-10-28T17:52:10Z) - On the Impact of Temporal Concept Drift on Model Explanations [31.390397997989712]
自然言語処理におけるモデル予測の表現忠実度は、トレーニングデータと同じ時間分布から保持されたデータに基づいて評価する。
8つの特徴属性法と3つの選択列予測モデルにより抽出されたモデル説明に対する時間的変動の影響について検討した。
論文 参考訳(メタデータ) (2022-10-17T15:53:09Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z) - Missing Value Knockoffs [0.0]
最近導入された model-x knockoffs というフレームワークは、幅広いモデルに対してそれを提供するが、値の欠如のあるデータセットはサポートされていない。
提案手法では, 既存のノックオフサンプリングを, 欠落した値の存在下で再利用できることを示す。
また、ノックオフを共同で計算し、サンプリングすることで、計算の複雑さを軽減できることを示す。
論文 参考訳(メタデータ) (2022-02-26T04:05:31Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - not-MIWAE: Deep Generative Modelling with Missing not at Random Data [21.977065542645082]
本稿では、欠落したプロセスが欠落したデータに依存している場合に、DLVM(Deep Latent variable Model)を構築し、適合させるアプローチを提案する。
具体的には、深層ニューラルネットワークにより、データから得られる欠損パターンの条件分布を柔軟にモデル化することができる。
欠落したプロセスを明示的にモデル化する様々なデータセットと欠落パターンが有用であることを示す。
論文 参考訳(メタデータ) (2020-06-23T10:06:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。