論文の概要: Sharing pattern submodels for prediction with missing values
- arxiv url: http://arxiv.org/abs/2206.11161v3
- Date: Fri, 24 Nov 2023 13:50:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 05:06:33.497538
- Title: Sharing pattern submodels for prediction with missing values
- Title(参考訳): 欠落値を用いた予測のためのパターンサブモデル共有
- Authors: Lena Stempfle, Ashkan Panahi, Fredrik D. Johansson
- Abstract要約: 機械学習の多くのアプリケーションでは欠落値は避けられず、トレーニング中もテスト時にも課題が提示される。
パターンサブモデル(パターンサブモデル)と呼ばれる別の手法を提案する。これは、テスト時に欠落した値に対して、予測を堅牢にし、パターンサブモデルの予測力を維持または改善させる。
- 参考スコア(独自算出の注目度): 12.981974894538668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing values are unavoidable in many applications of machine learning and
present challenges both during training and at test time. When variables are
missing in recurring patterns, fitting separate pattern submodels have been
proposed as a solution. However, fitting models independently does not make
efficient use of all available data. Conversely, fitting a single shared model
to the full data set relies on imputation which often leads to biased results
when missingness depends on unobserved factors. We propose an alternative
approach, called sharing pattern submodels, which i) makes predictions that are
robust to missing values at test time, ii) maintains or improves the predictive
power of pattern submodels, and iii) has a short description, enabling improved
interpretability. Parameter sharing is enforced through sparsity-inducing
regularization which we prove leads to consistent estimation. Finally, we give
conditions for when a sharing model is optimal, even when both missingness and
the target outcome depend on unobserved variables. Classification and
regression experiments on synthetic and real-world data sets demonstrate that
our models achieve a favorable tradeoff between pattern specialization and
information sharing.
- Abstract(参考訳): 機械学習の多くのアプリケーションでは欠落値は避けられず、トレーニング中もテスト時にも課題が提示される。
繰り返しパターンに変数が欠けている場合、別のパターンサブモデルがソリューションとして提案されている。
しかし、フィッティングモデルが独立して利用できるデータをすべて効率的に利用するわけではない。
逆に、単一の共有モデルを全データセットに適合させるには、欠如が観測できない要因に依存する場合、しばしば偏りのある結果につながるインプテーションに依存する。
我々は、共有パターンサブモデルと呼ばれる別のアプローチを提案する。
一 テスト時に欠落した値に対して堅牢な予測を行うこと。
二 パターンサブモデルの予測力を維持又は改善すること。
三 説明が短く、解釈性が向上すること。
パラメータ共有はスパーシリティ誘導正規化によって実施され、一貫した推定が導かれる。
最後に、共有モデルが最適である場合、欠如と目標結果の両方が観測されていない変数に依存する場合も条件を与える。
合成および実世界のデータセットの分類と回帰実験により、我々のモデルはパターンの特殊化と情報共有の良好なトレードオフを達成することを示した。
関連論文リスト
- MINTY: Rule-based Models that Minimize the Need for Imputing Features
with Missing Values [10.591844776850857]
MINTYは、1つまたはそれ以上が欠落しているとき、相互の代替として機能する変数間の解離という形でルールを学ぶ方法である。
合成および実世界のデータセットを用いた実験において、MINTYの価値を実証し、その予測性能がベースラインに匹敵するか好適かを見出す。
論文 参考訳(メタデータ) (2023-11-23T17:09:12Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Investigating Ensemble Methods for Model Robustness Improvement of Text
Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。
適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文 参考訳(メタデータ) (2022-10-28T17:52:10Z) - On the Impact of Temporal Concept Drift on Model Explanations [31.390397997989712]
自然言語処理におけるモデル予測の表現忠実度は、トレーニングデータと同じ時間分布から保持されたデータに基づいて評価する。
8つの特徴属性法と3つの選択列予測モデルにより抽出されたモデル説明に対する時間的変動の影響について検討した。
論文 参考訳(メタデータ) (2022-10-17T15:53:09Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z) - Missing Value Knockoffs [0.0]
最近導入された model-x knockoffs というフレームワークは、幅広いモデルに対してそれを提供するが、値の欠如のあるデータセットはサポートされていない。
提案手法では, 既存のノックオフサンプリングを, 欠落した値の存在下で再利用できることを示す。
また、ノックオフを共同で計算し、サンプリングすることで、計算の複雑さを軽減できることを示す。
論文 参考訳(メタデータ) (2022-02-26T04:05:31Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - not-MIWAE: Deep Generative Modelling with Missing not at Random Data [21.977065542645082]
本稿では、欠落したプロセスが欠落したデータに依存している場合に、DLVM(Deep Latent variable Model)を構築し、適合させるアプローチを提案する。
具体的には、深層ニューラルネットワークにより、データから得られる欠損パターンの条件分布を柔軟にモデル化することができる。
欠落したプロセスを明示的にモデル化する様々なデータセットと欠落パターンが有用であることを示す。
論文 参考訳(メタデータ) (2020-06-23T10:06:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。