論文の概要: Linear predictor on linearly-generated data with missing values: non
consistency and solutions
- arxiv url: http://arxiv.org/abs/2002.00658v2
- Date: Tue, 12 May 2020 16:48:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 08:03:44.241750
- Title: Linear predictor on linearly-generated data with missing values: non
consistency and solutions
- Title(参考訳): 欠損値を持つ線形生成データ上の線形予測子:非一貫性と解
- Authors: Marine Le Morvan (PARIETAL, IJCLab), Nicolas Prost (CMAP, XPOP), Julie
Josse (CMAP, XPOP), Erwan Scornet (CMAP), Ga\"el Varoquaux (PARIETAL, MILA)
- Abstract要約: 本研究では,予測対象が全観測データの線形関数である場合について検討する。
不足する値が存在する場合、最適予測器は線形でない可能性があることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider building predictors when the data have missing values. We study
the seemingly-simple case where the target to predict is a linear function of
the fully-observed data and we show that, in the presence of missing values,
the optimal predictor may not be linear. In the particular Gaussian case, it
can be written as a linear function of multiway interactions between the
observed data and the various missing-value indicators. Due to its intrinsic
complexity, we study a simple approximation and prove generalization bounds
with finite samples, highlighting regimes for which each method performs best.
We then show that multilayer perceptrons with ReLU activation functions can be
consistent, and can explore good trade-offs between the true model and
approximations. Our study highlights the interesting family of models that are
beneficial to fit with missing values depending on the amount of data
available.
- Abstract(参考訳): データに値がない場合に予測器を構築することを検討する。
予測対象が全観測データの線形関数であるような単純な場合について検討し, 欠落した値が存在する場合, 最適予測器は線形でない可能性があることを示す。
特定のガウスの場合には、観測されたデータと様々な欠落値指標の間のマルチウェイ相互作用の線形関数として記述することができる。
その本質的複雑性から,簡単な近似法と有限サンプルによる一般化境界の証明を行い,各手法が最善を尽くすレジームを強調する。
次に、ReLU活性化関数を持つ多層パーセプトロンの一貫性を示し、真のモデルと近似との良好なトレードオフを探索する。
我々の研究では、利用可能なデータの量によって、欠落した値に適合できる興味深いモデルのファミリーを強調します。
関連論文リスト
- Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Kernel-based off-policy estimation without overlap: Instance optimality
beyond semiparametric efficiency [53.90687548731265]
本研究では,観測データに基づいて線形関数を推定するための最適手順について検討する。
任意の凸および対称函数クラス $mathcalF$ に対して、平均二乗誤差で有界な非漸近局所ミニマックスを導出する。
論文 参考訳(メタデータ) (2023-01-16T02:57:37Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Functional Nonlinear Learning [0.0]
低次元特徴空間における多変量関数データを表現する機能非線形学習法(FunNoL)を提案する。
本研究では,FunNoLがデータ間隔によらず,良好な曲線分類と再構成を提供することを示す。
論文 参考訳(メタデータ) (2022-06-22T23:47:45Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Harmless interpolation in regression and classification with structured
features [21.064512161584872]
過度にパラメータ化されたニューラルネットワークは、ノイズの多いトレーニングデータに完全に適合するが、テストデータではうまく一般化する。
再生カーネルヒルベルト空間における上界回帰と分類リスクの一般かつ柔軟な枠組みを提案する。
論文 参考訳(メタデータ) (2021-11-09T15:12:26Z) - On Optimal Interpolation In Linear Regression [22.310861786709538]
線形回帰において補間する最適な方法は、応答変数において線形となる関数を使用することである。
我々は,最小ノルム補間器が最適応答-線形到達可能な補間器よりも任意に悪い一般化を行う機構を同定する。
我々は、線形データ生成モデルの下で、最適応答リニアの概念をランダムな特徴回帰に拡張する。
論文 参考訳(メタデータ) (2021-10-21T16:37:10Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - NeuMiss networks: differentiable programming for supervised learning
with missing values [0.0]
線形性仮定の下で最適予測器の解析形式を導出する。
我々はNeuMissネットワークという新しい原則アーキテクチャを提案する。
パラメータの数と、欠落したデータパターンの数に依存しない計算複雑性の両方で、予測精度が良い。
論文 参考訳(メタデータ) (2020-07-03T11:42:25Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。