論文の概要: Provable More Data Hurt in High Dimensional Least Squares Estimator
- arxiv url: http://arxiv.org/abs/2008.06296v1
- Date: Fri, 14 Aug 2020 11:33:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:12:17.498052
- Title: Provable More Data Hurt in High Dimensional Least Squares Estimator
- Title(参考訳): 高次元最小二乗推定器におけるさらなるデータ処理
- Authors: Zeng Li, Chuanlong Xie, Qinwen Wang
- Abstract要約: サンプルサイズと特徴数の両方が無限大となる場合の予測リスクに対する中心極限定理を導出する。
理論的には, 予測リスクの標本的非単調性を実証し, 「より多くのデータ障害」 現象を確認した。
- 参考スコア(独自算出の注目度): 7.274325784456262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the finite-sample prediction risk of the
high-dimensional least squares estimator. We derive the central limit theorem
for the prediction risk when both the sample size and the number of features
tend to infinity. Furthermore, the finite-sample distribution and the
confidence interval of the prediction risk are provided. Our theoretical
results demonstrate the sample-wise nonmonotonicity of the prediction risk and
confirm "more data hurt" phenomenon.
- Abstract(参考訳): 本稿では,高次元最小二乗推定器の有限サンプル予測リスクについて検討する。
標本サイズと特徴数の両方が無限になる傾向がある場合の予測リスクに対する中央極限定理を導出する。
さらに、予測リスクの有限サンプル分布と信頼区間が提供される。
その結果, 予測リスクの非単調性が実証され, 「より多くのデータ損傷」 現象が確認された。
関連論文リスト
- Modeling and Predicting Epidemic Spread: A Gaussian Process Regression
Approach [0.805635934199494]
本稿では,流行のモデル化と予測のためのガウス過程回帰に基づく新しい手法を提案する。
本研究では、流行データの影響を定量化する予測のばらつきに縛られた新しい手法を開発する。
流行の広がり、感染データ、予測地平線の長さが、この誤差にどのように影響するかを定量化する。
論文 参考訳(メタデータ) (2023-12-14T22:45:01Z) - Conformalized Multimodal Uncertainty Regression and Reasoning [0.9205582989348333]
本稿では,マルチモーダル(不連続)不確実性境界を予測できる軽量不確実性推定器を提案する。
本稿では,空飛ぶ領域対称性などの環境特性が多モード不確実性をもたらす視覚計測(VO)への応用について論じる。
論文 参考訳(メタデータ) (2023-09-20T02:40:59Z) - On the Expected Size of Conformal Prediction Sets [24.161372736642157]
分割共形予測フレームワークを用いて,予測セットの予測サイズを理論的に定量化する。
この正確な定式化は通常直接計算できないので、点推定と高確率境界間隔を導出する。
回帰と分類の両問題に対する実世界のデータセットを用いた実験により,結果の有効性を裏付ける。
論文 参考訳(メタデータ) (2023-06-12T17:22:57Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Uncertainty estimation of pedestrian future trajectory using Bayesian
approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。
著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。
将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文 参考訳(メタデータ) (2022-05-04T04:23:38Z) - Data Augmentation in the Underparameterized and Overparameterized
Regimes [7.326504492614808]
我々は,データの増大が推定値の分散と限定分布に与える影響を定量化する。
その結果、機械学習の実践において行われたいくつかの観察が確認できたが、予期せぬ発見につながった。
論文 参考訳(メタデータ) (2022-02-18T11:32:41Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - The Hidden Uncertainty in a Neural Networks Activations [105.4223982696279]
ニューラルネットワークの潜在表現の分布は、アウト・オブ・ディストリビューション(OOD)データの検出に成功している。
本研究は、この分布が、モデルの不確実性と相関しているかどうかを考察し、新しい入力に一般化する能力を示す。
論文 参考訳(メタデータ) (2020-12-05T17:30:35Z) - PAC$^m$-Bayes: Narrowing the Empirical Risk Gap in the Misspecified
Bayesian Regime [75.19403612525811]
この研究は、2つのリスク間のトレードオフを分散することでギャップを埋めることのできるマルチサンプル損失を開発する。
実証的研究は予測分布の改善を示す。
論文 参考訳(メタデータ) (2020-10-19T16:08:34Z) - Distributionally Robust Parametric Maximum Likelihood Estimation [13.09499764232737]
パラメトリックな名目分布に対して,最悪の場合のログロスを均一に最小化する,分布的に頑健な最大確率推定器を提案する。
我々の新しい頑健な推定器は、統計的整合性も享受し、回帰と分類の両方に有望な実験結果を提供する。
論文 参考訳(メタデータ) (2020-10-11T19:05:49Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。