論文の概要: Provable More Data Hurt in High Dimensional Least Squares Estimator
- arxiv url: http://arxiv.org/abs/2008.06296v1
- Date: Fri, 14 Aug 2020 11:33:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 17:12:17.498052
- Title: Provable More Data Hurt in High Dimensional Least Squares Estimator
- Title(参考訳): 高次元最小二乗推定器におけるさらなるデータ処理
- Authors: Zeng Li, Chuanlong Xie, Qinwen Wang
- Abstract要約: サンプルサイズと特徴数の両方が無限大となる場合の予測リスクに対する中心極限定理を導出する。
理論的には, 予測リスクの標本的非単調性を実証し, 「より多くのデータ障害」 現象を確認した。
- 参考スコア(独自算出の注目度): 7.274325784456262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the finite-sample prediction risk of the
high-dimensional least squares estimator. We derive the central limit theorem
for the prediction risk when both the sample size and the number of features
tend to infinity. Furthermore, the finite-sample distribution and the
confidence interval of the prediction risk are provided. Our theoretical
results demonstrate the sample-wise nonmonotonicity of the prediction risk and
confirm "more data hurt" phenomenon.
- Abstract(参考訳): 本稿では,高次元最小二乗推定器の有限サンプル予測リスクについて検討する。
標本サイズと特徴数の両方が無限になる傾向がある場合の予測リスクに対する中央極限定理を導出する。
さらに、予測リスクの有限サンプル分布と信頼区間が提供される。
その結果, 予測リスクの非単調性が実証され, 「より多くのデータ損傷」 現象が確認された。
関連論文リスト
- Confidence Aware Learning for Reliable Face Anti-spoofing [52.23271636362843]
本稿では,その能力境界を意識した信頼認識顔アンチスプーフィングモデルを提案する。
各サンプルの予測中にその信頼性を推定する。
実験の結果,提案したCA-FASは予測精度の低いサンプルを効果的に認識できることがわかった。
論文 参考訳(メタデータ) (2024-11-02T14:29:02Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Error Bounds of Supervised Classification from Information-Theoretic Perspective [0.0]
我々は、情報理論の観点から、教師付き分類にディープニューラルネットワークを使用する場合の予測リスクのバウンダリについて検討する。
経験的リスクをさらに分解したモデルリスクとフィッティングエラーを導入する。
論文 参考訳(メタデータ) (2024-06-07T01:07:35Z) - Conformalized Multimodal Uncertainty Regression and Reasoning [0.9205582989348333]
本稿では,マルチモーダル(不連続)不確実性境界を予測できる軽量不確実性推定器を提案する。
本稿では,空飛ぶ領域対称性などの環境特性が多モード不確実性をもたらす視覚計測(VO)への応用について論じる。
論文 参考訳(メタデータ) (2023-09-20T02:40:59Z) - On the Expected Size of Conformal Prediction Sets [24.161372736642157]
分割共形予測フレームワークを用いて,予測セットの予測サイズを理論的に定量化する。
この正確な定式化は通常直接計算できないので、点推定と高確率境界間隔を導出する。
回帰と分類の両問題に対する実世界のデータセットを用いた実験により,結果の有効性を裏付ける。
論文 参考訳(メタデータ) (2023-06-12T17:22:57Z) - Uncertainty estimation of pedestrian future trajectory using Bayesian
approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。
著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。
将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文 参考訳(メタデータ) (2022-05-04T04:23:38Z) - Data Augmentation in the Underparameterized and Overparameterized
Regimes [7.326504492614808]
我々は,データの増大が推定値の分散と限定分布に与える影響を定量化する。
その結果、機械学習の実践において行われたいくつかの観察が確認できたが、予期せぬ発見につながった。
論文 参考訳(メタデータ) (2022-02-18T11:32:41Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - The Hidden Uncertainty in a Neural Networks Activations [105.4223982696279]
ニューラルネットワークの潜在表現の分布は、アウト・オブ・ディストリビューション(OOD)データの検出に成功している。
本研究は、この分布が、モデルの不確実性と相関しているかどうかを考察し、新しい入力に一般化する能力を示す。
論文 参考訳(メタデータ) (2020-12-05T17:30:35Z) - Distributionally Robust Parametric Maximum Likelihood Estimation [13.09499764232737]
パラメトリックな名目分布に対して,最悪の場合のログロスを均一に最小化する,分布的に頑健な最大確率推定器を提案する。
我々の新しい頑健な推定器は、統計的整合性も享受し、回帰と分類の両方に有望な実験結果を提供する。
論文 参考訳(メタデータ) (2020-10-11T19:05:49Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。