Fugu-MT 論文翻訳(概要): Provable More Data Hurt in High Dimensional Least Squares Estimator

論文の概要: Provable More Data Hurt in High Dimensional Least Squares Estimator

arxiv url: http://arxiv.org/abs/2008.06296v1
Date: Fri, 14 Aug 2020 11:33:30 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-30 17:12:17.498052
Title: Provable More Data Hurt in High Dimensional Least Squares Estimator
Title（参考訳）: 高次元最小二乗推定器におけるさらなるデータ処理
Authors: Zeng Li, Chuanlong Xie, Qinwen Wang
Abstract要約: サンプルサイズと特徴数の両方が無限大となる場合の予測リスクに対する中心極限定理を導出する。理論的には, 予測リスクの標本的非単調性を実証し, 「より多くのデータ障害」現象を確認した。
参考スコア（独自算出の注目度）: 7.274325784456262
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper investigates the finite-sample prediction risk of the high-dimensional least squares estimator. We derive the central limit theorem for the prediction risk when both the sample size and the number of features tend to infinity. Furthermore, the finite-sample distribution and the confidence interval of the prediction risk are provided. Our theoretical results demonstrate the sample-wise nonmonotonicity of the prediction risk and confirm "more data hurt" phenomenon.
Abstract（参考訳）: 本稿では,高次元最小二乗推定器の有限サンプル予測リスクについて検討する。標本サイズと特徴数の両方が無限になる傾向がある場合の予測リスクに対する中央極限定理を導出する。さらに、予測リスクの有限サンプル分布と信頼区間が提供される。その結果, 予測リスクの非単調性が実証され, 「より多くのデータ損傷」現象が確認された。

関連論文リスト

A multi-locus predictiveness curve and its summary assessment for genetic risk prediction [5.050463389414008]
本稿では,ケースコントロール研究のためのマルチマーカー予測曲線と非パラメトリック手法を提案する。また、予測性曲線とROC曲線とローレンツ曲線との接続を実証する。我々は,ニコチン依存のリスク予測モデルを評価するために,予測性曲線と予測性Uを用いて実データ解析を行った。
論文参考訳（メタデータ） (2025-03-28T15:49:39Z)
Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。本稿では,実証的リスク最小化法(DEM)を提案する。
論文参考訳（メタデータ） (2025-02-10T10:52:17Z)
Confidence Aware Learning for Reliable Face Anti-spoofing [52.23271636362843]
本稿では,その能力境界を意識した信頼認識顔アンチスプーフィングモデルを提案する。各サンプルの予測中にその信頼性を推定する。実験の結果,提案したCA-FASは予測精度の低いサンプルを効果的に認識できることがわかった。
論文参考訳（メタデータ） (2024-11-02T14:29:02Z)
Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。我々は多種多様な高次元データにまたがって理論を検証する。
論文参考訳（メタデータ） (2024-08-08T17:27:29Z)
Error Bounds of Supervised Classification from Information-Theoretic Perspective [0.0]
我々は、情報理論の観点から、教師付き分類にディープニューラルネットワークを使用する場合の予測リスクのバウンダリについて検討する。経験的リスクをさらに分解したモデルリスクとフィッティングエラーを導入する。
論文参考訳（メタデータ） (2024-06-07T01:07:35Z)
Conformalized Multimodal Uncertainty Regression and Reasoning [0.9205582989348333]
本稿では,マルチモーダル(不連続)不確実性境界を予測できる軽量不確実性推定器を提案する。本稿では,空飛ぶ領域対称性などの環境特性が多モード不確実性をもたらす視覚計測(VO)への応用について論じる。
論文参考訳（メタデータ） (2023-09-20T02:40:59Z)
On the Expected Size of Conformal Prediction Sets [24.161372736642157]
分割共形予測フレームワークを用いて,予測セットの予測サイズを理論的に定量化する。この正確な定式化は通常直接計算できないので、点推定と高確率境界間隔を導出する。回帰と分類の両問題に対する実世界のデータセットを用いた実験により,結果の有効性を裏付ける。
論文参考訳（メタデータ） (2023-06-12T17:22:57Z)
Uncertainty estimation of pedestrian future trajectory using Bayesian approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文参考訳（メタデータ） (2022-05-04T04:23:38Z)
Data Augmentation in the Underparameterized and Overparameterized Regimes [7.326504492614808]
我々は,データの増大が推定値の分散と限定分布に与える影響を定量化する。その結果、機械学習の実践において行われたいくつかの観察が確認できたが、予期せぬ発見につながった。
論文参考訳（メタデータ） (2022-02-18T11:32:41Z)
Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文参考訳（メタデータ） (2021-10-13T01:23:48Z)
The Hidden Uncertainty in a Neural Networks Activations [105.4223982696279]
ニューラルネットワークの潜在表現の分布は、アウト・オブ・ディストリビューション(OOD)データの検出に成功している。本研究は、この分布が、モデルの不確実性と相関しているかどうかを考察し、新しい入力に一般化する能力を示す。
論文参考訳（メタデータ） (2020-12-05T17:30:35Z)
Distributionally Robust Parametric Maximum Likelihood Estimation [13.09499764232737]
パラメトリックな名目分布に対して,最悪の場合のログロスを均一に最小化する,分布的に頑健な最大確率推定器を提案する。我々の新しい頑健な推定器は、統計的整合性も享受し、回帰と分類の両方に有望な実験結果を提供する。
論文参考訳（メタデータ） (2020-10-11T19:05:49Z)
Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文参考訳（メタデータ） (2020-06-08T07:01:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。