論文の概要: On Regression in Extreme Regions
- arxiv url: http://arxiv.org/abs/2303.03084v1
- Date: Mon, 6 Mar 2023 12:55:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 16:15:18.610145
- Title: On Regression in Extreme Regions
- Title(参考訳): 極端領域の回帰について
- Authors: Nathan Huet, Stephan Cl\'emen\c{c}on, Anne Sabourin
- Abstract要約: 極端(すなわち非常に大きな)観測の場合、特別な注意が払われる。
希少性のため、それらは(経験的な)誤りに対して無視できる方法で寄与する。
与えられた$Y$の条件分布は、重み付き確率分布の非パラメトリック類に属すると仮定される。
- 参考スコア(独自算出の注目度): 1.6734018640023431
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the classic regression problem, the value of a real-valued random variable
$Y$ is to be predicted based on the observation of a random vector $X$, taking
its values in $\mathbb{R}^d$ with $d\geq 1$ say. The statistical learning
problem consists in building a predictive function $\hat{f}:\mathbb{R}^d\to
\mathbb{R}$ based on independent copies of the pair $(X,Y)$ so that $Y$ is
approximated by $\hat{f}(X)$ with minimum error in the mean-squared sense.
Motivated by various applications, ranging from environmental sciences to
finance or insurance, special attention is paid here to the case of extreme
(i.e. very large) observations $X$. Because of their rarity, they contribute in
a negligible manner to the (empirical) error and the predictive performance of
empirical quadratic risk minimizers can be consequently very poor in extreme
regions. In this paper, we develop a general framework for regression in the
extremes. It is assumed that $X$'s conditional distribution given $Y$ belongs
to a non parametric class of heavy-tailed probability distributions. It is then
shown that an asymptotic notion of risk can be tailored to summarize
appropriately predictive performance in extreme regions of the input space. It
is also proved that minimization of an empirical and non asymptotic version of
this 'extreme risk', based on a fraction of the largest observations solely,
yields regression functions with good generalization capacity. In addition,
numerical results providing strong empirical evidence of the relevance of the
approach proposed are displayed.
- Abstract(参考訳): 古典的な回帰問題では、実数値確率変数 $y$ の値は、確率ベクトル $x$ の観測に基づいて予測され、その値は $d\geq 1$ say で$\mathbb{r}^d$ となる。
統計学習問題は、ペア $(x,y)$ の独立コピーに基づく予測関数 $\hat{f}:\mathbb{r}^d\to \mathbb{r}$ を構築することにより、y$ は平均二乗意味で最小誤差で$\hat{f}(x)$ に近似される。
環境科学から金融や保険まで、様々な応用によって動機づけられ、ここでは極端な(すなわち非常に大きな)観察結果に対して特別な注意が払われる。
その希少性のため、(経験的)エラーに対して無視可能な方法で寄与し、経験的二次リスク最小化器の予測性能は、極端な地域では非常に貧弱である。
本稿では,極域における回帰の一般的な枠組みを開発する。
y$ が与えられる x$ の条件分布は、重み付き確率分布の非パラメトリッククラスに属すると仮定される。
次に,入力空間の極端領域における予測性能を適切に要約するために,リスクの漸近的概念を調整可能であることを示す。
また、この「極度リスク」の経験的かつ非漸近的なバージョンの最小化は、最も大きな観測のごく一部に基づいて、優れた一般化能力を持つ回帰関数を生成することも証明されている。
また、提案手法の妥当性に関する強い実証的証拠を提供する数値結果を表示する。
関連論文リスト
- $L^1$ Estimation: On the Optimality of Linear Estimators [70.75102576909295]
この研究は、条件中央値の線型性を誘導する$X$上の唯一の先行分布がガウス分布であることを示している。
特に、条件分布 $P_X|Y=y$ がすべての$y$に対して対称であるなら、$X$ はガウス分布に従う必要がある。
論文 参考訳(メタデータ) (2023-09-17T01:45:13Z) - Statistical Learning under Heterogeneous Distribution Shift [71.8393170225794]
ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
論文 参考訳(メタデータ) (2023-02-27T16:34:21Z) - Estimating Optimal Policy Value in General Linear Contextual Bandits [50.008542459050155]
多くのバンドイット問題において、政策によって達成可能な最大報酬は、前もって不明であることが多い。
我々は,最適政策が学習される前に,サブ線形データ構造における最適政策値を推定する問題を考察する。
V*$で問題依存上界を推定する,より実用的で効率的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-19T01:09:24Z) - $p$-Generalized Probit Regression and Scalable Maximum Likelihood
Estimation via Sketching and Coresets [74.37849422071206]
本稿では, 2次応答に対する一般化線形モデルである,$p$一般化プロビット回帰モデルについて検討する。
p$の一般化されたプロビット回帰に対する最大可能性推定器は、大容量データ上で$(1+varepsilon)$の係数まで効率的に近似できることを示す。
論文 参考訳(メタデータ) (2022-03-25T10:54:41Z) - A Statistical Learning View of Simple Kriging [0.0]
統計的学習の観点から,簡単なKrigingタスクを解析する。
目標は、最小2次リスクで他の場所にある未知の値を予測することである。
我々は、真の最小化を模倣するプラグイン予測則の過剰なリスクに対して、$O_mathbbP (1/sqrtn)$の非漸近境界を証明した。
論文 参考訳(メタデータ) (2022-02-15T12:46:43Z) - Non-Asymptotic Guarantees for Robust Statistical Learning under
$(1+\varepsilon)$-th Moment Assumption [0.716879432974126]
本稿では,統計レグレッションの多種族を対象としたログトランケート型M-メチエータを提案する。
標準推定よりもログトランケート推定の方が優れていることを示す。
論文 参考訳(メタデータ) (2022-01-10T06:22:30Z) - Consistent Estimation for PCA and Sparse Regression with Oblivious
Outliers [13.244654316770815]
我々は効率よく計算可能で一貫した推定器を設計する機械を開発する。
スパース回帰では、最適なサンプルサイズ$ngsim (klog d)/alpha2$の整合性を達成する。
PCAの文脈では、パラメータ行列上の広いスパイキネス仮定の下で最適な誤差を保証する。
論文 参考訳(メタデータ) (2021-11-04T15:59:44Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Sharp Statistical Guarantees for Adversarially Robust Gaussian
Classification [54.22421582955454]
逆向きに頑健な分類の過剰リスクに対する最適ミニマックス保証の最初の結果を提供する。
結果はAdvSNR(Adversarial Signal-to-Noise Ratio)の項で述べられており、これは標準的な線形分類と逆数設定との類似の考え方を一般化している。
論文 参考訳(メタデータ) (2020-06-29T21:06:52Z) - Weighted Empirical Risk Minimization: Sample Selection Bias Correction
based on Importance Sampling [2.599882743586164]
トレーニング観測値の分布$P'$が、最小化を目指すリスクに関わる分布$Z'_i$と異なる場合、統計的学習問題を考察する。
実際に頻繁に遭遇する様々な状況において、単純な形式を採り、$Phi(z)$から直接推定できることが示される。
次に、上記のアプローチのキャパシティ一般化が、その結果の$Phi(Z'_i)$'sを重み付き経験的リスクにプラグインするときに保持されることを示す。
論文 参考訳(メタデータ) (2020-02-12T18:42:47Z) - Interpolating Predictors in High-Dimensional Factor Regression [2.1055643409860743]
この研究は、高次元回帰モデルにおける最小ノルム補間予測子のリスクの有限サンプル特性を研究する。
主成分回帰と隆起回帰に基づいて予測器に類似したリスクを負うことができ、高次元状態においてLASSOに基づく予測器よりも改善できることを示す。
論文 参考訳(メタデータ) (2020-02-06T22:08:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。