論文の概要: Statistical Estimation Under Distribution Shift: Wasserstein
Perturbations and Minimax Theory
- arxiv url: http://arxiv.org/abs/2308.01853v2
- Date: Tue, 10 Oct 2023 00:40:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 05:00:46.933817
- Title: Statistical Estimation Under Distribution Shift: Wasserstein
Perturbations and Minimax Theory
- Title(参考訳): 分布シフトによる統計的推定:ワッサーシュタイン摂動とミニマックス理論
- Authors: Patrick Chao, Edgar Dobriban
- Abstract要約: 我々はWasserstein分布シフトに注目し、各データポイントがわずかに摂動する可能性がある。
データポイント間の独立あるいは協調的な関節シフトである摂動について検討する。
位置推定,線形回帰,非パラメトリック密度推定など,いくつかの重要な統計問題を解析する。
- 参考スコア(独自算出の注目度): 24.540342159350015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distribution shifts are a serious concern in modern statistical learning as
they can systematically change the properties of the data away from the truth.
We focus on Wasserstein distribution shifts, where every data point may undergo
a slight perturbation, as opposed to the Huber contamination model where a
fraction of observations are outliers. We consider perturbations that are
either independent or coordinated joint shifts across data points. We analyze
several important statistical problems, including location estimation, linear
regression, and non-parametric density estimation. Under a squared loss for
mean estimation and prediction error in linear regression, we find the exact
minimax risk, a least favorable perturbation, and show that the sample mean and
least squares estimators are respectively optimal. For other problems, we
provide nearly optimal estimators and precise finite-sample bounds. We also
introduce several tools for bounding the minimax risk under general
distribution shifts, not just for Wasserstein perturbations, such as a
smoothing technique for location families, and generalizations of classical
tools including least favorable sequences of priors, the modulus of continuity,
as well as Le Cam's, Fano's, and Assouad's methods.
- Abstract(参考訳): 分散シフトは、データの性質を真実から体系的に変えられるため、現代の統計的学習において深刻な関心事である。
観測結果のごく一部が外れたハマー汚染モデルとは対照的に,各データポイントがわずかに摂動する可能性があるワッサースタイン分布シフトに注目した。
データポイント間の独立的あるいは協調的なジョイントシフトである摂動を考える。
位置推定,線形回帰,非パラメトリック密度推定など,いくつかの重要な統計問題を分析する。
線形回帰における平均推定誤差と予測誤差の2乗損失の下では、最小極小リスク、最も好ましい摂動を求め、サンプル平均と最小二乗推定器がそれぞれ最適であることを示す。
他の問題に対しては、ほぼ最適な推定器と正確な有限サンプル境界を提供する。
また,一般的な分布シフトの下でミニマックスリスクをバウンドするツールについても紹介し,ワッサースタイン摂動だけでなく,位置族に対する平滑化手法や,最善の事前列,連続性のモジュラス,ル・カム,ファノ,アソアドの手法を含む古典的ツールの一般化についても紹介する。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Keep it Tighter -- A Story on Analytical Mean Embeddings [0.6445605125467574]
カーネル技術は、データサイエンスにおいて最も人気があり柔軟なアプローチの一つである。
平均埋め込みは、最大平均不一致(MMD)と呼ばれる分岐測度をもたらす。
本稿では,基礎となる分布の1つの平均埋め込みが解析的に利用可能である場合のMDD推定の問題に焦点をあてる。
論文 参考訳(メタデータ) (2021-10-15T21:29:27Z) - Non asymptotic estimation lower bounds for LTI state space models with
Cram\'er-Rao and van Trees [1.14219428942199]
本研究では,未知の共分散のガウス励起を持つ線形時間不変(LTI)状態空間モデルに対する推定問題について検討する。
予測される推定誤差と最小二乗推定器の平均二乗推定リスクに対して非下界を与える。
その結果, 推定リスクを期待して, 既存の下限を下限に拡張し, 改善した。
論文 参考訳(メタデータ) (2021-09-17T15:00:25Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Near-Optimal Linear Regression under Distribution Shift [63.87137348308034]
線形ミニマックス推定器は、様々なソース/ターゲット分布に対する非線形推定器の中でも、ミニマックスリスクの絶対定数内にあることを示す。
論文 参考訳(メタデータ) (2021-06-23T00:52:50Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Fundamental Limits of Ridge-Regularized Empirical Risk Minimization in
High Dimensions [41.7567932118769]
経験的リスク最小化アルゴリズムは、様々な推定や予測タスクで広く利用されている。
本稿では,コンベックスEMMの統計的精度に関する基礎的限界を推論のために初めて特徴づける。
論文 参考訳(メタデータ) (2020-06-16T04:27:38Z) - On lower bounds for the bias-variance trade-off [0.0]
高次元統計モデルでは、速度-最適推定器は二乗バイアスと分散のバランスをとるのが一般的である。
本稿では, 既定境界よりも小さい偏差を持つ任意の推定器の分散に関する下限を求める一般戦略を提案する。
これは、バイアス分散トレードオフがどの程度避けられないかを示し、従わないメソッドのパフォーマンスの損失を定量化することができる。
論文 参考訳(メタデータ) (2020-05-30T14:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。