論文の概要: Non-asymptotic analysis and inference for an outlyingness induced
winsorized mean
- arxiv url: http://arxiv.org/abs/2105.02337v1
- Date: Wed, 5 May 2021 21:35:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 13:37:45.049932
- Title: Non-asymptotic analysis and inference for an outlyingness induced
winsorized mean
- Title(参考訳): 非漸近的解析と外因性誘導平均の推論
- Authors: Yijun Zuo
- Abstract要約: 本稿では,平均の下位ゲージ推定器のロバスト性について検討する。
いずれも、データ中の25%以上の汚染に耐えられないことが明らかになった。
また、最高の堅牢性を有するアウトライン性誘起Winsorized平均も導入しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust estimation of a mean vector, a topic regarded as obsolete in the
traditional robust statistics community, has recently surged in machine
learning literature in the last decade. The latest focus is on the sub-Gaussian
performance and computability of the estimators in a non-asymptotic setting.
Numerous traditional robust estimators are computationally intractable, which
partly contributes to the renewal of the interest in the robust mean
estimation.
Robust centrality estimators, however, include the trimmed mean and the
sample median. The latter has the best robustness but suffers a low-efficiency
drawback. Trimmed mean and median of means, %as robust alternatives to the
sample mean, and achieving sub-Gaussian performance have been proposed and
studied in the literature.
This article investigates the robustness of leading sub-Gaussian estimators
of mean and reveals that none of them can resist greater than $25\%$
contamination in data and consequently introduces an outlyingness induced
winsorized mean which has the best possible robustness (can resist up to $50\%$
contamination without breakdown) meanwhile achieving high efficiency.
Furthermore, it has a sub-Gaussian performance for uncontaminated samples and a
bounded estimation error for contaminated samples at a given confidence level
in a finite sample setting. It can be computed in linear time.
- Abstract(参考訳): 従来のロバスト統計コミュニティでは時代遅れと見なされる平均ベクトルのロバストな推定は、最近10年間に機械学習の文献で急増している。
最新の焦点は、非漸近的な環境での推定器の性能と計算可能性である。
多くの伝統的なロバスト推定器は計算に難解であり、ロバスト平均推定への関心の更新に一部寄与している。
しかし、ロバスト中心性推定器は、トリミング平均とサンプル中央値を含む。
後者は最も頑健だが、低効率の欠点がある。
試料平均に対するロバストな代替品として, トリミング平均, 平均中央値, %as が提案され, 文献で研究されている。
本稿では,平均値の下位ゲージ推定器の主成分のロバスト性を調査し,データ中の25\%$以上の汚染に抵抗できないことを明らかにするとともに,最も高いロバスト性(破壊することなく最大50\%$の汚染に抵抗できる)を有する外接性誘導ウィンナライズ平均を導入する。
さらに、非汚染試料に対するサブガウス性能と、有限標本設定における所定の信頼度レベルでの汚染試料に対する有界推定誤差を有する。
線形時間で計算できる。
関連論文リスト
- Heavy-tailed Contamination is Easier than Adversarial Contamination [8.607294463464523]
ハマー (Huber, 1960) にさかのぼる統計学と計算機科学のコミュニティにおける研究の成果は、統計学的および計算学的に効率的なアウトリア・ローバスト推定器に繋がった。
2つの特定の外れ値モデル、すなわち対向モデルと重尾モデルが注目されている。
論文 参考訳(メタデータ) (2024-11-22T19:00:33Z) - A Tale of Sampling and Estimation in Discounted Reinforcement Learning [50.43256303670011]
割引平均推定問題に対して最小値の最小値を求める。
マルコフ過程の割引されたカーネルから直接サンプリングすることで平均を推定すると、説得力のある統計的性質が得られることを示す。
論文 参考訳(メタデータ) (2023-04-11T09:13:17Z) - Outlier-Robust Sparse Mean Estimation for Heavy-Tailed Distributions [42.6763105645717]
少数の破損したサンプルが与えられた場合、ゴールは確率の高い$mu$を正確に近似する仮説を効率的に計算することである。
本アルゴリズムは, 周辺次元と対数的にスケーリングするサンプルを多数使用して, 最適誤差を実現する。
我々の分析は、ある空間特性を満たす正の半定値に対する(非スペクトル)分解の繊細な設計を含む、独立した関心を持つかもしれない。
論文 参考訳(メタデータ) (2022-11-29T16:13:50Z) - Robust Estimation for Nonparametric Families via Generative Adversarial
Networks [92.64483100338724]
我々は,高次元ロバストな統計問題を解くためにGAN(Generative Adversarial Networks)を設計するためのフレームワークを提供する。
我々の研究は、これらをロバスト平均推定、第二モーメント推定、ロバスト線形回帰に拡張する。
技術面では、提案したGAN損失は、スムーズで一般化されたコルモゴロフ-スミルノフ距離と見なすことができる。
論文 参考訳(メタデータ) (2022-02-02T20:11:33Z) - Gaining Outlier Resistance with Progressive Quantiles: Fast Algorithms
and Theoretical Studies [1.6457778420360534]
任意の損失関数を強固化するために, 外部抵抗推定の枠組みを導入する。
通常のデータセットでは、データ再見積の回数を大幅に削減できるような、開始点の要件を緩和する新しい手法が提案されている。
得られた推定器は、必ずしも大域的でも大域的でもなくても、両方の低次元において最適性を楽しむことができる。
論文 参考訳(メタデータ) (2021-12-15T20:35:21Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Outlier Robust Mean Estimation with Subgaussian Rates via Stability [46.03021473600576]
本研究では,ロバストなアウトリール高次元平均推定問題について検討する。
外乱平均推定のために, ガウス平均を用いた第1次計算効率を得る。
論文 参考訳(メタデータ) (2020-07-30T17:33:03Z) - TraDE: Transformers for Density Estimation [101.20137732920718]
TraDEは自己回帰密度推定のための自己アテンションに基づくアーキテクチャである。
本稿では, 生成したサンプルを用いた回帰, 分布外検出, トレーニングデータにおける雑音に対する頑健性などのタスクについて述べる。
論文 参考訳(メタデータ) (2020-04-06T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。