論文の概要: Online Robust Mean Estimation
- arxiv url: http://arxiv.org/abs/2310.15932v1
- Date: Tue, 24 Oct 2023 15:28:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 18:10:31.856412
- Title: Online Robust Mean Estimation
- Title(参考訳): オンラインロバスト平均推定
- Authors: Daniel M. Kane and Ilias Diakonikolas and Hanshen Xiao and Sihan Liu
- Abstract要約: オンライン環境における高次元ロバスト平均推定問題について検討する。
このモデルでは、オンラインロバスト平均推定の主な2つの結果が証明されている。
- 参考スコア(独自算出の注目度): 37.746091744197656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of high-dimensional robust mean estimation in an online
setting. Specifically, we consider a scenario where $n$ sensors are measuring
some common, ongoing phenomenon. At each time step $t=1,2,\ldots,T$, the
$i^{th}$ sensor reports its readings $x^{(i)}_t$ for that time step. The
algorithm must then commit to its estimate $\mu_t$ for the true mean value of
the process at time $t$. We assume that most of the sensors observe independent
samples from some common distribution $X$, but an $\epsilon$-fraction of them
may instead behave maliciously. The algorithm wishes to compute a good
approximation $\mu$ to the true mean $\mu^\ast := \mathbf{E}[X]$. We note that
if the algorithm is allowed to wait until time $T$ to report its estimate, this
reduces to the well-studied problem of robust mean estimation. However, the
requirement that our algorithm produces partial estimates as the data is coming
in substantially complicates the situation.
We prove two main results about online robust mean estimation in this model.
First, if the uncorrupted samples satisfy the standard condition of
$(\epsilon,\delta)$-stability, we give an efficient online algorithm that
outputs estimates $\mu_t$, $t \in [T],$ such that with high probability it
holds that $\|\mu-\mu^\ast\|_2 = O(\delta \log(T))$, where $\mu = (\mu_t)_{t
\in [T]}$. We note that this error bound is nearly competitive with the best
offline algorithms, which would achieve $\ell_2$-error of $O(\delta)$. Our
second main result shows that with additional assumptions on the input (most
notably that $X$ is a product distribution) there are inefficient algorithms
whose error does not depend on $T$ at all.
- Abstract(参考訳): オンライン環境における高次元ロバスト平均推定問題について検討する。
具体的には、$n$のセンサーが現在進行中の現象を計測するシナリオについて検討する。
それぞれのステップで$t=1,2,\ldots,T$, $i^{th}$ センサーは、そのステップの読み込みを $x^{(i)}_t$ と報告する。
するとアルゴリズムはその推定値に$\mu_t$をコミットし、その時のプロセスの平均値は$t$である。
センサーの多くは、ある一般的な分布の独立したサンプルをX$で観察していると仮定するが、その代わりに$\epsilon$-fractionが悪質に振る舞うかもしれない。
このアルゴリズムは、真の平均 $\mu^\ast := \mathbf{e}[x]$ に対するよい近似を計算したいと考えている。
このアルゴリズムが推定値の報告に$T$まで待つことができれば、頑健な平均推定というよく研究された問題に還元されることに留意する。
しかし,本アルゴリズムでは,データの出現に伴って部分的な推定が要求されるため,その状況はかなり複雑になる。
このモデルにおいて,オンラインロバスト平均推定に関する2つの主な結果を示す。
まず、未分解のサンプルが $(\epsilon,\delta)$-stability の標準条件を満たす場合、推定値 $\mu_t$, $t \in [t],$ を出力する効率的なオンラインアルゴリズムが与えられ、高い確率で$\|\mu-\mu^\ast\|_2 = o(\delta \log(t))$ となる。
このエラーバウンドは、最高のオフラインアルゴリズムとほぼ競合しており、$\ell_2$-error of $o(\delta)$が得られる。
2つ目の主な結果は、入力に対する追加の仮定(特に$X$は製品分布である)により、エラーが$T$に依存しない非効率なアルゴリズムが存在することを示している。
関連論文リスト
- Optimal Sketching for Residual Error Estimation for Matrix and Vector Norms [50.15964512954274]
線形スケッチを用いた行列とベクトルノルムの残差誤差推定問題について検討する。
これは、前作とほぼ同じスケッチサイズと精度で、経験的にかなり有利であることを示す。
また、スパースリカバリ問題に対して$Omega(k2/pn1-2/p)$低いバウンダリを示し、これは$mathrmpoly(log n)$ factorまで厳密である。
論文 参考訳(メタデータ) (2024-08-16T02:33:07Z) - A Sub-Quadratic Time Algorithm for Robust Sparse Mean Estimation [6.853165736531941]
逆数外乱の存在下でのスパース平均推定のアルゴリズム的問題について検討する。
我々の主な貢献は、$mathrmpoly(k,log d,1/epsilon)$サンプルを用いて、エフェサブクアクラティック時間で実行される頑健なスパース平均推定アルゴリズムである。
論文 参考訳(メタデータ) (2024-03-07T18:23:51Z) - Data Structures for Density Estimation [66.36971978162461]
p$のサブリニア数($n$)が与えられた場合、主な結果は$k$のサブリニアで$v_i$を識別する最初のデータ構造になります。
また、Acharyaなどのアルゴリズムの改良版も提供します。
論文 参考訳(メタデータ) (2023-06-20T06:13:56Z) - A spectral least-squares-type method for heavy-tailed corrupted
regression with unknown covariance \& heterogeneous noise [2.019622939313173]
重み付き最小二乗線形回帰は、少なくとも$epsilon n$ arbitrary outliersの$n$のラベル特徴サンプルを破損させたと仮定して再検討する。
本稿では,$(Sigma,Xi) や $Xi$ の演算ノルムに関する知識を前提に,電力法に基づくほぼ最適に計算可能な推定器を提案する。
論文 参考訳(メタデータ) (2022-09-06T23:37:31Z) - List-Decodable Sparse Mean Estimation via Difference-of-Pairs Filtering [42.526664955704746]
そこで我々は,リストデコダブルなスパース平均推定のための,新しい,概念的にシンプルな手法を開発した。
特に、$k$-sparse方向の「確実に有界な」$t-thモーメントを持つ分布の場合、このアルゴリズムは、サンプル複雑性$m = (klog(n))O(t)/alpha(mnt)$の誤差を1/alpha(O (1/t)$で達成する。
Gaussian inliers の特別な場合、我々のアルゴリズムは $Theta (sqrtlog) の最適誤差を保証する。
論文 参考訳(メタデータ) (2022-06-10T17:38:18Z) - Robust Testing in High-Dimensional Sparse Models [0.0]
2つの異なる観測モデルの下で高次元スパース信号ベクトルのノルムを頑健にテストする問題を考察する。
回帰係数のノルムを確実に検定するアルゴリズムは、少なくとも$n=Omegaleft(min(slog d,1/gamma4)right)サンプルを必要とする。
論文 参考訳(メタデータ) (2022-05-16T07:47:22Z) - Clustering Mixture Models in Almost-Linear Time via List-Decodable Mean
Estimation [58.24280149662003]
本稿では,データセットの大部分を敵が破壊できるリストデコタブル平均推定の問題について検討する。
我々は、ほぼ最適な統計的保証を達成するために、リストデコダブル平均推定のための新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-16T03:34:14Z) - List-Decodable Mean Estimation in Nearly-PCA Time [50.79691056481693]
高次元におけるリストデコタブル平均推定の基本的な課題について検討する。
我々のアルゴリズムは、すべての$k = O(sqrtd) cup Omega(d)$に対して$widetildeO(ndk)$で実行されます。
我々のアルゴリズムの変種は、すべての$k$に対してランタイム$widetildeO(ndk)$を持ち、リカバリ保証の$O(sqrtlog k)$ Factorを犠牲にしている。
論文 参考訳(メタデータ) (2020-11-19T17:21:37Z) - On Efficient Low Distortion Ultrametric Embedding [18.227854382422112]
データの基盤となる階層構造を保存するために広く用いられる方法は、データを木や超音波に埋め込む方法を見つけることである。
本稿では,$mathbbRd2(ユニバーサル定数$rho>1$)の点集合を入力として,超測度$Deltaを出力する新しいアルゴリズムを提案する。
我々のアルゴリズムの出力はリンクアルゴリズムの出力に匹敵するが、より高速な実行時間を実現する。
論文 参考訳(メタデータ) (2020-08-15T11:06:45Z) - Streaming Complexity of SVMs [110.63976030971106]
本稿では,ストリーミングモデルにおけるバイアス正規化SVM問題を解く際の空間複雑性について検討する。
両方の問題に対して、$frac1lambdaepsilon$の次元に対して、$frac1lambdaepsilon$よりも空間的に小さいストリーミングアルゴリズムを得ることができることを示す。
論文 参考訳(メタデータ) (2020-07-07T17:10:00Z) - Agnostic Q-learning with Function Approximation in Deterministic
Systems: Tight Bounds on Approximation Error and Sample Complexity [94.37110094442136]
本稿では,決定論的システムにおける関数近似を用いたQ$学習の問題について検討する。
もし$delta = Oleft(rho/sqrtdim_Eright)$なら、$Oleft(dim_Eright)$を使って最適なポリシーを見つけることができる。
論文 参考訳(メタデータ) (2020-02-17T18:41:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。