論文の概要: High-Dimensional Gaussian Mean Estimation under Realizable Contamination
- arxiv url: http://arxiv.org/abs/2603.16798v1
- Date: Tue, 17 Mar 2026 17:04:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.441752
- Title: High-Dimensional Gaussian Mean Estimation under Realizable Contamination
- Title(参考訳): 可燃性汚染下における高次元ガウス平均推定
- Authors: Ilias Diakonikolas, Daniel M. Kane, Thanasis Pittas,
- Abstract要約: 本研究では,$mathbbRd$における同一性共分散を持つガウス分布の平均推定を,$$$-contaminationモデルと呼ばれるデータスキームの欠如の下で行う。
このモデルでは、相手は 0 から $$ の間の関数 $r(x)$ を選択でき、各サンプル $x$ は確率 $r(x)$ で失われる。
- 参考スコア(独自算出の注目度): 43.56842719227285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study mean estimation for a Gaussian distribution with identity covariance in $\mathbb{R}^d$ under a missing data scheme termed realizable $ε$-contamination model. In this model an adversary can choose a function $r(x)$ between 0 and $ε$ and each sample $x$ goes missing with probability $r(x)$. Recent work Ma et al., 2024 proposed this model as an intermediate-strength setting between Missing Completely At Random (MCAR) -- where missingness is independent of the data -- and Missing Not At Random (MNAR) -- where missingness may depend arbitrarily on the sample values and can lead to non-identifiability issues. That work established information-theoretic upper and lower bounds for mean estimation in the realizable contamination model. Their proposed estimators incur runtime exponential in the dimension, leaving open the possibility of computationally efficient algorithms in high dimensions. In this work, we establish an information-computation gap in the Statistical Query model (and, as a corollary, for Low-Degree Polynomials and PTF tests), showing that algorithms must either use substantially more samples than information-theoretically necessary or incur exponential runtime. We complement our SQ lower bound with an algorithm whose sample-time tradeoff nearly matches our lower bound. Together, these results qualitatively characterize the complexity of Gaussian mean estimation under $ε$-realizable contamination.
- Abstract(参考訳): 本研究では,$\mathbb{R}^d$における同一性共分散を持つガウス分布の平均推定を,実効可能な$ε$-汚染モデルと呼ばれるデータスキームで行う。
このモデルでは、相手は 0 から $ε$ の間の関数 $r(x)$ を選択でき、各サンプル $x$ は確率 $r(x)$ で失われる。
最近の研究Ma et al , 2024 では、このモデルを、データの欠落がデータから独立している MCAR (Missing Completely At Random) と、MNAR (Missing Not At Random) の中間強度設定として提案している。
その研究は、可逆性汚染モデルにおける平均推定のための情報理論上限と下限を確立した。
提案した推定器は、高次元で計算効率のよいアルゴリズムの可能性を秘めている。
本研究では,統計的クエリモデルにおける情報計算のギャップ(および低次多項式およびPTFテストのまとめ)を確立し,アルゴリズムが情報理論上必要な場合よりもはるかに多くのサンプルを使用する必要があることを示す。
我々は、サンプル時間トレードオフが低い境界にほぼ一致するアルゴリズムで、SQ低境界を補完する。
これらの結果は、$ε$-realizable contaminationの下でのガウス平均推定の複雑さを質的に特徴づける。
関連論文リスト
- High-dimensional estimation with missing data: Statistical and computational limits [13.480462575790334]
我々は,観測結果が欠落したデータである場合の集団パラメータの計算効率を考察する。
平均$ell$法則で推定すると、常に汚染される$in (0, 1)$, (大まかに)$n gtrsim d e1/2$のサンプルは必要となる。
観測結果の欠如により線形回帰に転換し、そのようなギャップが持続しないことを示す。
論文 参考訳(メタデータ) (2026-03-17T16:02:41Z) - Efficient Multivariate Robust Mean Estimation Under Mean-Shift Contamination [35.67742880001828]
平均シフト汚染を用いた高次元ロバスト平均推定のための計算効率のよい最初のアルゴリズムを提案する。
提案アルゴリズムは, ほぼ最適サンプルの複雑性を持ち, サンプル・ポリノミカル時間で動作し, ターゲット平均を任意の精度で近似する。
論文 参考訳(メタデータ) (2025-02-20T17:53:13Z) - O(d/T) Convergence Theory for Diffusion Probabilistic Models under Minimal Assumptions [6.76974373198208]
最小の仮定の下で,拡散確率モデル(DDPM)の高速収束理論を確立する。
収束率は$O(k/T)$に改善され、$k$は対象データ分布の内在次元であることを示す。
これはDDPMが未知の低次元構造に自動的に適応する能力を強調している。
論文 参考訳(メタデータ) (2024-09-27T17:59:10Z) - Convergence Analysis of Probability Flow ODE for Score-based Generative Models [5.939858158928473]
確率フローODEに基づく決定論的サンプリング器の収束特性を理論的・数値的両面から検討する。
連続時間レベルでは、ターゲットと生成されたデータ分布の総変動を$mathcalO(d3/4delta1/2)$で表すことができる。
論文 参考訳(メタデータ) (2024-04-15T12:29:28Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。