Fugu-MT 論文翻訳(概要): On the Optimality of the Median-of-Means Estimator under Adversarial Contamination

論文の概要: On the Optimality of the Median-of-Means Estimator under Adversarial Contamination

arxiv url: http://arxiv.org/abs/2510.07867v1
Date: Thu, 09 Oct 2025 07:17:09 GMT
ステータス: 翻訳完了
システム内更新日: 2025-10-10 17:54:14.923955
Title: On the Optimality of the Median-of-Means Estimator under Adversarial Contamination
Title（参考訳）: 対数汚染下における中間値推定器の最適性について
Authors: Xabier de Juan, Santiago Mazuelas,
Abstract要約: 対向汚染下におけるMoMの誤差について, 上下境界について検討した。有限分散を持つ分布のクラスにおいて、MoM は (minimax) 最適であることを示す。また、提示された上界の順序に一致するMoMの誤差に対して下界を提供し、光尾分布に対してMoMが準最適であることを示す。
参考スコア（独自算出の注目度）: 8.243212777125752
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Median-of-Means (MoM) is a robust estimator widely used in machine learning that is known to be (minimax) optimal in scenarios where samples are i.i.d. In more grave scenarios, samples are contaminated by an adversary that can inspect and modify the data. Previous work has theoretically shown the suitability of the MoM estimator in certain contaminated settings. However, the (minimax) optimality of MoM and its limitations under adversarial contamination remain unknown beyond the Gaussian case. In this paper, we present upper and lower bounds for the error of MoM under adversarial contamination for multiple classes of distributions. In particular, we show that MoM is (minimax) optimal in the class of distributions with finite variance, as well as in the class of distributions with infinite variance and finite absolute $(1+r)$-th moment. We also provide lower bounds for MoM's error that match the order of the presented upper bounds, and show that MoM is sub-optimal for light-tailed distributions.
Abstract（参考訳）: Median-of-Means (MoM) は、機械学習で広く使われている堅牢な推定器で、サンプルがi.d.d.のシナリオで最適(minimax)であることが知られている。これまでの研究は、特定の汚染された環境でのMoM推定器の適合性を理論的に示してきた。しかし、MoMの(最小限の)最適性とその敵対的汚染の下での制限は、ガウスの場合を超えては未知のままである。本稿では,複数種類の分布に対する逆汚染条件下でのMoMの誤差について,上下境界について述べる。特に、MoM は有限分散を持つ分布のクラス、および無限分散で有限絶対$(1+r)$-th モーメントを持つ分布のクラスにおいて最適であることを示す。また、提示された上界の順序に一致するMoMの誤差に対して下界を提供し、光尾分布に対してMoMが準最適であることを示す。

関連論文リスト

Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文参考訳（メタデータ） (2024-10-17T16:42:12Z)
Flow matching achieves almost minimax optimal convergence [50.38891696297888]
フローマッチング (FM) は, シミュレーションのない生成モデルとして注目されている。本稿では,大試料径のFMの収束特性を$p$-Wasserstein 距離で論じる。我々は、FMが1leq p leq 2$でほぼ最小の収束率を達成できることを確立し、FMが拡散モデルに匹敵する収束率に達するという最初の理論的証拠を示す。
論文参考訳（メタデータ） (2024-05-31T14:54:51Z)
A Uniform Concentration Inequality for Kernel-Based Two-Sample Statistics [4.757470449749877]
これらの指標はカーネルベースの2サンプル統計学の一般的な枠組みの下で統一可能であることを示す。本稿では、上記のカーネルベースの統計量に対して、新しい一様濃度不等式を確立する。図示的応用として,これらの境界が距離共分散に基づく次元減少などの手順における誤差境界の構成をどのように促進するかを示す。
論文参考訳（メタデータ） (2024-05-22T22:41:56Z)
Partial identification of kernel based two sample tests with mismeasured data [5.076419064097733]
最大平均離散性(MMD)のような2サンプルテストは、機械学習アプリケーションにおける2つの分布の違いを検出するためにしばしば使用される。我々は,1つの分布の非ランダムな$epsilon$%が互いに誤ってグループ化されるような,$epsilon$-contaminationに基づくMDDの推定について検討した。そこで本研究では,これらの境界を推定する手法を提案し,サンプルサイズが大きくなるにつれてMDD上の最も鋭い限界に収束する推定値を示す。
論文参考訳（メタデータ） (2023-08-07T13:21:58Z)
Keep it Tighter -- A Story on Analytical Mean Embeddings [0.6445605125467574]
カーネル技術は、データサイエンスにおいて最も人気があり柔軟なアプローチの一つである。平均埋め込みは、最大平均不一致(MMD)と呼ばれる分岐測度をもたらす。本稿では,基礎となる分布の1つの平均埋め込みが解析的に利用可能である場合のMDD推定の問題に焦点をあてる。
論文参考訳（メタデータ） (2021-10-15T21:29:27Z)
Fast Batch Nuclear-norm Maximization and Minimization for Robust Domain Adaptation [154.2195491708548]
ランダムに選択されたデータバッチの分類出力行列の構造について検討し,予測可能性と多様性について検討した。本稿では,目標出力行列上で核ノルムを行い,目標予測能力を向上するBatch Nuclear-norm Maximization and Minimizationを提案する。実験により,本手法は3つの典型的なドメイン適応シナリオにおいて適応精度とロバスト性を高めることができることが示された。
論文参考訳（メタデータ） (2021-07-13T15:08:32Z)
Distributionally Robust Bayesian Quadrature Optimization [60.383252534861136]
確率分布が未知な分布の不確実性の下でBQOについて検討する。標準的なBQOアプローチは、固定されたサンプル集合が与えられたときの真の期待目標のモンテカルロ推定を最大化する。この目的のために,新しい後方サンプリングに基づくアルゴリズム,すなわち分布的に堅牢なBQO(DRBQO)を提案する。
論文参考訳（メタデータ） (2020-01-19T12:00:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。