論文の概要: Exploration-free Algorithms for Multi-group Mean Estimation
- arxiv url: http://arxiv.org/abs/2510.10374v1
- Date: Sun, 12 Oct 2025 00:20:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.91092
- Title: Exploration-free Algorithms for Multi-group Mean Estimation
- Title(参考訳): 多群平均推定のための探索自由アルゴリズム
- Authors: Ziyi Wei, Huaiyang Zhong, Xiaocheng Li,
- Abstract要約: 提案手法は,複数グループにまたがる有限サンプリング予算を割り当てて,その平均を均一に正確に推定する多群平均推定の問題に対処する。
この設定における最適な割り当ては、$Theta(T)$ timesの順序ですべてのグループをサンプリングする必要がある。
- 参考スコア(独自算出の注目度): 7.480522058240762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the problem of multi-group mean estimation, which seeks to allocate a finite sampling budget across multiple groups to obtain uniformly accurate estimates of their means. Unlike classical multi-armed bandits, whose objective is to minimize regret by identifying and exploiting the best arm, the optimal allocation in this setting requires sampling every group on the order of $\Theta(T)$ times. This fundamental distinction makes exploration-free algorithms both natural and effective. Our work makes three contributions. First, we strengthen the existing results on subgaussian variance concentration using the Hanson-Wright inequality and identify a class of strictly subgaussian distributions that yield sharper guarantees. Second, we design exploration-free non-adaptive and adaptive algorithms, and we establish tighter regret bounds than the existing results. Third, we extend the framework to contextual bandit settings, an underexplored direction, and propose algorithms that leverage side information with provable guarantees. Overall, these results position exploration-free allocation as a principled and efficient approach to multi-group mean estimation, with potential applications in experimental design, personalization, and other domains requiring accurate multi-group inference.
- Abstract(参考訳): 提案手法は,複数グループにまたがる有限サンプリング予算を割り当てて,その平均を均一に正確に推定する多群平均推定の問題に対処する。
古典的な多重武装の盗賊とは違い、その目的は、最高の腕を特定して悪用することで後悔を最小限に抑えることであるが、この設定における最適な割り当ては、$\Theta(T)$ timesの順序ですべてのグループをサンプリングする必要がある。
この基本的な区別は、探索不要のアルゴリズムを自然と有効の両方にしている。
私たちの仕事は3つの貢献をする。
まず,ハンソン・ライトの不等式を用いた部分ガウス変分濃度に関する既存の結果を強化し,よりシャープな保証を与える厳密な部分ガウス分布のクラスを同定する。
第二に、探索自由な非適応適応適応アルゴリズムを設計し、既存の結果よりも深い後悔境界を確立する。
第3に、フレームワークを文脈的帯域設定、探索されていない方向まで拡張し、証明可能な保証でサイド情報を活用するアルゴリズムを提案する。
全体として、これらの結果は、実験設計、パーソナライゼーション、および正確なマルチグループ推論を必要とする他の領域への潜在的な応用を含む、多群平均推定に対する原則的かつ効率的なアプローチとして、探索自由割当を位置づけている。
関連論文リスト
- Constrained Pareto Set Identification with Bandit Feedback [10.967572582187014]
意味不明の$Kの武器が与えられた場合、平均が他の腕よりも一様でない腕のセットを特定することが目的である。
我々は固定信頼度同定に重点を置いており、レースのようなアルゴリズムを著しく上回るアルゴリズムを導入している。
論文 参考訳(メタデータ) (2025-06-09T18:29:28Z) - Asymptotically Optimal Linear Best Feasible Arm Identification with Fixed Budget [55.938644481736446]
本稿では,誤差確率の指数的減衰を保証し,最適な腕識別のための新しいアルゴリズムを提案する。
我々は,複雑性のレベルが異なる様々な問題インスタンスに対する包括的経験的評価を通じて,アルゴリズムの有効性を検証する。
論文 参考訳(メタデータ) (2025-06-03T02:56:26Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Bandit Pareto Set Identification: the Fixed Budget Setting [10.967572582187014]
マルチアームバンディットモデルにおける純粋探索問題について検討する。
目的は、平均値が他の分布よりも均一に悪くない分布を特定することである。
論文 参考訳(メタデータ) (2023-11-07T13:43:18Z) - Beyond Submodularity: A Unified Framework of Randomized Set Selection
with Group Fairness Constraints [19.29174615532181]
グループフェアネス制約を組み込んだランダム化サブセット選択のための統一フレームワークを提案する。
我々の問題には、グローバルなユーティリティ関数と、各グループに対するグループユーティリティ関数のセットが含まれる。
我々の目的は、各実現可能な集合の選択確率を指定して、実現可能な部分集合にまたがる分布を生成することである。
論文 参考訳(メタデータ) (2023-04-13T15:02:37Z) - Robust Consensus Clustering and its Applications for Advertising
Forecasting [18.242055675730253]
我々は,専門家の意見に共通する根拠となる真実を見出すことのできる,ロバストなコンセンサスクラスタリングという新しいアルゴリズムを提案する。
提案手法を実世界の広告キャンペーンセグメンテーションと予測タスクに適用する。
論文 参考訳(メタデータ) (2022-12-27T21:49:04Z) - Max-Min Grouped Bandits [48.62520520818357]
マルチアームバンディット問題であるmax-min grouped banditsを導入する。
ゴールは、最悪の腕が最高の平均報酬を持つグループを見つけることです。
この問題はレコメンデーションシステムのようなアプリケーションには関心がある。
論文 参考訳(メタデータ) (2021-11-17T01:59:15Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。