論文の概要: Tight Bounds for $\gamma$-Regret via the Decision-Estimation Coefficient
- arxiv url: http://arxiv.org/abs/2303.03327v2
- Date: Fri, 21 Jul 2023 17:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-24 16:07:15.700638
- Title: Tight Bounds for $\gamma$-Regret via the Decision-Estimation Coefficient
- Title(参考訳): 決定推定係数による$\gamma$-regretの厳密な境界
- Authors: Margalit Glasgow and Alexander Rakhlin
- Abstract要約: 任意の構造化バンディット問題に対する$gamma$-regretの統計的特徴を与える。
- 参考スコア(独自算出の注目度): 88.86699022151598
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we give a statistical characterization of the $\gamma$-regret
for arbitrary structured bandit problems, the regret which arises when
comparing against a benchmark that is $\gamma$ times the optimal solution. The
$\gamma$-regret emerges in structured bandit problems over a function class
$\mathcal{F}$ where finding an exact optimum of $f \in \mathcal{F}$ is
intractable. Our characterization is given in terms of the $\gamma$-DEC, a
statistical complexity parameter for the class $\mathcal{F}$, which is a
modification of the constrained Decision-Estimation Coefficient (DEC) of Foster
et al., 2023 (and closely related to the original offset DEC of Foster et al.,
2021). Our lower bound shows that the $\gamma$-DEC is a fundamental limit for
any model class $\mathcal{F}$: for any algorithm, there exists some $f \in
\mathcal{F}$ for which the $\gamma$-regret of that algorithm scales (nearly)
with the $\gamma$-DEC of $\mathcal{F}$. We provide an upper bound showing that
there exists an algorithm attaining a nearly matching $\gamma$-regret. Due to
significant challenges in applying the prior results on the DEC to the
$\gamma$-regret case, both our lower and upper bounds require novel techniques
and a new algorithm.
- Abstract(参考訳): 本研究では、任意の構造化バンドイット問題に対する$\gamma$-regretの統計的特徴を与えるが、これは、$\gamma$-regretが最適解の$\gamma$のベンチマークと比較した場合に生じる後悔である。
$\gamma$-regret は、関数クラス $\mathcal{F}$ 上の構造化バンディット問題に現れ、$f \in \mathcal{F}$ の正確な最適値を見つけることは難解である。
我々の特徴付けは、foster et al., 2023の制約付き決定推定係数 (dec) の修正である$\mathcal{f}$ の統計複雑性パラメータである $\gamma$-dec の項で与えられる(そして、foster et al., 2021 のオリジナルのオフセット dec と密接に関連している)。
我々の下限は、$\gamma$-DEC が任意のモデルクラス $\mathcal{F}$ の基本極限であることを示している: 任意のアルゴリズムに対して、ある $f \in \mathcal{F}$ が存在し、そのアルゴリズムの $\gamma$-regret は $\mathcal{F}$ の $\gamma$-DEC と(ほぼ)スケールする。
- p-Mean Regret for Stochastic Bandits [52.828710025519996]
単純で統一された UCB ベースのアルゴリズムを導入し、新しい$p$-mean の後悔境界を実現する。
論文 参考訳(メタデータ) (2024-12-14T08:38:26Z) - Inverting the Leverage Score Gradient: An Efficient Approximate Newton Method [10.742859956268655]
論文 参考訳(メタデータ) (2024-08-21T01:39:42Z) - A simple and improved algorithm for noisy, convex, zeroth-order optimisation [59.51990161522328]
我々は、$f(hat x)$ ができるだけ小さいような点 $hat xin barmathcal X$ を返すアルゴリズムを構築している。
この方法は、$f(hat x) - min_xin barmathcal X f(x)$ が、多対数項まで$d2/sqrtn$ より小さい順序であることを証明する。
論文 参考訳(メタデータ) (2024-06-26T18:19:10Z) - Fast $(1+\varepsilon)$-Approximation Algorithms for Binary Matrix
Factorization [54.29685789885059]
本稿では, 2次行列分解(BMF)問題に対する効率的な$(1+varepsilon)$-approximationアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-02T18:55:27Z) - Instance-Dependent Bounds for Zeroth-order Lipschitz Optimization with
Error Certificates [0.0]
コンパクト部分集合 $mathcal X$ of $mathbb Rd$ 上で定義されるリプシッツ関数 $f$ のゼロ次(ブラックボックス)最適化の問題を研究する。
我々は、任意のリプシッツ関数 $f$ の評価の最適な個数を特徴付け、精度$varepsilon$ で$f$ の近似器を見つけて証明する。
論文 参考訳(メタデータ) (2021-02-03T09:51:03Z) - Near-Optimal Regret Bounds for Contextual Combinatorial Semi-Bandits
with Linear Payoff Functions [53.77572276969548]
我々は、C$2$UCBアルゴリズムが分割マトロイド制約に対して最適な後悔結合$tildeO(dsqrtkT + dk)$を有することを示した。
論文 参考訳(メタデータ) (2021-01-20T04:29:18Z) - Revisiting Modified Greedy Algorithm for Monotone Submodular
Maximization with a Knapsack Constraint [75.85952446237599]
論文 参考訳(メタデータ) (2020-08-12T15:40:21Z)