論文の概要: An Empirical Process Approach to the Union Bound: Practical Algorithms
for Combinatorial and Linear Bandits
- arxiv url: http://arxiv.org/abs/2006.11685v1
- Date: Sun, 21 Jun 2020 00:56:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 11:29:07.031858
- Title: An Empirical Process Approach to the Union Bound: Practical Algorithms
for Combinatorial and Linear Bandits
- Title(参考訳): ユニオン境界に対する経験的プロセスアプローチ:組合せと線形帯域のための実践的アルゴリズム
- Authors: Julian Katz-Samuels, Lalit Jain, Zohar Karnin, Kevin Jamieson
- Abstract要約: 本稿では、信頼度と予算設定の固定化において、純探索線形帯域問題に対する近似アルゴリズムを提案する。
サンプルの複雑性がインスタンスの幾何でスケールし、アームの数に縛られた明示的な結合を避けるアルゴリズムを提供する。
また,固定予算設定における線形帯域幅に対する最初のアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 34.06611065493047
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes near-optimal algorithms for the pure-exploration linear
bandit problem in the fixed confidence and fixed budget settings. Leveraging
ideas from the theory of suprema of empirical processes, we provide an
algorithm whose sample complexity scales with the geometry of the instance and
avoids an explicit union bound over the number of arms. Unlike previous
approaches which sample based on minimizing a worst-case variance (e.g.
G-optimal design), we define an experimental design objective based on the
Gaussian-width of the underlying arm set. We provide a novel lower bound in
terms of this objective that highlights its fundamental role in the sample
complexity. The sample complexity of our fixed confidence algorithm matches
this lower bound, and in addition is computationally efficient for
combinatorial classes, e.g. shortest-path, matchings and matroids, where the
arm sets can be exponentially large in the dimension. Finally, we propose the
first algorithm for linear bandits in the the fixed budget setting. Its
guarantee matches our lower bound up to logarithmic factors.
- Abstract(参考訳): 本稿では,固定信頼度と固定予算設定における純爆発線形バンディット問題に対する近似最適アルゴリズムを提案する。
経験的過程の超越の理論からアイデアを取り入れ、サンプルの複雑さがインスタンスの幾何学とスケールし、アームの数に有界な明示的な結合を避けるアルゴリズムを提供する。
最悪の場合の分散(例えば、最適設計)を最小化する以前の手法とは異なり、基礎となるアームセットのガウス幅に基づく実験的な設計目標を定義する。
この目的に関して、サンプルの複雑さにおけるその基本的な役割を強調する、新しい下限を提供する。
固定信頼アルゴリズムのサンプルの複雑さは、この下界と一致し、さらに、アームセットが指数関数的に寸法が大きいようなショートパス、マッチング、マトロイドなどの組合せクラスに対して計算的に効率的である。
最後に,固定予算設定における線形バンディットに対する最初のアルゴリズムを提案する。
その保証は我々の対数的要因に対する下限に合致する。
関連論文リスト
- Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - An Optimal Algorithm for the Real-Valued Combinatorial Pure Exploration
of Multi-Armed Bandit [65.268245109828]
多武装バンディット(R-CPE-MAB)の真価純探査問題について検討する。
既存のR-CPE-MABの手法は、いわゆるトランスダクティブ線形帯域の特殊な場合と見なすことができる。
本稿では,差分探索アルゴリズム (CombGapE) を提案する。
論文 参考訳(メタデータ) (2023-06-15T15:37:31Z) - Optimal Algorithms for Stochastic Complementary Composite Minimization [55.26935605535377]
統計学と機械学習における正規化技術に触発され,補完的な複合化の最小化について検討した。
予測と高い確率で、新しい過剰なリスク境界を提供する。
我々のアルゴリズムはほぼ最適であり、このクラスの問題に対して、新しいより低い複雑性境界によって証明する。
論文 参考訳(メタデータ) (2022-11-03T12:40:24Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Improved Algorithms for Agnostic Pool-based Active Classification [20.12178157010804]
プールに依存しない環境でのバイナリ分類のためのアクティブラーニングを検討する。
我々のアルゴリズムは、画像分類データセットにおけるアートアクティブな学習アルゴリズムの状況よりも優れている。
論文 参考訳(メタデータ) (2021-05-13T18:24:30Z) - An Asymptotically Optimal Primal-Dual Incremental Algorithm for
Contextual Linear Bandits [129.1029690825929]
複数の次元に沿った最先端技術を改善する新しいアルゴリズムを提案する。
非文脈線形帯域の特別な場合において、学習地平線に対して最小限の最適性を確立する。
論文 参考訳(メタデータ) (2020-10-23T09:12:47Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。