論文の概要: Best Arm Identification in Spectral Bandits
- arxiv url: http://arxiv.org/abs/2005.09841v1
- Date: Wed, 20 May 2020 04:12:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 04:48:14.315660
- Title: Best Arm Identification in Spectral Bandits
- Title(参考訳): スペクトル帯域におけるベストアーム識別
- Authors: Tom\'a\v{s} Koc\'ak, Aur\'elien Garivier
- Abstract要約: BAI(Best Arm Identification)は、パラメータチューニングから臨床試験まで、多くの応用において重要な課題である。
グラフの滑らか度制約を伴う帯域モデルにおいて,信頼度を固定したベストアーム識別について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study best-arm identification with fixed confidence in bandit models with
graph smoothness constraint. We provide and analyze an efficient gradient
ascent algorithm to compute the sample complexity of this problem as a solution
of a non-smooth max-min problem (providing in passing a simplified analysis for
the unconstrained case). Building on this algorithm, we propose an
asymptotically optimal strategy. We furthermore illustrate by numerical
experiments both the strategy's efficiency and the impact of the smoothness
constraint on the sample complexity. Best Arm Identification (BAI) is an
important challenge in many applications ranging from parameter tuning to
clinical trials. It is now very well understood in vanilla bandit models, but
real-world problems typically involve some dependency between arms that
requires more involved models. Assuming a graph structure on the arms is an
elegant practical way to encompass this phenomenon, but this had been done so
far only for regret minimization. Addressing BAI with graph constraints
involves delicate optimization problems for which the present paper offers a
solution.
- Abstract(参考訳): グラフの滑らか度制約を伴う帯域モデルにおいて,信頼度を固定したベストアーム識別について検討する。
非滑らかな最大ミン問題の解法として、この問題のサンプル複雑性を計算するための効率的な勾配上昇アルゴリズム(非拘束ケースの簡易解析をパスすること)を提案し、解析する。
このアルゴリズムに基づいて漸近的最適戦略を提案する。
さらに,戦略の効率とスムーズ性制約が試料の複雑さに与える影響を数値実験により明らかにした。
BAI(Best Arm Identification)は、パラメータチューニングから臨床試験まで、多くの応用において重要な課題である。
現在ではバニラバンディットモデルではよく理解されているが、現実の問題は通常、より複雑なモデルを必要とする腕間の依存を伴う。
腕にグラフ構造を仮定することは、この現象を包含するエレガントな実践的な方法であるが、それは後悔の最小化のためだけに行われてきた。
baiをグラフ制約で扱うには,本論文が提示する微妙な最適化問題を含む。
関連論文リスト
- Optimal Multi-Fidelity Best-Arm Identification [65.23078799972188]
バンディットのベストアーム識別において、アルゴリズムは、できるだけ早く特定の精度で、最高平均報酬の腕を見つけることを任務とする。
マルチフィデリティのベストアーム識別について検討し、低コストで低いフィデリティ(正確な平均推定値を持たない)で腕をサンプリングすることを選択できる。
この問題に対処するためのいくつかの方法が提案されているが、その最適性は、特に最適な腕を特定するのに必要な総コストのゆるやかな下限のため、未解決のままである。
論文 参考訳(メタデータ) (2024-06-05T08:02:40Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Pure Exploration in Bandits with Linear Constraints [15.547603114649464]
マルチアーム・バンディット・セットアップにおいて、最適ポリシーを一定の信頼度で識別する問題に対処する。
この設定に最適な2つのアルゴリズムを導入する。1つはトラック・アンド・ストップ法であり、もう1つはゲーム理論に基づく手法である。
限界を検証し、制約が問題の硬さをどのように変えるかを視覚化する実験結果を提供する。
論文 参考訳(メタデータ) (2023-06-22T10:00:33Z) - Optimal Algorithms for Stochastic Complementary Composite Minimization [55.26935605535377]
統計学と機械学習における正規化技術に触発され,補完的な複合化の最小化について検討した。
予測と高い確率で、新しい過剰なリスク境界を提供する。
我々のアルゴリズムはほぼ最適であり、このクラスの問題に対して、新しいより低い複雑性境界によって証明する。
論文 参考訳(メタデータ) (2022-11-03T12:40:24Z) - Gaussian Graphical Model Selection for Huge Data via Minipatch Learning [1.2891210250935146]
グラフィカルモデル選択の問題を解決するために,MPGraph (Minipatch Graph) 推定器を提案する。
MPGraphは、観測とノードの両方の小さなランダムなサブセットに適合する閾値グラフ推定器の一般化である。
本アルゴリズムは有限サンプルグラフ選択の整合性を実現する。
論文 参考訳(メタデータ) (2021-10-22T21:06:48Z) - Differentiable Causal Discovery from Interventional Data [141.41931444927184]
本稿では、介入データを活用可能なニューラルネットワークに基づく理論的基盤化手法を提案する。
提案手法は,様々な環境下での美術品の状態と良好に比較できることを示す。
論文 参考訳(メタデータ) (2020-07-03T15:19:17Z) - Optimal Best-arm Identification in Linear Bandits [79.3239137440876]
サンプルの複雑さが既知のインスタンス固有の下界と一致する単純なアルゴリズムを考案する。
既存のベストアーム識別戦略とは異なり、我々のアルゴリズムは武器の数に依存しない停止規則を用いる。
論文 参考訳(メタデータ) (2020-06-29T14:25:51Z) - Quasi-Newton Solver for Robust Non-Rigid Registration [35.66014845211251]
データフィッティングと正規化のための大域的スムーズなロバスト推定器に基づくロバストな非剛性登録のための定式化を提案する。
本稿では,L-BFGS を用いた最小二乗問題の解法に,各繰り返しを減らし,最大化最小化アルゴリズムを適用した。
論文 参考訳(メタデータ) (2020-04-09T01:45:05Z) - The Simulator: Understanding Adaptive Sampling in the
Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。
適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。
我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文 参考訳(メタデータ) (2017-02-16T23:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。