論文の概要: Bayesian Fixed-Budget Best-Arm Identification
- arxiv url: http://arxiv.org/abs/2211.08572v3
- Date: Thu, 15 Jun 2023 13:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 03:16:47.941548
- Title: Bayesian Fixed-Budget Best-Arm Identification
- Title(参考訳): ベイズ型固定予算ベストアーム識別
- Authors: Alexia Atsidakou, Sumeet Katariya, Sujay Sanghavi, Branislav Kveton
- Abstract要約: 固定予算ベストアーム識別(英語: Fixed-budget best-arm identification、BAI)は、エージェントが一定の予算内で最適な腕を特定する確率を最大化する盗賊問題である。
ベイズ除去アルゴリズムを提案し、最適な腕を誤識別する確率の上限を導出する。
- 参考スコア(独自算出の注目度): 24.31655036648236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fixed-budget best-arm identification (BAI) is a bandit problem where the
agent maximizes the probability of identifying the optimal arm within a fixed
budget of observations. In this work, we study this problem in the Bayesian
setting. We propose a Bayesian elimination algorithm and derive an upper bound
on its probability of misidentifying the optimal arm. The bound reflects the
quality of the prior and is the first distribution-dependent bound in this
setting. We prove it using a frequentist-like argument, where we carry the
prior through, and then integrate out the bandit instance at the end. We also
provide a lower bound on the probability of misidentification in a $2$-armed
Bayesian bandit and show that our upper bound (almost) matches it for any
budget. Our experiments show that Bayesian elimination is superior to
frequentist methods and competitive with the state-of-the-art Bayesian
algorithms that have no guarantees in our setting.
- Abstract(参考訳): 固定予算ベストアーム識別(英: fixed-budget best-arm identification、bai)は、エージェントが観測予算内で最適なアームを識別する確率を最大化するバンディット問題である。
本研究では,この問題をベイズ・セッティングで研究する。
ベイズ除去アルゴリズムを提案し,その最適アームを誤認する確率の上界を導出する。
境界は前者の品質を反映し、この設定における最初の分布依存境界である。
私たちは、事前の処理を行い、最後にbanditインスタンスを統合するという、頻繁な議論を使ってそれを証明します。
また、2ドルの武器を持つベイズ・バンディットの誤識別の確率を低くし、上限(ほぼ)がどの予算でも一致していることを示す。
実験の結果,ベイジアン除去は頻繁な手法よりも優れており,保証のない最先端のベイジアンアルゴリズムと競合することがわかった。
関連論文リスト
- UCB Exploration for Fixed-Budget Bayesian Best Arm Identification [0.0]
固定予算設定におけるベストアーム識別(BAI)について検討した。
ベイズ条件下での固定予算BAI問題に対して理論的かつ実験的に効率的であるUPB探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-09T05:15:36Z) - Pure Exploration for Constrained Best Mixed Arm Identification with a Fixed Budget [6.22018632187078]
固定予算の制約付きベスト・ミックスアーム識別(CBMAI)問題を導入する。
目標は、与えられた学習予算$N$で、期待されるコストの制約によって期待される報酬を最大化する最高の混合アームを見つけることである。
我々は、(最良の混合アームの支持の)誤識別に関する理論上の上限を提供し、予算$N$で指数関数的に崩壊することを示す。
論文 参考訳(メタデータ) (2024-05-23T22:35:11Z) - Fixed Confidence Best Arm Identification in the Bayesian Setting [6.083234045523298]
ベイズ設定における固定信頼度ベストアーム識別(FC-BAI)問題を考察する。
この問題は、既知の既知値からバンディットモデルがサンプリングされたときに、信頼度が固定された最大の平均のアームを見つけることを目的としている。
論文 参考訳(メタデータ) (2024-02-16T03:36:03Z) - Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Best Arm Identification under Additive Transfer Bandits [49.69203462561861]
提案手法は, 未知であるにもかかわらず, ソースとターゲットMABインスタンスの間には, 付加的な関係があることが知られている。
本稿では,LUCBスタイルのアルゴリズムを理論的に解析し,高い確率で$epsilon$-optimal target armを同定する。
論文 参考訳(メタデータ) (2021-12-08T02:20:18Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Guaranteed Fixed-Confidence Best Arm Identification in Multi-Armed
Bandit [1.5469452301122177]
我々は,n個体群(腕)が最大の平均値を持つ適応サンプリングによる探索の問題を考える。
本研究の目的は, できるだけ少ない観測値を用いて, 最良集団を最小限の信頼度で識別するルールを決定することである。
論文 参考訳(メタデータ) (2021-06-12T20:05:29Z) - Towards Minimax Optimal Best Arm Identification in Linear Bandits [95.22854522340938]
固定予算設定における線形包帯における最適な腕識別の問題について検討する。
G-最適設計の特性を活用し、アーム割り当て規則に組み込むことにより、パラメータフリーなアルゴリズムを設計する。
OD-LinBAIの故障確率に関する理論的解析を行った。
論文 参考訳(メタデータ) (2021-05-27T09:19:10Z) - Quantile Bandits for Best Arms Identification [10.294977861990203]
多腕バンディットにおける最適な腕識別タスクの変種について検討する。
リスクと逆の意思決定の問題によって動機づけられた当社の目標は、固定予算内で最高の$tau$-quantileの値を持つ、$m$の武器のセットを特定することです。
論文 参考訳(メタデータ) (2020-10-22T09:58:54Z) - Optimal Best-arm Identification in Linear Bandits [79.3239137440876]
サンプルの複雑さが既知のインスタンス固有の下界と一致する単純なアルゴリズムを考案する。
既存のベストアーム識別戦略とは異なり、我々のアルゴリズムは武器の数に依存しない停止規則を用いる。
論文 参考訳(メタデータ) (2020-06-29T14:25:51Z) - Robustness Guarantees for Mode Estimation with an Application to Bandits [131.21717367564963]
平均ではなく報酬分布のモードを値とするマルチアームバンディットの理論を導入する。
我々は,我々のアルゴリズムが逆雑音列による腕の摂動に頑健であることを示すシミュレーションで示す。
論文 参考訳(メタデータ) (2020-03-05T21:29:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。