論文の概要: Quantum Lipschitz Bandits
- arxiv url: http://arxiv.org/abs/2504.02251v1
- Date: Thu, 03 Apr 2025 03:39:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:55:52.076078
- Title: Quantum Lipschitz Bandits
- Title(参考訳): 量子リプシッツバンド
- Authors: Bongsoo Yi, Yue Kang, Yao Li,
- Abstract要約: リプシッツ・バンディットは、期待される報酬関数がリプシッツ条件を満たすバンディット問題の重要な変種である。
連続的な行動空間と非線形報酬関数の課題に対処するために、最初の量子リプシッツバンディットアルゴリズムを導入する。
- 参考スコア(独自算出の注目度): 6.167074802065416
- License:
- Abstract: The Lipschitz bandit is a key variant of stochastic bandit problems where the expected reward function satisfies a Lipschitz condition with respect to an arm metric space. With its wide-ranging practical applications, various Lipschitz bandit algorithms have been developed, achieving the cumulative regret lower bound of order $\tilde O(T^{(d_z+1)/(d_z+2)})$ over time horizon $T$. Motivated by recent advancements in quantum computing and the demonstrated success of quantum Monte Carlo in simpler bandit settings, we introduce the first quantum Lipschitz bandit algorithms to address the challenges of continuous action spaces and non-linear reward functions. Specifically, we first leverage the elimination-based framework to propose an efficient quantum Lipschitz bandit algorithm named Q-LAE. Next, we present novel modifications to the classical Zooming algorithm, which results in a simple quantum Lipschitz bandit method, Q-Zooming. Both algorithms exploit the computational power of quantum methods to achieve an improved regret bound of $\tilde O(T^{d_z/(d_z+1)})$. Comprehensive experiments further validate our improved theoretical findings, demonstrating superior empirical performance compared to existing Lipschitz bandit methods.
- Abstract(参考訳): リプシッツ・バンディット(英: Lipschitz bandit)は、予想される報酬関数がアーム計量空間に関してリプシッツ条件を満たす確率的バンディット問題の鍵変種である。
広範にわたる実用的応用により、様々なリプシッツ・バンディットアルゴリズムが開発され、時間的地平線上でのO(T^{(d_z+1)/(d_z+2)})$$ の累積的後悔の下限を達成している。
量子コンピューティングの最近の進歩と、より単純なバンドイット設定における量子モンテカルロの成功により、連続的なアクション空間と非線形報酬関数の課題に対処する最初の量子リプシッツバンドイットアルゴリズムを導入する。
具体的には、まず除去に基づくフレームワークを活用し、Q-LAEと呼ばれる効率的な量子リプシッツバンディットアルゴリズムを提案する。
次に,古典的なズームアルゴリズムに新たな改良を加え,量子リプシッツブライト法,Q-Zoomingを提案する。
どちらのアルゴリズムも量子法の計算力を利用して、$\tilde O(T^{d_z/(d_z+1)})$を改良した後悔境界を達成する。
包括的実験により,既存のリプシッツ・バンディット法と比較して実験性能が良好であることが確認された。
関連論文リスト
- Variational Quantum Optimization with Continuous Bandits [1.6686882054452727]
本稿では,連続バンディットによる変分量子アルゴリズム(VQA)の新たなアプローチを提案する。
VQAは、量子回路のパラメータを古典的なアルゴリズムで最適化するハイブリッド量子古典アルゴリズムのクラスである。
論文 参考訳(メタデータ) (2025-02-06T12:24:30Z) - Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization [2.8445375187526154]
本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
論文 参考訳(メタデータ) (2024-10-28T15:20:35Z) - Quantum Bayesian Optimization [64.58749619145908]
本稿では,量子ガウスプロセスアップパー信頼度境界(Q-GP-UCB)アルゴリズムを提案する。
O(polylog T) は古典的設定における Omega(sqrt(T)) の左下限よりもかなり小さい。
線形核を持つQ-GP-UCBは、新しい信頼楕円体解析により、量子線形 UCB アルゴリズムよりも小さな後悔を実現する。
論文 参考訳(メタデータ) (2023-10-09T03:10:42Z) - Quantum Computing Provides Exponential Regret Improvement in Episodic
Reinforcement Learning [35.11103784048256]
有限水平MDPの学習を容易にするために,textitUpper Confidence Bound (UCB) ベースの量子アルゴリズムフレームワークを提案する。
我々の量子アルゴリズムは、古典的なアルゴリズムと比較して、後悔の指数的な改善を実現している。
論文 参考訳(メタデータ) (2023-02-16T23:01:27Z) - Quantum Heavy-tailed Bandits [36.458771174473924]
重み付き報酬と量子報酬を用いたマルチアーム・バンディット(MAB)とリニア・バンディット(SLB)について検討した。
まず,量子モンテカルロ推定器に基づく重み付き分布に対する新しい量子平均推定器を提案する。
量子平均推定器に基づき、量子重み付きMABとSLBに着目し、上信頼境界(UCB)フレームワークに基づく量子アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-23T19:23:10Z) - Quantum Worst-Case to Average-Case Reductions for All Linear Problems [66.65497337069792]
量子アルゴリズムにおける最悪のケースと平均ケースの削減を設計する問題について検討する。
量子アルゴリズムの明示的で効率的な変換は、入力のごく一部でのみ正し、全ての入力で正しくなる。
論文 参考訳(メタデータ) (2022-12-06T22:01:49Z) - Quantum Goemans-Williamson Algorithm with the Hadamard Test and
Approximate Amplitude Constraints [62.72309460291971]
本稿では,n+1$ qubitsしか使用しないGoemans-Williamsonアルゴリズムの変分量子アルゴリズムを提案する。
補助量子ビット上で適切にパラメータ化されたユニタリ条件として目的行列を符号化することにより、効率的な最適化を実現する。
各種NPハード問題に対して,Goemans-Williamsonアルゴリズムの量子的効率的な実装を考案し,提案プロトコルの有効性を実証する。
論文 参考訳(メタデータ) (2022-06-30T03:15:23Z) - Entanglement and coherence in Bernstein-Vazirani algorithm [58.720142291102135]
Bernstein-Vaziraniアルゴリズムは、オラクルに符号化されたビット文字列を決定できる。
我々はベルンシュタイン・ヴァジラニアルゴリズムの量子資源を詳細に分析する。
絡み合いがない場合、初期状態における量子コヒーレンス量とアルゴリズムの性能が直接関係していることが示される。
論文 参考訳(メタデータ) (2022-05-26T20:32:36Z) - Quantum algorithm for stochastic optimal stopping problems with
applications in finance [60.54699116238087]
有名な最小二乗モンテカルロ (LSM) アルゴリズムは、線形最小二乗回帰とモンテカルロシミュレーションを組み合わせることで、最適停止理論の問題を解決する。
プロセスへの量子アクセス、最適な停止時間を計算するための量子回路、モンテカルロの量子技術に基づく量子LSMを提案する。
論文 参考訳(メタデータ) (2021-11-30T12:21:41Z) - On Lipschitz Regularization of Convolutional Layers using Toeplitz
Matrix Theory [77.18089185140767]
リプシッツ正則性は現代のディープラーニングの重要な性質として確立されている。
ニューラルネットワークのリプシッツ定数の正確な値を計算することはNPハードであることが知られている。
より厳密で計算が容易な畳み込み層に対する新しい上限を導入する。
論文 参考訳(メタデータ) (2020-06-15T13:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。