論文の概要: Quantum-Inspired Episode Selection for Monte Carlo Reinforcement Learning via QUBO Optimization
- arxiv url: http://arxiv.org/abs/2601.17570v1
- Date: Sat, 24 Jan 2026 19:47:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.995085
- Title: Quantum-Inspired Episode Selection for Monte Carlo Reinforcement Learning via QUBO Optimization
- Title(参考訳): QUBO最適化によるモンテカルロ強化学習のための量子インスピレーション付きエピソード選択
- Authors: Hadi Salloum, Ali Jnadi, Yaroslav Kholodov, Alexander Gasnikov,
- Abstract要約: 擬似非拘束バイナリ最適化問題としてエピソード選択を再構成し、量子インスパイアされたサンプリング器で解決する。
提案手法であるMC+QUBOは,標準MCポリシー評価にフィルタリングステップを統合する。
有限水平グリッドワールドの実験は、MC+QUBOがバニラMCを収束速度と最終的な政策品質で上回ることを示した。
- 参考スコア(独自算出の注目度): 39.99287010327145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monte Carlo (MC) reinforcement learning suffers from high sample complexity, especially in environments with sparse rewards, large state spaces, and correlated trajectories. We address these limitations by reformulating episode selection as a Quadratic Unconstrained Binary Optimization (QUBO) problem and solving it with quantum-inspired samplers. Our method, MC+QUBO, integrates a combinatorial filtering step into standard MC policy evaluation: from each batch of trajectories, we select a subset that maximizes cumulative reward while promoting state-space coverage. This selection is encoded as a QUBO, where linear terms favor high-reward episodes and quadratic terms penalize redundancy. We explore both Simulated Quantum Annealing (SQA) and Simulated Bifurcation (SB) as black-box solvers within this framework. Experiments in a finite-horizon GridWorld demonstrate that MC+QUBO outperforms vanilla MC in convergence speed and final policy quality, highlighting the potential of quantum-inspired optimization as a decision-making subroutine in reinforcement learning.
- Abstract(参考訳): モンテカルロ(MC)強化学習は、特にスパース報酬、大きな状態空間、相関軌道を持つ環境において、高いサンプル複雑さに悩まされている。
本稿では,これらの制約を,擬似非拘束バイナリ最適化(QUBO)問題として再定義し,量子インスパイアされたサンプルを用いて解決することで解決する。
提案手法であるMC+QUBOは,各トラジェクトリのバッチから,状態空間のカバレッジを促進しながら累積報酬を最大化するサブセットを選択する。
この選択はQUBOとして符号化され、線形項は高逆エピソードを好んで、二次項は冗長性を罰する。
我々は、このフレームワーク内のブラックボックスソルバとして、SQA(Simulated Quantum Annealing)とSimulated Bifurcation(SB)の両方を探索する。
有限水平グリッドワールドの実験では、MC+QUBOがバニラMCを収束速度と最終的な政策品質で上回り、強化学習における決定的サブルーチンとしての量子インスパイアされた最適化の可能性を強調している。
関連論文リスト
- Fair sampling of ground-state configurations using hybrid quantum-classical MCMC algorithms [3.3083504598202733]
ハイブリッド量子古典型マルコフ連鎖モンテカルロ(MCMC)アルゴリズムのフェアサンプリング特性について検討した。
小型Isingモデルを用いて,MCMC後処理が量子力学のサンプリングバイアスを補正することを示した。
また、解の数え方を調べ、必要な遷移回数がWalkSATに匹敵することがわかった。
論文 参考訳(メタデータ) (2025-12-16T16:25:59Z) - Quantum Annealing for Machine Learning: Applications in Feature Selection, Instance Selection, and Clustering [41.94295877935867]
量子解法と古典解法をともに実装し,その有効性を比較する。
特徴選択のために,特徴量と冗長性のバランスをとるいくつかのQUBO構成を提案する。
事例選択では,既存手法を拡張した事例レベルの重要度尺度を提案する。
クラスタリングには古典的クラスタリングとQUBOベースのメドイドリファインメントを併用した古典的量子パイプラインを組み込む。
論文 参考訳(メタデータ) (2025-07-20T17:59:14Z) - Max-Cut graph-driven quantum circuit design for planar spin glasses [0.0]
スピングラスの基底状態を求めるためのグラフベースの手法を提案する。
我々は、最大カット法に基づいて、キュービットを異なるグループに整理するクラスタリング戦略を採用する。
本結果は,複雑な最適化問題に対処するハイブリッド量子古典法の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-04-16T14:00:32Z) - MG-Net: Learn to Customize QAOA with Circuit Depth Awareness [51.78425545377329]
量子近似最適化アルゴリズム(QAOA)とその変種は、最適化問題に対処する大きな可能性を示している。
良好な性能を実現するために必要な回路深度は問題固有であり、しばしば現在の量子デバイスの最大容量を超える。
ミキサジェネレータネットワーク (MG-Net) は, 最適ミキサハミルトニアンを動的に定式化するための統合ディープラーニングフレームワークである。
論文 参考訳(メタデータ) (2024-09-27T12:28:18Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Wasserstein Quantum Monte Carlo: A Novel Approach for Solving the
Quantum Many-Body Schr\"odinger Equation [56.9919517199927]
ワーッセルシュタイン量子モンテカルロ (WQMC) はフィッシャー・ラオ計量ではなくワーッセルシュタイン計量によって誘導される勾配流を用いており、テレポートではなく確率質量の輸送に対応する。
我々は、WQMCの力学が分子系の基底状態へのより高速な収束をもたらすことを実証的に実証した。
論文 参考訳(メタデータ) (2023-07-06T17:54:08Z) - Overcoming barriers to scalability in variational quantum Monte Carlo [6.41594296153579]
変分量子モンテカルロ法(VQMC)は、多体量子系に固有の次元の呪いを克服する能力により、近年注目されている。
VQMCと変分量子アルゴリズムのハイブリッド量子古典計算パラダイムの間には、近接した並列性が存在する。
論文 参考訳(メタデータ) (2021-06-24T20:36:50Z) - Sampling in Combinatorial Spaces with SurVAE Flow Augmented MCMC [83.48593305367523]
ハイブリッドモンテカルロ(Hybrid Monte Carlo)は、複素連続分布からサンプリングする強力なマルコフ連鎖モンテカルロ法である。
本稿では,SurVAEフローを用いたモンテカルロ法の拡張に基づく新しい手法を提案する。
本稿では,統計学,計算物理学,機械学習など,様々な分野におけるアルゴリズムの有効性を実証し,代替アルゴリズムと比較した改良点を考察する。
論文 参考訳(メタデータ) (2021-02-04T02:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。