論文の概要: Adaptive Shot Allocation for Recursive QAOA via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.26544v1
- Date: Tue, 26 May 2026 04:48:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.67459
- Title: Adaptive Shot Allocation for Recursive QAOA via Reinforcement Learning
- Title(参考訳): 強化学習による再帰的QAOAのための適応ショットアロケーション
- Authors: Euimin Lee, Shiho Kim,
- Abstract要約: RQAOA(Recursive QAOA)は、浅い量子回路を用いてペア相関を推定することで最適化問題を解決する。
それぞれの除去ステップには計測ショットが必要であり、繰り返しステージの数に応じて全ショットコストが増大する。
短期量子デバイスでは、ショット数の増加は直接ハードウェアレベルのノイズ源に曝される可能性がある。
- 参考スコア(独自算出の注目度): 1.5469452301122175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recursive QAOA (RQAOA) solves combinatorial optimization problems by using shallow quantum circuits to estimate pairwise correlations and recursively eliminate variables until a classical solver can handle the residual instance. Each elimination step requires measurement shots, and the total shot cost grows with the number of recursive stages. On near-term quantum devices, increasing shot counts can translate directly into greater exposure to hardware-level noise sources such as readout errors and decoherence, making shot-efficient execution not merely a cost-reduction measure but a factor with direct implications for solution reliability. While shot reduction has been studied broadly across NISQ algorithms, step-wise measurement control inside the recursive loop of RQAOA has received little attention. We formulate this step-wise allocation as a sequential decision problem and propose two strategies for depth-1 RQAOA on weighted Max-Cut instances. A hand-crafted heuristic assigns shots based on local indicators of step difficulty, and a tabular Double Q-learning agent learns a residual policy that adjusts this baseline under a Lagrangian-constrained objective. Both methods are evaluated under a fixed-cap fairness protocol that equalizes the per-step budget across all strategies, and the elimination rule itself is kept unchanged so that the contribution of adaptive measurement control can be isolated. On a diverse set of weighted graph instances spanning a range of sizes and structures, the heuristic reduces total shots by approximately 23% relative to uniform allocation, and the RL policy achieves a 36% reduction with a lower effective shots per success ratio than both baselines. The improvement persists on problem sizes not seen during training, suggesting that reinforcement learning can discover efficient, instance-adaptive measurement strategies in recursive quantum optimization.
- Abstract(参考訳): Recursive QAOA (RQAOA) は、浅い量子回路を用いてペアの相関を推定し、古典的な解法が残余のインスタンスを扱えるまで変数を再帰的に除去することで、組合せ最適化問題を解決する。
それぞれの除去ステップは、測定ショットを必要とし、再帰的なステージの数に応じて、全ショットコストが増大する。
短期量子デバイスでは、ショット数の増加は、リードアウトエラーやデコヒーレンスなどのハードウェアレベルのノイズソースへの直接的露出に変換されるため、ショット効率の実行はコスト削減ではなく、ソリューションの信頼性に直接影響する要因となる。
NISQアルゴリズム全体ではショットリダクションが広く研究されているが、RQAOAの再帰ループ内のステップワイズ測定制御はほとんど注目されていない。
このステップワイズ割り当てを逐次決定問題として定式化し、重み付きMax-Cutインスタンス上でのDepth-1 RQAOAの2つの戦略を提案する。
手作りのヒューリスティックは、ステップ困難の局所的な指標に基づいてショットを割り当て、表のダブルQ学習エージェントは、ラグランジアン制約された目的の下でこのベースラインを調整する残留ポリシーを学習する。
いずれの手法も、全戦略にまたがるステップ毎の予算を等しくする固定上限公正プロトコルで評価し、適応測定制御の寄与を分離できるように、除去ルール自体を変更せずに維持する。
様々なサイズと構造にまたがる重み付きグラフのインスタンスにおいて、ヒューリスティックは全ショットを均一なアロケーションに対して約23%削減し、RLポリシーは2つのベースラインよりも成功率の低い実効ショットで36%削減する。
この改善は、トレーニング中に見られない問題のサイズに継続し、強化学習が再帰的量子最適化における効率的なインスタンス適応測定戦略を発見できることを示唆している。
関連論文リスト
- DISA: Offline Importance Sampling for Distribution-Matching LLM-RL [56.9445657766829]
本稿では、このキャリブレーション問題をRLループの外に移動させるdisAを紹介する。
DISAは提案トラジェクトリをオフラインに描画し、重要サンプリングによってパーティション関数を推定し、結果として発生するパーティション関数の推定を凍結する。
6つの数学と3つのコードベンチマークにまたがる2つのオープンウェイトなバックボーンでは、DisdisAはオンラインに結合した分散マッチングベースラインフローにマッチするか、超えている。
論文 参考訳(メタデータ) (2026-05-17T07:14:44Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - QTALE: Quantization-Robust Token-Adaptive Layer Execution for LLMs [0.0]
大規模言語モデル(LLM)は、かなりの計算資源とメモリ資源を必要とする。
トークン適応型実行と量子化をシームレスに統合する新しいフレームワークであるQTALEを提案する。
論文 参考訳(メタデータ) (2026-02-11T02:19:11Z) - Recursive QAOA for Interference-Aware Resource Allocation in Wireless Networks [4.9873153106566575]
無線ネットワークにおける離散的無線資源管理問題は,大規模に解決することが困難である。
本稿では,量子近似最適化アルゴリズム(RQAOA)に基づく量子古典的手法について検討する。
干渉を意識したチャネル割り当てでは、ペアの干渉が同じチャネル結合を誘導し、1ホットの制約が2次罰則によって強制される、コンパクトなQUBO/Isingの定式化を与える。
論文 参考訳(メタデータ) (2026-02-07T10:28:38Z) - Q-learning with Adjoint Matching [58.78551025170267]
本稿では,新しいTD-based reinforcement learning (RL)アルゴリズムであるAdjoint Matching (QAM) を用いたQ-learningを提案する。
QAMは、最近提案された生成モデリング手法であるadjoint matchingを活用することで、2つの課題を回避している。
オフラインとオフラインの両方のRLにおいて、ハードでスパースな報酬タスクに対する従来のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2026-01-20T18:45:34Z) - Iterative Partition Search Variational Quantum Algorithm for Solving Shortest Vector Problem [5.7878635559750515]
最短ベクトル問題(SVP)を解決するための反復分割探索アルゴリズム(IPSA)を提案する。
我々のアルゴリズムは分割のコアアイデアを継承し、PSAから「ゼロベクトル」を回避し、IQOAPから「反復格子基底還元」フレームワークを継承する。
IPSAの重要な特徴は「1尾の検索空間」であり、PSAの分割戦略の高度に制約された変種と見なすことができる。
論文 参考訳(メタデータ) (2025-08-26T12:53:02Z) - Shot-Efficient ADAPT-VQE via Reused Pauli Measurements and Variance-Based Shot Allocation [0.0]
ADAPT-VQEにおけるショット要求を減らすための2つの統合戦略を提案する。
まず,次のADAPT-VQEイテレーションの演算子選択ステップにおいて,VQEパラメータ最適化時に得られるパウリ測定結果を再利用する。
第2に、分散に基づくショットアロケーションをハミルトンおよび演算子勾配測定の両方に適用する。
論文 参考訳(メタデータ) (2025-07-22T12:34:49Z) - CBQ: Cross-Block Quantization for Large Language Models [66.82132832702895]
ポストトレーニング量子化(PTQ)は、超低コストで大規模言語モデル(LLM)を圧縮する上で重要な役割を果たしている。
LLMのためのクロスブロック再構成に基づくPTQ手法CBQを提案する。
CBQはリコンストラクションスキームを使用してクロスブロック依存関係を採用し、エラーの蓄積を最小限に抑えるために複数のブロックにまたがる長距離依存関係を確立する。
論文 参考訳(メタデータ) (2023-12-13T07:56:27Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。