論文の概要: SymQNet: Amortized Acquisition for Low-Latency Adaptive Hamiltonian Learning
- arxiv url: http://arxiv.org/abs/2606.12808v2
- Date: Tue, 16 Jun 2026 19:57:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 13:57:35.092796
- Title: SymQNet: Amortized Acquisition for Low-Latency Adaptive Hamiltonian Learning
- Title(参考訳): SymQNet: 低レイテンシ適応型ハミルトン学習のための暗黙の買収
- Authors: Yash Vardhan Tomar, Dheeraj Peddireddy,
- Abstract要約: 我々は低レイテンシ適応型ハミルトン学習のためのアモータイズされた強化学習アプローチであるSymQNetを紹介する。
5キュービットで、オンラインベースラインと比較して、買収のみの意思決定遅延を47.1タイム$と72.6タイム$に削減する。
全体として、学習した取得によって、繰り返し低レイテンシのワークロードに対して適応的なハミルトン学習を実践できることが示される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive Hamiltonian learning is central to calibrating and characterizing quantum devices. In an adaptive controller, choosing the next experiment is itself a computation. Bayesian design rules are recomputed after every posterior update, and that step can take seconds. Across hundreds of shots, those seconds become a significant wall-clock cost for adaptivity. We introduce SymQNet, an amortized reinforcement-learning approach for low-latency adaptive Hamiltonian learning. SymQNet learns a posterior-conditioned acquisition policy offline, then uses a fast policy forward pass online while retaining Bayesian posterior feedback. On transverse-field Ising benchmarks, SymQNet substantially reduces acquisition latency relative to bounded Fisher-information search and bounded two-step Bayesian active learning by disagreement (BALD). At five qubits, it reduces acquisition-only decision latency by $47.1\times$ and $72.6\times$ relative to these online baselines; at twelve qubits, full simulated steps take $1.02$ s for SymQNet versus $13.27$ s for bounded two-step BALD. Overall, we show that learned acquisition can make adaptive Hamiltonian learning practical for repeated low-latency workloads.
- Abstract(参考訳): 適応ハミルトニアン学習は、量子デバイスの校正と特徴付けの中心である。
適応コントローラでは、次の実験を選択することはそれ自体が計算である。
ベイズの設計規則は後続のアップデート毎に再計算され、そのステップには数秒かかる可能性がある。
何百枚ものショットを合わせると、これらの秒は適応性のためのウォールクロックコストとして重要なものとなる。
我々は低レイテンシ適応型ハミルトン学習のためのアモータイズされた強化学習アプローチであるSymQNetを紹介する。
SymQNetは、後続条件の取得ポリシーをオフラインで学習し、高速ポリシーのフォワードパスをオンラインで使用し、ベイジアン後続フィードバックを保持する。
逆フィールドIsingベンチマークでは、SymQNetは、有界フィッシャー情報検索および有界ベイズアクティブラーニング(BALD)による2段階ベイズアクティブラーニングと比較して、取得遅延を大幅に低減する。
5 qubitsでは、買収のみの決定遅延を47.1\times$と72.6\times$に減らし、12 qubitsではSymQNetでは1.02$s、境界付き2段階BALDでは13.27$sとなる。
全体として、学習した取得によって、繰り返し低レイテンシのワークロードに対して適応的なハミルトン学習を実践できることが示される。
関連論文リスト
- How Neural Reward Models Learn Features for Policy Optimization: A Single-Index Analysis [53.063298916923976]
r*(x) = *(langle *, xrangle)$ と $x sim N(0, I_d)$ でガウスの単一インデックスモデルでフィードバックを研究する。
まず、報酬重み付きサンプルから隠れた方向を*$で学習し、次に重み付きリッジ回帰により読み出し層に適合する2段階のニューラル報酬モデルを分析する。
論文 参考訳(メタデータ) (2026-05-23T22:00:38Z) - Fixed-Reservoir vs Variational Quantum Architectures for Chaotic Dynamics: Benchmarking QRC and QPINN on the Lorenz System [0.14323566945483496]
ロレンツ系におけるカオス時系列予測のための2つの量子的アプローチを比較する。
本研究では,QRCパイプライン内の時間的ウィンドウ化手法を定式化し,アトラクタ再構成を改善する。
以上の結果から, 固定貯留層構造がQRCの優位性の主要な要因であることが示唆された。
論文 参考訳(メタデータ) (2026-04-26T14:43:03Z) - Autonomous Hamiltonian certification and changepoint detection [1.2021700665093262]
環境騒音は調整されたハミルトンパラメーターを時間とともに漂流させ、高価な再校正を必要とする。
我々は,自律環境下でのハミルトン認証と変更点検出プロトコルを効率的に開発する。
我々のアプローチは、量子デバイスがシステムや検証操作、信頼できる参照装置を必要とせずに、自身のキャリブレーション状態を自律的に監視することを可能にする。
論文 参考訳(メタデータ) (2026-03-27T17:54:45Z) - Choice-Model-Assisted Q-learning for Delayed-Feedback Revenue Management [21.145677259232354]
遅延フィードバックによる収益管理のための強化学習について検討し、予約後の顧客キャンセルや変更によってかなりの価値が決定される。
本稿では,学習対象の遅延成分を定式化した部分的世界モデルとして,キャリブレーション付き離散選択モデルを用いたアンフィスモデル支援RLを提案する。
論文 参考訳(メタデータ) (2026-02-02T16:23:56Z) - Provably Efficient and Agile Randomized Q-Learning [35.14581235983678]
我々は、サンプリングベースの探索をアジャイル、ステップワイド、ポリシー更新と統合した新しいQ-ラーニングアルゴリズムをRandomizedQと呼ぶ。
経験的に、RandomizedQは、ボーナスベースとベイズベースで標準ベンチマークを探索する既存のQラーニングモデルと比較して、優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-06-30T16:08:29Z) - Efficient Offline Policy Optimization with a Learned Model [83.64779942889916]
MuZero Unpluggedはログデータからオフラインポリシー学習に有望なアプローチを提供する。
MCTS(Monte-Carlo Tree Search)を学習モデルで実行し、Reanalyzeアルゴリズムを利用してオフラインデータから純粋に学習する。
本稿では,オフライン設定下では MuZero Unplugged がうまく動作しないという仮説について検討する。
論文 参考訳(メタデータ) (2022-10-12T07:41:04Z) - Active Learning of Quantum System Hamiltonians yields Query Advantage [3.07869141026886]
ハミルトン学習は量子システムの同定、校正、量子コンピュータの動作成功において重要な手順である。
ハミルトン学習の標準的な技術は、標準的な量子限界のため、クエリを慎重に設計し、学習エラーを$epsilon$を達成するために$O(epsilon-2)$クエリを必要とする。
本稿では,最初のトレーニング例と,量子システムを対話的にクエリして新しいトレーニングデータを生成する機能を備えたアクティブラーナーを紹介する。
論文 参考訳(メタデータ) (2021-12-29T13:45:12Z) - Learning to Learn to Demodulate with Uncertainty Quantification via
Bayesian Meta-Learning [59.014197664747165]
本稿では, よく校正された数パイロット復調器の取得を目的とした変分推論によるベイズ的メタラーニングについて紹介する。
その結果得られたベイズアンサンブルは、復調のためにニューラルネットワークの複数のインスタンスを実行する計算コストにおいて、より良い校正されたソフトな決定を提供する。
論文 参考訳(メタデータ) (2021-08-02T11:07:46Z) - Tightening the Dependence on Horizon in the Sample Complexity of
Q-Learning [59.71676469100807]
この研究は、同期Q-ラーニングのサンプルの複雑さを、任意の$0varepsilon 1$に対して$frac|mathcalS| (1-gamma)4varepsilon2$の順序に絞る。
計算やストレージを余分に必要とせずに、高速なq-learningにマッチするvanilla q-learningの有効性を明らかにした。
論文 参考訳(メタデータ) (2021-02-12T14:22:05Z) - Finite-Time Analysis for Double Q-learning [50.50058000948908]
二重Q-ラーニングのための非漸近的有限時間解析を初めて提供する。
同期と非同期の二重Q-ラーニングの両方が,グローバル最適化の$epsilon$-accurate近辺に収束することが保証されていることを示す。
論文 参考訳(メタデータ) (2020-09-29T18:48:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。