論文の概要: Quantum Fisher-Preconditioned Reinforcement Learning: From Single-Qubit Control to Rayleigh-Fading Link Adaptation
- arxiv url: http://arxiv.org/abs/2506.15753v1
- Date: Wed, 18 Jun 2025 07:20:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.764658
- Title: Quantum Fisher-Preconditioned Reinforcement Learning: From Single-Qubit Control to Rayleigh-Fading Link Adaptation
- Title(参考訳): 量子フィッシャー条件強化学習:単一ビット制御からレイリーフェイディングリンク適応へ
- Authors: Oluwaseyi Giwa, Muhammad Ahmed Mohsin, Muhammad Ali Jamshed,
- Abstract要約: 本稿では、Tikhonov正則化を用いた逆量子フィッシャー情報を用いて、ポリシー更新を白くするリンク適応のための勾配に基づくアルゴリズムを提案する。
QはREINFORCEの4倍の速度で収束し、不確実性の下で1dBのゲインを維持する。
ノイズの高い100エピソードで90%のリターンに達し、スケーラブルな量子強化学習のための完全なQFIベースのプレコンディショニングの利点を示している。
- 参考スコア(独自算出の注目度): 1.5166632901697499
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this letter, we propose Quantum-Preconditioned Policy Gradient (QPPG), a natural gradient-based algorithm for link adaptation that whitens policy updates using the full inverse quantum Fisher information with Tikhonov regularization. QPPG bridges classical and quantum geometry, achieving stable learning even under noise. Evaluated on classical and quantum environments, including noisy single-qubit Gym tasks and Rayleigh-fading channels, QPPG converges 4 times faster than REINFORCE and sustains a 1 dB gain under uncertainty. It reaches a 90 percent return in one hundred episodes with high noise robustness, showcasing the advantages of full QFI-based preconditioning for scalable quantum reinforcement learning.
- Abstract(参考訳): 本稿では,Tikhonov正則化を用いた逆量子フィッシャー情報を用いてポリシー更新を行う,リンク適応のための自然な勾配に基づくアルゴリズムであるQuantum-Preconditioned Policy Gradient (QPPG)を提案する。
QPPGは古典的および量子幾何学をブリッジし、ノイズの下でも安定した学習を実現する。
ノイズの多い単一量子ビットのGymタスクやRayleigh-fadingチャネルを含む古典的および量子環境において評価され、QPPGはREINFORCEの4倍の速度で収束し、不確実性の下で1dBのゲインを維持する。
100回で90%のリターンを達成し、ノイズの堅牢性が高く、スケーラブルな量子強化学習のための完全なQFIベースのプレコンディショニングの利点を示している。
関連論文リスト
- Adaptive Quantum-Safe Cryptography for 6G Vehicular Networks via Context-Aware Optimization [4.154839547291294]
本稿では,短期的モビリティとチャネル変動を予測する適応型後量子暗号(PQC)フレームワークを提案する。
提案手法は,エンドツーエンドのレイテンシを最大27%削減し,通信オーバーヘッドを最大65%削減し,強化学習を用いた暗号スイッチング動作を効果的に安定化させる。
論文 参考訳(メタデータ) (2026-02-01T17:11:43Z) - Securing SIM-Assisted Wireless Networks via Quantum Reinforcement Learning [23.440441537310296]
SIM支援セキュア通信のためのハイブリッド量子ポリシー最適化フレームワークを提案する。
提案したQ-PPO方式はDRLベースラインを一貫して上回る。
これらの結果は、SIM対応セキュア無線ネットワークの強力な最適化パラダイムとしてQ-PPOを確立している。
論文 参考訳(メタデータ) (2026-01-29T18:53:33Z) - Q-learning with Adjoint Matching [58.78551025170267]
本稿では,新しいTD-based reinforcement learning (RL)アルゴリズムであるAdjoint Matching (QAM) を用いたQ-learningを提案する。
QAMは、最近提案された生成モデリング手法であるadjoint matchingを活用することで、2つの課題を回避している。
オフラインとオフラインの両方のRLにおいて、ハードでスパースな報酬タスクに対する従来のアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2026-01-20T18:45:34Z) - Continual Quantum Architecture Search with Tensor-Train Encoding: Theory and Applications to Signal Processing [68.35481158940401]
CL-QASは連続的な量子アーキテクチャ検索フレームワークである。
振幅のエンコードと変分量子回路の忘れを犠牲にすることの課題を緩和する。
制御可能なロバスト性表現性、サンプル効率の一般化、およびバレンプラトーを使わずに滑らかな収束を実現する。
論文 参考訳(メタデータ) (2026-01-10T02:36:03Z) - Deep Q-Network Based Resilient Drone Communication:Neutralizing First-Order Markov Jammers [0.0]
ディープQネットワークベースの送信機は、第1次リアクティブジャミングに直面しながら、次の周波数ホッピングチャネルを連続的に選択する。
自己学習により,ジャミングの予測的優位性を効果的に中和する均一なランダム周波数ホッピングポリシーを学習する。
論文 参考訳(メタデータ) (2026-01-01T14:16:40Z) - PASS-Enhanced MEC: Joint Optimization of Task Offloading and Uplink PASS Beamforming [67.78883135636657]
ピンチアンテナシステム (PASS) によるモバイルエッジコンピューティング (MEC) アーキテクチャについて検討した。
PASSは、重要な経路損失と潜在的な信号遮断を効果的に軽減しつつ、短距離ライン・オブ・ライト(LoS)リンクを確立する。
ネットワーク遅延最小化問題を定式化し、アップリンクPASSビームフォーミングとタスクオフロードを共同で最適化する。
論文 参考訳(メタデータ) (2025-10-27T03:04:46Z) - Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures [2.005299372367689]
本稿では,各段階でCFGを動的に調整するQRL(quantum reinforcement learning)コントローラを提案する。
コントローラは、ハイブリッド量子-古典的アクター-批判的アーキテクチャを採用する。
CIFAR-10の実験は、QRLポリシーが知覚品質を改善することを示した。
論文 参考訳(メタデータ) (2025-09-17T16:47:04Z) - Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - TensoMeta-VQC: A Tensor-Train-Guided Meta-Learning Framework for Robust and Scalable Variational Quantum Computing [60.996803677584424]
TensoMeta-VQCは、VQCの堅牢性とスケーラビリティを大幅に向上させるために設計された、TT誘導型メタラーニングフレームワークである。
我々のフレームワークは、量子回路パラメータの生成を古典的なTTネットワークに完全に委譲し、量子ハードウェアから最適化を効果的に分離する。
論文 参考訳(メタデータ) (2025-08-01T23:37:55Z) - Sporadic Federated Learning Approach in Quantum Environment to Tackle Quantum Noise [1.2026018242953707]
SpoQFLはノイズ変動に基づくトレーニング戦略を動的に調整する。
実世界のデータセットの実験により、SpotQFLは従来のQFLアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-07-15T20:30:11Z) - Provably Robust Training of Quantum Circuit Classifiers Against Parameter Noise [49.97673761305336]
ノイズは、信頼できる量子アルゴリズムを達成するための大きな障害である。
本稿では,パラメータ化量子回路分類器のロバスト性を高めるための雑音耐性学習理論とアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-24T02:51:34Z) - Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach [36.05085942729295]
本稿では、古典的なNPG推定器で使用されるランダムサンプリングを決定論的勾配推定手法で置き換える量子自然ポリシー勾配(QNPG)アルゴリズムを提案する。
提案したQNPGアルゴリズムは、量子オラクルへのクエリに対する$tildemathcalO(epsilon-1.5)$のサンプル複雑性を達成し、マルコフ決定プロセス(MDP)へのクエリに対する$tildemathcalO(epsilon-2)$の古典的な下界を大幅に改善する。
論文 参考訳(メタデータ) (2025-01-27T17:38:30Z) - Bayesian Quantum Amplitude Estimation [49.1574468325115]
本稿では,量子振幅推定のための雑音対応ベイズアルゴリズムであるBAEを紹介する。
我々は,BAEがハイゼンベルク限界推定を達成し,他の手法と比較した。
論文 参考訳(メタデータ) (2024-12-05T18:09:41Z) - Robustness and Generalization in Quantum Reinforcement Learning via Lipschitz Regularization [2.8445375187526154]
本稿では、RegQPGアルゴリズムと呼ばれる量子ポリシー勾配アプローチの正規化バージョンを提案する。
本稿では、RegQPGによるトレーニングにより、その結果のロバスト性や一般化が向上することを示す。
論文 参考訳(メタデータ) (2024-10-28T15:20:35Z) - FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization [11.673528138087244]
Federated Learning(FL)は、クライアントのデータプライバシを保護すると同時に、クライアントのデータと計算リソースを活用する強力な機械学習パラダイムである。
従来の研究は主にアップリンク通信に重点を置いており、固定ビット量子化法や適応量子化法を用いている。
本研究では,通信オーバヘッドを低減するために,結合アップリンクとダウンリンク適応量子化による包括的アプローチを導入する。
論文 参考訳(メタデータ) (2024-06-26T08:14:23Z) - A Quantum-Classical Collaborative Training Architecture Based on Quantum
State Fidelity [50.387179833629254]
我々は,コ・テンク (co-TenQu) と呼ばれる古典量子アーキテクチャを導入する。
Co-TenQuは古典的なディープニューラルネットワークを41.72%まで向上させる。
他の量子ベースの手法よりも1.9倍も優れており、70.59%少ない量子ビットを使用しながら、同様の精度を達成している。
論文 参考訳(メタデータ) (2024-02-23T14:09:41Z) - QuantumSEA: In-Time Sparse Exploration for Noise Adaptive Quantum
Circuits [82.50620782471485]
QuantumSEAはノイズ適応型量子回路のインタイムスパース探索である。
1)トレーニング中の暗黙の回路容量と(2)雑音の頑健さの2つの主要な目標を達成することを目的としている。
提案手法は, 量子ゲート数の半減と回路実行の2倍の時間節約で, 最先端の計算結果を確立する。
論文 参考訳(メタデータ) (2024-01-10T22:33:00Z) - Quantum Imitation Learning [74.15588381240795]
本稿では、量子優位性を利用してILを高速化する量子模倣学習(QIL)を提案する。
量子行動クローニング(Q-BC)と量子生成逆模倣学習(Q-GAIL)という2つのQILアルゴリズムを開発した。
実験結果から,Q-BCとQ-GAILの両者が,従来のものと同等の性能を達成できることが判明した。
論文 参考訳(メタデータ) (2023-04-04T12:47:35Z) - Optimizing Quantum Federated Learning Based on Federated Quantum Natural
Gradient Descent [17.05322956052278]
本稿では、FQNGD(Federated Quantum Natural descent)という効率的な最適化アルゴリズムを提案する。
アダムやアダグラードのような勾配降下法と比較して、FQNGDアルゴリズムは収束するQFLのトレーニングをはるかに少なくする。
手書き桁分類データセットの実験は、QFLフレームワークにおけるFQNGDの有効性を正当化するものである。
論文 参考訳(メタデータ) (2023-02-27T11:34:16Z) - QuantumNAS: Noise-Adaptive Search for Robust Quantum Circuits [26.130594925642143]
ノイズノイズは、NISQ(Noisy Intermediate-Scale Quantum)コンピュータにおける鍵となる課題である。
可変回路と量子ビットマッピングのノイズ適応型共同研究のための,最初の包括的なフレームワークであるQuantumNASを提案し,実験的に実装した。
QMLタスクでは、QuantumNASは95%以上の2クラス、85%の4クラス、実際の量子コンピュータ上での10クラスの分類精度を初めて証明した。
論文 参考訳(メタデータ) (2021-07-22T17:58:13Z) - Towards fully-fledged quantum and classical communication over deployed
fiber with up-conversion module [47.187609203210705]
本稿では,古典光とQKD信号の共伝搬のためのアップコンバージョン支援受信機に基づく新しい手法を提案し,実証する。
提案手法は,従来の受信機に比べて高い耐雑音性を示し,従来の4dB高電力条件下での秘密鍵の分配を可能にする。
論文 参考訳(メタデータ) (2021-06-09T13:52:27Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Accelerating Deep Reinforcement Learning With the Aid of Partial Model:
Energy-Efficient Predictive Video Streaming [97.75330397207742]
深層強化学習を用いて,モバイルネットワーク上でのエネルギー効率の高いビデオストリーミングのための予測電力割り当てを考案した。
連続状態と行動空間を扱うために、我々はDeep Deterministic Policy gradient (DDPG)アルゴリズムを利用する。
シミュレーションの結果,提案手法は完全大規模チャネル予測に基づいて導出される最適方針に収束することが示された。
論文 参考訳(メタデータ) (2020-03-21T17:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。