論文の概要: Q-SpiRL: Quantum Spiking Reinforcement Learning for Adaptive Robot Navigation
- arxiv url: http://arxiv.org/abs/2605.20801v1
- Date: Wed, 20 May 2026 06:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.536174
- Title: Q-SpiRL: Quantum Spiking Reinforcement Learning for Adaptive Robot Navigation
- Title(参考訳): Q-SpiRL:適応型ロボットナビゲーションのための量子スパイキング強化学習
- Authors: Mohamed Khair Altrabulsi, Nouhaila Innan, Alberto Marchisio, Muhammad Kashif, Muhammad Shafique,
- Abstract要約: 本稿では,障害物認識型ロボットナビゲーションのための量子スパイキング強化学習フレームワークQ-SpiRLを提案する。
このフレームワークは5つのエージェントファミリーを開発、評価する。
スパイクベースの時間処理と変分量子特徴変換を組み合わせる。
その結果,QSNNはタスク完了,軌道の効率,動きの滑らかさのトレードオフが最強であることが示唆された。
- 参考スコア(独自算出の注目度): 2.1702673021505245
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive robot navigation in dynamic environments requires policies that can reach the target reliably while producing efficient and stable trajectories. This paper presents Q-SpiRL, a quantum spiking reinforcement learning framework for obstacle-aware robot navigation. The framework develops and evaluates five agent families: tabular Q-learning, classical MLP, classical SNN, quantum-enhanced MLP (QMLP), and quantum-enhanced spiking neural network (QSNN). While all models are implemented under a unified training and evaluation pipeline, the QSNN is the central architecture of interest, as it combines spike-based temporal processing with variational quantum feature transformation. Experiments are conducted across three grid-world environments of increasing size, namely 20x20, 30x30, and 40x40, with both static and dynamic obstacles. Performance is assessed using success rate, success-weighted path length, path length, and turn rate under deterministic inference. Results show that QSNN achieves the strongest overall trade-off between task completion, trajectory efficiency, and motion smoothness, reaching up to 99% success rate while maintaining high path efficiency in the most challenging setting. Execution on IBM quantum hardware further demonstrates the feasibility of deploying the proposed hybrid policy under real-device conditions.
- Abstract(参考訳): 動的環境における適応型ロボットナビゲーションは、効率的で安定した軌道を生産しながら、目標に確実に到達できるポリシーを必要とする。
本稿では,障害物認識型ロボットナビゲーションのための量子スパイキング強化学習フレームワークQ-SpiRLを提案する。
このフレームワークは、表型Q-ラーニング、古典的MLP、古典的SNN、量子強化MLP(QMLP)、量子強化スパイキングニューラルネットワーク(QSNN)の5つのエージェントファミリーを開発し評価する。
全てのモデルは統合されたトレーニングと評価パイプラインの下で実装されているが、QSNNはスパイクベースの時間的処理と変分量子特徴変換を組み合わせることで、関心の中心的なアーキテクチャである。
実験は、20x20、30x30、40x40という、サイズが大きくなる3つのグリッドワールド環境で行われ、静的障害物と動的障害物の両方がある。
成功率、成功重み付きパス長、パス長、ターンレートを決定論的推論で評価する。
その結果,QSNNはタスク完了,軌道効率,運動のスムーズさのトレードオフが最強であり,高い経路効率を維持しつつ,最大99%の成功率を達成した。
IBM量子ハードウェアの実行は、提案されたハイブリッドポリシーを実際のデバイス条件下で展開する可能性をさらに実証する。
関連論文リスト
- EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Learning to steer quantum many-body dynamics with tree optimization [7.777344558557047]
我々は,多体スピンシステム上での最適量子制御のためのパルスシーケンスの設計を学習するAIフレームワークを提案する。
本フレームワークでは,非直観的構造を示す900以上のハイパフォーマンスシーケンスを同定する。
ダイヤモンドスピンアンサンブルの実験では、最高のAI設計シーケンスが200マイクロ秒を超えるコヒーレンス時間を達成することが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:30:12Z) - Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - TensorHyper-VQC: A Tensor-Train-Guided Hypernetwork for Robust and Scalable Variational Quantum Computing [50.95799256262098]
量子機械学習のための新しいテンソルトレイン(TT)誘導ハイパーネットワークフレームワークであるHyper-VQCを紹介する。
我々のフレームワークは、量子回路パラメータの生成を古典的なTTネットワークに委譲し、量子ハードウェアから最適化を効果的に分離する。
これらの結果から、Hyper-VQCは、短期デバイス上での実用的な量子機械学習を促進するためのスケーラブルで耐雑音性のあるフレームワークとして位置づけられる。
論文 参考訳(メタデータ) (2025-08-01T23:37:55Z) - QAS-QTNs: Curriculum Reinforcement Learning-Driven Quantum Architecture Search for Quantum Tensor Networks [6.12923730892552]
本稿では,ハイブリッド量子強化学習と量子カリキュラム学習戦略を用いた新しいフレームワークを提案する。
我々は、最先端の古典的強化学習アルゴリズムを4つの量子化学習アルゴリズムと比較した。
実験の結果、量子化RLは古典的手法よりも著しく優れていた。
論文 参考訳(メタデータ) (2025-07-16T08:12:01Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [50.95799256262098]
変分量子回路(VQC)は量子機械学習を約束するが、表現性、訓練性、耐雑音性の課題に直面している。
本稿では,VQCが学習中に古典多層パーセプトロンの第一層重みを生成するハイブリッドアーキテクチャであるVQC-MLPNetを提案する。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - Quantum-Enhanced LLM Efficient Fine Tuning [25.45732471566526]
Low-Rank Adaptation (LoRA)は、低ランク行列近似による事前学習言語モデルの効率的な微調整を可能にする。
本稿では,量子ニューラルネットワークとテンソルネットワークを統合するパラメータ効率の高い微調整法である量子ハイブリッド適応(QTHA)を提案する。
実験により、QTHAはLoRAの非効率な微調整に匹敵する性能を達成することが示された。
論文 参考訳(メタデータ) (2025-03-17T03:59:26Z) - FL-QDSNNs: Federated Learning with Quantum Dynamic Spiking Neural Networks [2.5435687567731926]
FL-QDSNN(Federated Learning-Quantum Dynamic Spiking Neural Networks)を提案する。
FL-QDSNNは、非IIDクライアントデータに対する高い予測精度を維持するプライバシー保護フレームワークである。
その鍵となる革新は、局所的なデータドリフトが追加表現性を必要とする場合にのみ量子ゲートをトリガーする動的閾値スパイキング機構である。
論文 参考訳(メタデータ) (2024-12-03T09:08:33Z) - KANQAS: Kolmogorov-Arnold Network for Quantum Architecture Search [0.0]
我々は量子探索(QAS)アルゴリズムでKAN(Kolmogorov-Arnold Network)を用いて、量子状態の準備と量子化学のタスクにおける効率を解析する。
量子状態調製では、ノイズのないシナリオでは、成功確率はロバストネスの2倍から5倍であることを示す。
量子化学問題に対処するため,最近提案されたQASアルゴリズムを,KAN構造とカリキュラム強化学習を統合して拡張する。
論文 参考訳(メタデータ) (2024-06-25T15:17:01Z) - Quantum circuit architecture search for variational quantum algorithms [88.71725630554758]
本稿では、QAS(Quantum Architecture Search)と呼ばれるリソースと実行時の効率的なスキームを提案する。
QASは、よりノイズの多い量子ゲートを追加することで得られる利点と副作用のバランスをとるために、自動的にほぼ最適アンサッツを求める。
数値シミュレータと実量子ハードウェアの両方に、IBMクラウドを介してQASを実装し、データ分類と量子化学タスクを実現する。
論文 参考訳(メタデータ) (2020-10-20T12:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。