論文の概要: Q-ARDNS-Multi: A Multi-Agent Quantum Reinforcement Learning Framework with Meta-Cognitive Adaptation for Complex 3D Environments
- arxiv url: http://arxiv.org/abs/2506.03205v1
- Date: Mon, 02 Jun 2025 20:43:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:13.945009
- Title: Q-ARDNS-Multi: A Multi-Agent Quantum Reinforcement Learning Framework with Meta-Cognitive Adaptation for Complex 3D Environments
- Title(参考訳): Q-ARDNS-Multi:複雑な3次元環境に対するメタ認知適応を用いたマルチエージェント量子強化学習フレームワーク
- Authors: Umberto Gonçalves de Sousa,
- Abstract要約: Q-ARDNS-Multiは高度なマルチエージェント量子強化学習フレームワークである。
量子回路をRYゲート、メタ認知適応、マルチエージェント調整機構と統合する。
Q-ARDNS-Multiは、ロボット工学、自律ナビゲーション、不確実性の下での意思決定において、スケーラブルで人間らしいアプローチを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents Q-ARDNS-Multi, an advanced multi-agent quantum reinforcement learning (QRL) framework that extends the ARDNS-FN-Quantum model, where Q-ARDNS-Multi stands for "Quantum Adaptive Reward-Driven Neural Simulator - Multi-Agent". It integrates quantum circuits with RY gates, meta-cognitive adaptation, and multi-agent coordination mechanisms for complex 3D environments. Q-ARDNS-Multi leverages a 2-qubit quantum circuit for action selection, a dual-memory system inspired by human cognition, a shared memory module for agent cooperation, and adaptive exploration strategies modulated by reward variance and intrinsic motivation. Evaluated in a $10 \times 10 \times 3$ GridWorld environment with two agents over 5000 episodes, Q-ARDNS-Multi achieves success rates of 99.6\% and 99.5\% for Agents 0 and 1, respectively, outperforming Multi-Agent Deep Deterministic Policy Gradient (MADDPG) and Soft Actor-Critic (SAC) in terms of success rate, stability, navigation efficiency, and collision avoidance. The framework records mean rewards of $-304.2891 \pm 756.4636$ and $-295.7622 \pm 752.7103$, averaging 210 steps to goal, demonstrating its robustness in dynamic settings. Comprehensive analyses, including learning curves, reward distributions, statistical tests, and computational efficiency evaluations, highlight the contributions of quantum circuits and meta-cognitive adaptation. By bridging quantum computing, cognitive science, and multi-agent RL, Q-ARDNS-Multi offers a scalable, human-like approach for applications in robotics, autonomous navigation, and decision-making under uncertainty.
- Abstract(参考訳): 本稿では、ARDNS-FN-Quantumモデルを拡張した高度なマルチエージェント量子強化学習(QRL)フレームワークであるQ-ARDNS-Multiについて述べる。
量子回路とRYゲート、メタ認知適応、複雑な3D環境のためのマルチエージェント調整機構を統合する。
Q-ARDNS-Multiは、アクション選択のための2量子ビット量子回路、人間の認知にインスパイアされたデュアルメモリシステム、エージェント協調のための共有メモリモジュール、報酬分散と本質的なモチベーションによって変調された適応探索戦略を利用する。
10 \times 10 \times 3$ GridWorld Environment with two agent over 5000 episodes, Q-ARDNS-Multi achieve success rate of 99.6\% and 99.5\% for Agents 0 and 1, out outperform Multi-Agent Deep Deterministic Policy Gradient (MADDPG) and Soft Actor-Critic (SAC) in terms of success rate, stability, navigation efficiency and collision avoidance。
このフレームワークの記録は、304.2891 \pm 756.4636$と295.7622 \pm 752.7103$の平均210ステップを目標としており、動的設定における堅牢性を示している。
学習曲線、報酬分布、統計テスト、計算効率評価を含む包括的な分析は、量子回路とメタ認知適応の寄与を強調している。
量子コンピューティング、認知科学、マルチエージェントRLをブリッジすることによって、Q-ARDNS-Multiは、ロボット工学、自律ナビゲーション、不確実性の下での意思決定において、スケーラブルで人間的なアプローチを提供する。
関連論文リスト
- Enhancing variational quantum algorithms by balancing training on classical and quantum hardware [1.8377902806196762]
変分量子アルゴリズム(VQA)は、量子ユーティリティや利点への短期的なルートを提供する可能性がある。
VQAは、基底状態推定のような様々なタスクに対して提案されている。
量子ハードウェアのトレーサビリティとリソースコストには、依然として大きな課題がある。
論文 参考訳(メタデータ) (2025-03-20T17:17:58Z) - Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer [62.01554688056335]
マルチエージェント設定における過大評価は、比較的ほとんど注目されていない。
本稿では,超ネットワーク重みとバイアスに関する新しいハイパーネット正規化器を提案し,オンライングローバルQ-ネットワークの最適化を制約し,過大な推定の蓄積を防止する。
論文 参考訳(メタデータ) (2025-02-04T05:14:58Z) - Multi-Agent Quantum Reinforcement Learning using Evolutionary Optimization [6.3443033704469]
我々は、勾配のない量子強化学習のための既存のアプローチを構築し、マルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的バリエーションを提案する。
我々は、トレーニング可能なパラメータの量に類似したニューラルネットワークと比較して、変動量子回路のアプローチが大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-11-09T17:45:32Z) - An Empirical Study of Multimodal Model Merging [148.48412442848795]
モデルマージは、異なるタスクでトレーニングされた複数のモデルを融合してマルチタスクソリューションを生成するテクニックである。
我々は、モダリティ固有のアーキテクチャのビジョン、言語、およびクロスモーダルトランスフォーマーをマージできる新しい目標に向けて研究を行っている。
本稿では,重み間の距離を推定し,マージ結果の指標となる2つの指標を提案する。
論文 参考訳(メタデータ) (2023-04-28T15:43:21Z) - Quantum Multi-Agent Actor-Critic Neural Networks for Internet-Connected
Multi-Robot Coordination in Smart Factory Management [14.396716863428882]
本稿では、QRLから量子マルチエージェント強化学習(QMARL)を実装することにより、さらに実現されるQRLの可能性を検証する。
スマートファクトリアプリケーションにおけるインターネット接続型自律型マルチロボット制御と協調性について提案する。
シミュレーションでは、提案したQMARLベースの自律型マルチロボット制御と調整が、他のフレームワークよりも優れていることを裏付けている。
論文 参考訳(メタデータ) (2023-01-04T04:28:39Z) - QSAN: A Near-term Achievable Quantum Self-Attention Network [73.15524926159702]
SAM(Self-Attention Mechanism)は機能の内部接続を捉えるのに長けている。
短期量子デバイスにおける画像分類タスクに対して,新しい量子自己注意ネットワーク(QSAN)を提案する。
論文 参考訳(メタデータ) (2022-07-14T12:22:51Z) - Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann
Machines [2.015864965523243]
我々は、より困難な問題を解決するために、オリジナルの概念の拡張を提案する。
我々は、経験的なリプレイバッファを追加し、ターゲットとポリシーの値を近似するために異なるネットワークを使用します。
量子サンプリングは、強化学習タスクには有望な方法であることが証明されているが、現在はQPUサイズによって制限されている。
論文 参考訳(メタデータ) (2021-09-22T17:59:24Z) - Realization of arbitrary doubly-controlled quantum phase gates [62.997667081978825]
本稿では,最適化問題における短期量子優位性の提案に着想を得た高忠実度ゲートセットを提案する。
3つのトランペット四重項のコヒーレントな多レベル制御を編成することにより、自然な3量子ビット計算ベースで作用する決定論的連続角量子位相ゲートの族を合成する。
論文 参考訳(メタデータ) (2021-08-03T17:49:09Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。