論文の概要: MADQRL: Distributed Quantum Reinforcement Learning Framework for Multi-Agent Environments
- arxiv url: http://arxiv.org/abs/2604.11131v1
- Date: Mon, 13 Apr 2026 07:44:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.406327
- Title: MADQRL: Distributed Quantum Reinforcement Learning Framework for Multi-Agent Environments
- Title(参考訳): MADQRL:マルチエージェント環境のための分散量子強化学習フレームワーク
- Authors: Abhishek Sawaika, Samuel Yen-Chi Chen, Udaya Parampalli, Rajkumar Buyya,
- Abstract要約: 強化学習(Reinforcement Learning, RL)は、実生活のユースケースから学ぶための最も実践的な方法の1つである。
本稿では,複数のエージェントが独立して学習するQRLのための分散フレームワークを提案する。
動作と観測空間が不連続な環境でも有効であるが,妥当な近似で他のシステムにも拡張できる。
- 参考スコア(独自算出の注目度): 25.155719953156723
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reinforcement learning (RL) is one of the most practical ways to learn from real-life use-cases. Motivated from the cognitive methods used by humans makes it a widely acceptable strategy in the field of artificial intelligence. Most of the environments used for RL are often high-dimensional, and traditional RL algorithms becomes computationally expensive and challenging to effectively learn from such systems. Recent advancements in practical demonstration of quantum computing (QC) theories, such as compact encoding, enhanced representation and learning algorithms, random sampling, or the inherent stochastic nature of quantum systems, have opened up new directions to tackle these challenges. Quantum reinforcement learning (QRL) is seeking significant traction over the past few years. However, the current state of quantum hardware is not enough to cater for such high-dimensional environments with complex multi-agent setup. To tackle this issue, we propose a distributed framework for QRL where multiple agents learn independently, distributing the load of joint training from individual machines. Our method works well for environments with disjoint sets of action and observation spaces, but can also be extended to other systems with reasonable approximations. We analyze the proposed method on cooperative-pong environment and our results indicate ~10% improvement from other distribution strategies, and ~5% improvement from classical models of policy representation.
- Abstract(参考訳): 強化学習(Reinforcement Learning, RL)は、実生活のユースケースから学ぶための最も実践的な方法の1つである。
人間による認知的手法から動機付けられたこの戦略は、人工知能の分野で広く受け入れられる戦略となっている。
RLのほとんどの環境は高次元であり、従来のRLアルゴリズムは計算コストが高くなり、そのようなシステムから効果的に学習することが困難になる。
量子コンピューティング(QC)理論の実践的な実証の進歩は、コンパクトエンコーディング、拡張表現と学習アルゴリズム、ランダムサンプリング、あるいは量子システムの固有の確率的性質などによって、これらの課題に取り組むための新たな方向性が開けている。
量子強化学習(QRL)はここ数年で大きな進歩を遂げている。
しかし、量子ハードウェアの現在の状態は、複雑なマルチエージェントセットアップを持つような高次元環境に対応するには不十分である。
この問題に対処するため,複数のエージェントが独立して学習し,個々のマシンから共同学習の負荷を分散するQRLの分散フレームワークを提案する。
動作と観測空間が不連続な環境でも有効であるが,妥当な近似で他のシステムにも拡張できる。
提案手法を協調ポン環境において解析した結果,他の流通戦略から約10%改善し,政策表現の古典的モデルから約5%改善したことが示された。
関連論文リスト
- Variational Quantum Circuit-Based Reinforcement Learning for Dynamic Portfolio Optimization [7.349651640835185]
本稿では,変分量子回路に基づく動的ポートフォリオ最適化問題に対する量子強化学習ソリューションを提案する。
我々の量子エージェントは、古典的なディープRLモデルに匹敵するリスク調整性能を達成できることを示す。
論文 参考訳(メタデータ) (2026-01-20T15:17:24Z) - Sample-Efficient Neurosymbolic Deep Reinforcement Learning [49.60927398960061]
本稿では,背景記号知識を統合し,サンプル効率を向上させるニューロシンボリックディープRL手法を提案する。
オンライン推論は2つのメカニズムを通じてトレーニングプロセスのガイドを行う。
我々は、最先端の報奨機ベースラインよりも優れた性能を示す。
論文 参考訳(メタデータ) (2026-01-06T09:28:53Z) - Quantum-Train-Based Distributed Multi-Agent Reinforcement Learning [5.673361333697935]
量子トレインに基づく分散マルチエージェント強化学習(Dist-QTRL)
量子トレインに基づく分散マルチエージェント強化学習(Dist-QTRL)を紹介する。
論文 参考訳(メタデータ) (2024-12-12T00:51:41Z) - Stochastic Q-learning for Large Discrete Action Spaces [79.1700188160944]
離散的な行動空間を持つ複雑な環境では、強化学習(RL)において効果的な意思決定が重要である
我々は、$n$アクションの集合全体を最適化するのとは対照的に、おそらく$mathcalO(log(n)$)$のような変数の集合のみを考える。
提示された値ベースのRL手法には、Q-learning、StochDQN、StochDDQNなどが含まれる。
論文 参考訳(メタデータ) (2024-05-16T17:58:44Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Unifying Synergies between Self-supervised Learning and Dynamic
Computation [53.66628188936682]
SSLとDCのパラダイム間の相互作用に関する新しい視点を提示する。
SSL設定において、スクラッチから高密度かつゲートされたサブネットワークを同時に学習することは可能であることを示す。
密集エンコーダとゲートエンコーダの事前学習における共進化は、良好な精度と効率のトレードオフをもたらす。
論文 参考訳(メタデータ) (2023-01-22T17:12:58Z) - Asynchronous training of quantum reinforcement learning [0.8702432681310399]
変分量子回路(VQC)による量子RLエージェント構築の先導的手法
本稿では,QRLエージェントを非同期トレーニングすることで,この問題に対処する。
検討したタスクにおいて,QRLエージェントの非同期トレーニングが性能に匹敵するか,優れているかを数値シミュレーションで示す。
論文 参考訳(メタデータ) (2023-01-12T15:54:44Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Quantum agents in the Gym: a variational quantum algorithm for deep
Q-learning [0.0]
本稿では、離散的かつ連続的な状態空間に対するRLタスクを解くために使用できるパラメタライズド量子回路(PQC)のトレーニング手法を提案する。
量子Q学習エージェントのどのアーキテクチャ選択が、特定の種類の環境をうまく解決するのに最も重要であるかを検討する。
論文 参考訳(メタデータ) (2021-03-28T08:57:22Z) - SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep
Reinforcement Learning [102.78958681141577]
SUNRISEは単純な統一アンサンブル法であり、様々な非政治的な深層強化学習アルゴリズムと互換性がある。
SUNRISEは, (a) アンサンブルに基づく重み付きベルマンバックアップと, (b) 最上位の自信境界を用いて行動を選択する推論手法を統合し, 効率的な探索を行う。
論文 参考訳(メタデータ) (2020-07-09T17:08:44Z) - The Adversarial Resilience Learning Architecture for AI-based Modelling,
Exploration, and Operation of Complex Cyber-Physical Systems [0.0]
本稿では、複雑な環境チェックとレジリエントな操作に対する新しいアプローチを定式化する、ARL(Adversarial Learning)の概念について述べる。
ARLのクインテッサンスは、システムを探究し、ドメインの知識なしに互いに訓練するエージェントの両方にある。
本稿では、モデルベースDRLベースのアルゴリズムと同様に、広範囲のモデルフリーを使用できるARLソフトウェアアーキテクチャを紹介する。
論文 参考訳(メタデータ) (2020-05-27T19:19:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。