論文の概要: Quantum Multi-Agent Reinforcement Learning for Autonomous Mobility
Cooperation
- arxiv url: http://arxiv.org/abs/2308.01519v1
- Date: Thu, 3 Aug 2023 03:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 15:28:18.775520
- Title: Quantum Multi-Agent Reinforcement Learning for Autonomous Mobility
Cooperation
- Title(参考訳): 自律移動協調のための量子マルチエージェント強化学習
- Authors: Soohyun Park, Jae Pyoung Kim, Chanyoung Park, Soyi Jung, Joongheon Kim
- Abstract要約: 本稿ではアクター・クリティカルネットワークの概念に基づく量子MARL(QMARL)アルゴリズムを提案する。
我々のQMARLは、量子超越性による効率的なパラメータ利用と高速収束の点で有益である。
プロジェクション値測度(PVM)と呼ばれる拡張性のための新たな手法が提案されている。
- 参考スコア(独自算出の注目度): 14.606459096293088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For Industry 4.0 Revolution, cooperative autonomous mobility systems are
widely used based on multi-agent reinforcement learning (MARL). However, the
MARL-based algorithms suffer from huge parameter utilization and convergence
difficulties with many agents. To tackle these problems, a quantum MARL (QMARL)
algorithm based on the concept of actor-critic network is proposed, which is
beneficial in terms of scalability, to deal with the limitations in the noisy
intermediate-scale quantum (NISQ) era. Additionally, our QMARL is also
beneficial in terms of efficient parameter utilization and fast convergence due
to quantum supremacy. Note that the reward in our QMARL is defined as task
precision over computation time in multiple agents, thus, multi-agent
cooperation can be realized. For further improvement, an additional technique
for scalability is proposed, which is called projection value measure (PVM).
Based on PVM, our proposed QMARL can achieve the highest reward, by reducing
the action dimension into a logarithmic-scale. Finally, we can conclude that
our proposed QMARL with PVM outperforms the other algorithms in terms of
efficient parameter utilization, fast convergence, and scalability.
- Abstract(参考訳): 産業4.0革命では,マルチエージェント強化学習(marl)に基づく協調型自律移動システムが広く利用されている。
しかし、MARLに基づくアルゴリズムは、多くのエージェントのパラメータ利用と収束困難に悩まされている。
これらの問題に対処するために,アクタ-クリティックネットワークの概念に基づく量子マル(qmarl)アルゴリズムが提案されている。
さらに、QMARLは、量子超越性による効率的なパラメータ利用と高速収束の観点からも有益である。
QMARLの報酬は、複数のエージェントの計算時間に対するタスク精度として定義されるので、マルチエージェント協調を実現することができる。
さらなる改善のために、プロジェクション値測度(PVM)と呼ばれる拡張性のための追加技術を提案する。
PVMに基づいて,提案したQMARLは,動作次元を対数スケールに減らし,最も高い報酬を得ることができる。
最後に、PVMを用いた提案QMARLは、効率的なパラメータ利用、高速収束、スケーラビリティの観点から、他のアルゴリズムよりも優れていると結論付けることができる。
関連論文リスト
- KANQAS: Kolmogorov-Arnold Network for Quantum Architecture Search [0.0]
量子状態準備と量子化学におけるコルモゴロフ・アルノルドネットワーク(KAN)の実用性を評価する。
量子状態の準備において、我々の結果は、ノイズのないシナリオにおいて、マルチキュービットの最大絡み合う状態を生成する最適量子回路構成の確率は、マルチレイア知覚(MLP)よりも2〜5倍高いことを示している。
量子化学問題に対処するために,従来の構造ではなく,KAN(Curriculum Reinforcement Learning)とKAN構造を統合することで,最近提案されたQASアルゴリズムを強化する。
論文 参考訳(メタデータ) (2024-06-25T15:17:01Z) - Quantum Multi-Agent Reinforcement Learning for Aerial Ad-hoc Networks [0.19791587637442667]
本稿では,航空通信のユースケースを提示し,それを解くためのハイブリッド量子古典型MLアルゴリズムを提案する。
その結果,古典的アルゴリズムに匹敵する量子化解の性能はわずかに向上した。
これらの有望な結果は、産業関連複雑なユースケースに対するQMARLの可能性を示している。
論文 参考訳(メタデータ) (2024-04-26T15:57:06Z) - Characterizing Speed Performance of Multi-Agent Reinforcement Learning [5.313762764969945]
MARL(Multi-Agent Reinforcement Learning)は、大規模AIシステムや、スマートグリッドや監視などビッグデータアプリケーションにおいて、大きな成功を収めています。
MARLアルゴリズムの既存の進歩は、エージェント間協調のための様々なメカニズムを導入して得られる報酬の改善に焦点を当てている。
我々は、MARL実装において、速度性能(すなわち、レイテンシ境界スループット)を重要な指標として分析する。
論文 参考訳(メタデータ) (2023-09-13T17:26:36Z) - Scaling Limits of Quantum Repeater Networks [62.75241407271626]
量子ネットワーク(QN)は、セキュアな通信、強化されたセンシング、効率的な分散量子コンピューティングのための有望なプラットフォームである。
量子状態の脆弱な性質のため、これらのネットワークはスケーラビリティの観点から大きな課題に直面している。
本稿では,量子リピータネットワーク(QRN)のスケーリング限界について解析する。
論文 参考訳(メタデータ) (2023-05-15T14:57:01Z) - Quantum Annealing for Single Image Super-Resolution [86.69338893753886]
単一画像超解像(SISR)問題を解くために,量子コンピューティングに基づくアルゴリズムを提案する。
提案したAQCアルゴリズムは、SISRの精度を維持しつつ、古典的なアナログよりも向上したスピードアップを実現する。
論文 参考訳(メタデータ) (2023-04-18T11:57:15Z) - Visual Simulation Software Demonstration for Quantum Multi-Drone
Reinforcement Learning [14.299752746509348]
本稿では,自律型マルチドローンシステムを制御する新しいQMARLアルゴリズムのための視覚シミュレーションソフトウェアフレームワークを提案する。
提案するQMARLフレームワークは,従来のMARLよりもトレーニング可能なパラメータが少なく,適切な報酬収束とサービス品質性能を実現する。
論文 参考訳(メタデータ) (2022-11-24T06:08:24Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Adiabatic Quantum Computing for Multi Object Tracking [170.8716555363907]
マルチオブジェクト追跡(MOT)は、オブジェクト検出が時間を通して関連付けられているトラッキング・バイ・検出のパラダイムにおいて、最もよくアプローチされる。
これらの最適化問題はNPハードであるため、現在のハードウェア上の小さなインスタンスに対してのみ正確に解決できる。
本手法は,既成整数計画法を用いても,最先端の最適化手法と競合することを示す。
論文 参考訳(メタデータ) (2022-02-17T18:59:20Z) - Softmax with Regularization: Better Value Estimation in Multi-Agent
Reinforcement Learning [72.28520951105207]
q$-learningの過大評価は、シングルエージェント強化学習で広く研究されている重要な問題である。
ベースラインから逸脱する大きな関節動作値をペナライズする,新たな正規化ベースの更新方式を提案する。
本手法は,StarCraft IIマイクロマネジメントの課題に対して,一貫した性能向上を実現する。
論文 参考訳(メタデータ) (2021-03-22T14:18:39Z) - Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。
我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。
低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文 参考訳(メタデータ) (2020-11-29T03:53:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。