論文の概要: Multi-Agent Quantum Reinforcement Learning using Evolutionary
Optimization
- arxiv url: http://arxiv.org/abs/2311.05546v2
- Date: Sat, 13 Jan 2024 10:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 00:45:16.965677
- Title: Multi-Agent Quantum Reinforcement Learning using Evolutionary
Optimization
- Title(参考訳): 進化最適化を用いたマルチエージェント量子強化学習
- Authors: Michael K\"olle, Felix Topp, Thomy Phan, Philipp Altmann, Jonas
N\"u{\ss}lein, Claudia Linnhoff-Popien
- Abstract要約: 我々は、勾配のない量子強化学習のための既存のアプローチを構築し、マルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的バリエーションを提案する。
我々は、トレーニング可能なパラメータの量に類似したニューラルネットワークと比較して、変動量子回路のアプローチが大幅に優れていることを示す。
- 参考スコア(独自算出の注目度): 7.305065320738301
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-Agent Reinforcement Learning is becoming increasingly more important in
times of autonomous driving and other smart industrial applications.
Simultaneously a promising new approach to Reinforcement Learning arises using
the inherent properties of quantum mechanics, reducing the trainable parameters
of a model significantly. However, gradient-based Multi-Agent Quantum
Reinforcement Learning methods often have to struggle with barren plateaus,
holding them back from matching the performance of classical approaches. We
build upon an existing approach for gradient free Quantum Reinforcement
Learning and propose three genetic variations with Variational Quantum Circuits
for Multi-Agent Reinforcement Learning using evolutionary optimization. We
evaluate our genetic variations in the Coin Game environment and also compare
them to classical approaches. We showed that our Variational Quantum Circuit
approaches perform significantly better compared to a neural network with a
similar amount of trainable parameters. Compared to the larger neural network,
our approaches archive similar results using $97.88\%$ less parameters.
- Abstract(参考訳): 自動運転やその他のスマート産業アプリケーションにおいて、マルチエージェント強化学習はますます重要になりつつある。
同時に、強化学習に対する有望な新しいアプローチは、量子力学の固有の性質を使い、モデルのトレーニング可能なパラメータを著しく削減する。
しかし、勾配に基づくマルチエージェント量子強化学習法はしばしば不毛高原に苦しむことがあり、古典的アプローチのパフォーマンスと一致しない。
グラデーションフリー量子強化学習のための既存のアプローチを構築し,進化最適化を用いたマルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的変異を提案する。
我々は,コインゲーム環境における遺伝的変異を評価し,古典的アプローチと比較する。
その結果,同量の学習可能なパラメータを持つニューラルネットワークと比較して,変動量子回路アプローチが有意に優れていることがわかった。
より大きなニューラルネットワークと比較すると、同様の結果を97.88\%より少ないパラメータでアーカイブする手法がある。
関連論文リスト
- Towards Efficient Quantum Hybrid Diffusion Models [68.43405413443175]
本稿では,量子ハイブリッド拡散モデルの設計手法を提案する。
量子コンピューティングの優れた一般化と古典的ネットワークのモジュラリティを組み合わせた2つのハイブリダイゼーション手法を提案する。
論文 参考訳(メタデータ) (2024-02-25T16:57:51Z) - Evolutionary-enhanced quantum supervised learning model [0.0]
本研究は,進化的アンサッツフリー教師あり学習モデルを提案する。
パラメタライズド回路とは対照的に、われわれのモデルはエリート的手法によって進化する可変位相を持つ回路を用いる。
我々のフレームワークは不毛の台地を避けることに成功し、結果としてモデルの精度が向上した。
論文 参考訳(メタデータ) (2023-11-14T11:08:47Z) - Quantum machine learning for image classification [62.997667081978825]
我々のハイブリッド量子アプローチの1つは、MNISTデータセットで99%以上の顕著な精度を示す。
要約して,本研究は,量子機械学習技術を用いた画像認識と分類の改善に関する継続的な研究に寄与する。
論文 参考訳(メタデータ) (2023-04-18T18:23:20Z) - Quantum Deep Hedging [10.243020478772056]
我々は、深層強化学習が現実世界に強力な枠組みを提供するヘッジの問題を考察する。
我々はポリシー探索と分布型アクター批判アルゴリズムに基づく量子強化学習法を開発した。
トラップイオン量子プロセッサ上で提案したモデルの実装に成功した。
論文 参考訳(メタデータ) (2023-03-29T10:42:50Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Copula-based Risk Aggregation with Trapped Ion Quantum Computers [1.541403735141431]
コプラは、合同確率分布をモデル化するための数学的ツールである。
コプラを最大絡み合った量子状態として表現できることの最近の発見は、実用的な量子優位性に対する有望なアプローチを明らかにしている。
シミュレータと最先端のイオン量子コンピュータ上での回路設計と精度の異なるQCBMのトレーニングについて検討する。
論文 参考訳(メタデータ) (2022-06-23T18:39:30Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann
Machines [2.015864965523243]
我々は、より困難な問題を解決するために、オリジナルの概念の拡張を提案する。
我々は、経験的なリプレイバッファを追加し、ターゲットとポリシーの値を近似するために異なるネットワークを使用します。
量子サンプリングは、強化学習タスクには有望な方法であることが証明されているが、現在はQPUサイズによって制限されている。
論文 参考訳(メタデータ) (2021-09-22T17:59:24Z) - Optimizing Quantum Variational Circuits with Deep Reinforcement Learning [0.0]
量子変動回路における勾配に基づく最適化ルーチンを強化するため, 深部強化学習における現代的手法の可能性を評価する。
強化学習の強化は雑音環境における勾配降下より一貫して優れることがわかった。
論文 参考訳(メタデータ) (2021-09-07T16:48:39Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。