Fugu-MT 論文翻訳(概要): Multi-Agent Quantum Reinforcement Learning using Evolutionary Optimization

論文の概要: Multi-Agent Quantum Reinforcement Learning using Evolutionary Optimization

arxiv url: http://arxiv.org/abs/2311.05546v2
Date: Sat, 13 Jan 2024 10:59:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-18 00:45:16.965677
Title: Multi-Agent Quantum Reinforcement Learning using Evolutionary Optimization
Title（参考訳）: 進化最適化を用いたマルチエージェント量子強化学習
Authors: Michael K\"olle, Felix Topp, Thomy Phan, Philipp Altmann, Jonas N\"u{\ss}lein, Claudia Linnhoff-Popien
Abstract要約: 我々は、勾配のない量子強化学習のための既存のアプローチを構築し、マルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的バリエーションを提案する。我々は、トレーニング可能なパラメータの量に類似したニューラルネットワークと比較して、変動量子回路のアプローチが大幅に優れていることを示す。
参考スコア（独自算出の注目度）: 7.305065320738301
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-Agent Reinforcement Learning is becoming increasingly more important in times of autonomous driving and other smart industrial applications. Simultaneously a promising new approach to Reinforcement Learning arises using the inherent properties of quantum mechanics, reducing the trainable parameters of a model significantly. However, gradient-based Multi-Agent Quantum Reinforcement Learning methods often have to struggle with barren plateaus, holding them back from matching the performance of classical approaches. We build upon an existing approach for gradient free Quantum Reinforcement Learning and propose three genetic variations with Variational Quantum Circuits for Multi-Agent Reinforcement Learning using evolutionary optimization. We evaluate our genetic variations in the Coin Game environment and also compare them to classical approaches. We showed that our Variational Quantum Circuit approaches perform significantly better compared to a neural network with a similar amount of trainable parameters. Compared to the larger neural network, our approaches archive similar results using $97.88\%$ less parameters.
Abstract（参考訳）: 自動運転やその他のスマート産業アプリケーションにおいて、マルチエージェント強化学習はますます重要になりつつある。同時に、強化学習に対する有望な新しいアプローチは、量子力学の固有の性質を使い、モデルのトレーニング可能なパラメータを著しく削減する。しかし、勾配に基づくマルチエージェント量子強化学習法はしばしば不毛高原に苦しむことがあり、古典的アプローチのパフォーマンスと一致しない。グラデーションフリー量子強化学習のための既存のアプローチを構築し,進化最適化を用いたマルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的変異を提案する。我々は,コインゲーム環境における遺伝的変異を評価し,古典的アプローチと比較する。その結果,同量の学習可能なパラメータを持つニューラルネットワークと比較して,変動量子回路アプローチが有意に優れていることがわかった。より大きなニューラルネットワークと比較すると、同様の結果を97.88\%より少ないパラメータでアーカイブする手法がある。

関連論文リスト

Provably Robust Training of Quantum Circuit Classifiers Against Parameter Noise [49.97673761305336]
ノイズは、信頼できる量子アルゴリズムを達成するための大きな障害である。本稿では,パラメータ化量子回路分類器のロバスト性を高めるための雑音耐性学習理論とアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-05-24T02:51:34Z)
Leveraging Pre-Trained Neural Networks to Enhance Machine Learning with Variational Quantum Circuits [48.33631905972908]
我々は、事前学習されたニューラルネットワークを用いて変分量子回路(VQC)を強化する革新的なアプローチを導入する。この手法は近似誤差をキュービット数から効果的に分離し、制約条件の必要性を除去する。我々の結果はヒトゲノム解析などの応用にまで拡張され、我々のアプローチの幅広い適用性を示している。
論文参考訳（メタデータ） (2024-11-13T12:03:39Z)
Compact Multi-Threshold Quantum Information Driven Ansatz For Strongly Interactive Lattice Spin Models [0.0]
近似量子相互情報(QMI)に基づくアンザッツ建築の体系的手順を提案する。提案手法は,QMI値に基づいて各層の量子ビット対が選択される層状アンサッツを生成し,より効率的な状態生成と最適化ルーチンを実現する。その結果,Multi-QIDA法は高い精度を維持しながら計算複雑性を低減し,格子スピンモデルにおける量子シミュレーションに有望なツールであることがわかった。
論文参考訳（メタデータ） (2024-08-05T17:07:08Z)
Architectural Influence on Variational Quantum Circuits in Multi-Agent Reinforcement Learning: Evolutionary Strategies for Optimization [5.7918970571149835]
本稿では,ゲートベース,層ベース,プロトタイプベースの概念を用いて量子回路を変更・再結合する手法を提案する。本研究は,変異のみの戦略とゲートベースアプローチに最適な性能を示す。特に,コインゲーム環境での評価において,より優れたスコア,より高い総数,自己のコイン,そして最高のエージェントに対する優れた自己のコインレートを観察する。
論文参考訳（メタデータ） (2024-07-30T11:16:25Z)
Towards Efficient Quantum Hybrid Diffusion Models [68.43405413443175]
本稿では,量子ハイブリッド拡散モデルの設計手法を提案する。量子コンピューティングの優れた一般化と古典的ネットワークのモジュラリティを組み合わせた2つのハイブリダイゼーション手法を提案する。
論文参考訳（メタデータ） (2024-02-25T16:57:51Z)
Evolutionary-enhanced quantum supervised learning model [0.0]
本研究は,進化的アンサッツフリー教師あり学習モデルを提案する。パラメタライズド回路とは対照的に、われわれのモデルはエリート的手法によって進化する可変位相を持つ回路を用いる。我々のフレームワークは不毛の台地を避けることに成功し、結果としてモデルの精度が向上した。
論文参考訳（メタデータ） (2023-11-14T11:08:47Z)
Efficient and Flexible Neural Network Training through Layer-wise Feedback Propagation [49.44309457870649]
レイヤワイドフィードバックフィードバック(LFP)は、ニューラルネットワークのような予測器のための新しいトレーニング原則である。 LFPはそれぞれの貢献に基づいて個々のニューロンに報酬を分解する。提案手法は,ネットワークの有用な部分と有害な部分の弱体化を両立させる手法である。
論文参考訳（メタデータ） (2023-08-23T10:48:28Z)
QNEAT: Natural Evolution of Variational Quantum Circuit Architecture [95.29334926638462]
我々は、ニューラルネットワークの量子対する最も有望な候補として登場した変分量子回路(VQC)に注目した。有望な結果を示す一方で、バレン高原、重みの周期性、アーキテクチャの選択など、さまざまな問題のために、VQCのトレーニングは困難である。本稿では,VQCの重みとアーキテクチャの両方を最適化するために,自然進化にインスパイアされた勾配のないアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-04-14T08:03:20Z)
Quantum Deep Hedging [10.243020478772056]
我々は、深層強化学習が現実世界に強力な枠組みを提供するヘッジの問題を考察する。我々はポリシー探索と分布型アクター批判アルゴリズムに基づく量子強化学習法を開発した。トラップイオン量子プロセッサ上で提案したモデルの実装に成功した。
論文参考訳（メタデータ） (2023-03-29T10:42:50Z)
ConCerNet: A Contrastive Learning Based Framework for Automated Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2023-02-11T21:07:30Z)
The Quantum Path Kernel: a Generalized Quantum Neural Tangent Kernel for Deep Quantum Machine Learning [52.77024349608834]
古典的なディープニューラルネットワークの量子アナログを構築することは、量子コンピューティングにおける根本的な課題である。鍵となる問題は、古典的なディープラーニングの本質的な非線形性にどのように対処するかである。我々は、深層機械学習のこれらの側面を複製できる量子機械学習の定式化であるQuantum Path Kernelを紹介する。
論文参考訳（メタデータ） (2022-12-22T16:06:24Z)
Copula-based Risk Aggregation with Trapped Ion Quantum Computers [1.541403735141431]
コプラは、合同確率分布をモデル化するための数学的ツールである。コプラを最大絡み合った量子状態として表現できることの最近の発見は、実用的な量子優位性に対する有望なアプローチを明らかにしている。シミュレータと最先端のイオン量子コンピュータ上での回路設計と精度の異なるQCBMのトレーニングについて検討する。
論文参考訳（メタデータ） (2022-06-23T18:39:30Z)
Efficient Model-based Multi-agent Reinforcement Learning via Optimistic Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文参考訳（メタデータ） (2022-03-14T17:24:03Z)
Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann Machines [2.015864965523243]
我々は、より困難な問題を解決するために、オリジナルの概念の拡張を提案する。我々は、経験的なリプレイバッファを追加し、ターゲットとポリシーの値を近似するために異なるネットワークを使用します。量子サンプリングは、強化学習タスクには有望な方法であることが証明されているが、現在はQPUサイズによって制限されている。
論文参考訳（メタデータ） (2021-09-22T17:59:24Z)
Optimizing Quantum Variational Circuits with Deep Reinforcement Learning [0.0]
量子変動回路における勾配に基づく最適化ルーチンを強化するため, 深部強化学習における現代的手法の可能性を評価する。強化学習の強化は雑音環境における勾配降下より一貫して優れることがわかった。
論文参考訳（メタデータ） (2021-09-07T16:48:39Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)
Variational Quantum Optimization with Multi-Basis Encodings [62.72309460291971]
マルチバスグラフ複雑性と非線形活性化関数の2つの革新の恩恵を受ける新しい変分量子アルゴリズムを導入する。その結果,最適化性能が向上し,有効景観が2つ向上し,測定の進歩が減少した。
論文参考訳（メタデータ） (2021-06-24T20:16:02Z)
Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文参考訳（メタデータ） (2021-06-17T17:26:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。