論文の概要: Experimental quantum speed-up in reinforcement learning agents
- arxiv url: http://arxiv.org/abs/2103.06294v1
- Date: Wed, 10 Mar 2021 19:01:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-08 13:22:46.387595
- Title: Experimental quantum speed-up in reinforcement learning agents
- Title(参考訳): 強化学習エージェントの量子スピードアップ実験
- Authors: Valeria Saggio, Beate E. Asenbeck, Arne Hamann, Teodor Str\"omberg,
Peter Schiansky, Vedran Dunjko, Nicolai Friis, Nicholas C. Harris, Michael
Hochberg, Dirk Englund, Sabine W\"olk, Hans J. Briegel and Philip Walther
- Abstract要約: 強化学習(RL)は人工知能(AI)の重要なパラダイムである
本稿では,エージェントの学習を環境との量子通信チャネルを利用して促進するRL実験について述べる。
我々は,この学習プロトコルを,コンパクトで完全に調整可能な集積ナノフォトニックプロセッサ上に実装する。
- 参考スコア(独自算出の注目度): 0.17849902073068336
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Increasing demand for algorithms that can learn quickly and efficiently has
led to a surge of development within the field of artificial intelligence (AI).
An important paradigm within AI is reinforcement learning (RL), where agents
interact with environments by exchanging signals via a communication channel.
Agents can learn by updating their behaviour based on obtained feedback. The
crucial question for practical applications is how fast agents can learn to
respond correctly. An essential figure of merit is therefore the learning time.
While various works have made use of quantum mechanics to speed up the agent's
decision-making process, a reduction in learning time has not been demonstrated
yet. Here we present a RL experiment where the learning of an agent is boosted
by utilizing a quantum communication channel with the environment. We further
show that the combination with classical communication enables the evaluation
of such an improvement, and additionally allows for optimal control of the
learning progress. This novel scenario is therefore demonstrated by considering
hybrid agents, that alternate between rounds of quantum and classical
communication. We implement this learning protocol on a compact and fully
tunable integrated nanophotonic processor. The device interfaces with
telecom-wavelength photons and features a fast active feedback mechanism,
allowing us to demonstrate the agent's systematic quantum advantage in a setup
that could be readily integrated within future large-scale quantum
communication networks.
- Abstract(参考訳): 迅速かつ効率的に学習できるアルゴリズムの需要の増加は、人工知能(AI)分野における開発の増加につながった。
AIにおける重要なパラダイムは強化学習(RL)であり、エージェントは通信チャネルを介して信号を交換することで環境と対話する。
エージェントは、得られたフィードバックに基づいて行動を更新して学習することができる。
実用的なアプリケーションにとって重要な質問は、エージェントがいかに素早く応答を学べるかである。
したがって、本質的なメリットは学習時間である。
様々な研究が量子力学を利用してエージェントの意思決定プロセスを高速化しているが、学習時間の削減はまだ実証されていない。
本稿では,エージェントの学習を環境との量子通信チャネルを利用して促進するRL実験について述べる。
さらに,古典的コミュニケーションと組み合わせることで,これらの改善の評価が可能となり,さらに学習の進捗を最適に制御できることを示す。
この新たなシナリオは、量子通信と古典通信のラウンドを交互に行うハイブリッドエージェントを考えることで実証される。
我々は,この学習プロトコルを,コンパクトで完全に調整可能な集積ナノフォトニックプロセッサ上に実装する。
デバイスは通信波長の光子とインターフェースし、高速なアクティブフィードバック機構を備えており、将来の大規模量子通信ネットワークに容易に統合できる設定でエージェントの系統的な量子アドバンテージを実証することができる。
関連論文リスト
- Application of machine learning to experimental design in quantum mechanics [0.5461938536945721]
本稿では,量子センサの精度を最適化する機械学習手法を提案する。
フレームワークはPythonパッケージのqsensoroptで実装されている。
我々は,この手法のNV中心およびフォトニック回路への応用について検討した。
論文 参考訳(メタデータ) (2024-03-15T14:07:46Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - On-demand transposition across light-matter interaction regimes in
bosonic cQED [69.65384453064829]
ボソニックcQEDは、非線形回路素子に結合した高温超伝導キャビティの光電場を用いる。
空洞コヒーレンスを劣化させることなく, 相互作用系を高速に切り替える実験を行った。
我々の研究は、単一のプラットフォーム内での光-物質相互作用のフル範囲を探索する新しいパラダイムを開く。
論文 参考訳(メタデータ) (2023-12-22T13:01:32Z) - Solving Large-scale Spatial Problems with Convolutional Neural Networks [88.31876586547848]
大規模空間問題に対する学習効率を向上させるために移動学習を用いる。
畳み込みニューラルネットワーク (CNN) は, 信号の小さな窓で訓練できるが, 性能劣化の少ない任意の大信号で評価できる。
論文 参考訳(メタデータ) (2023-06-14T01:24:42Z) - Realizing a deep reinforcement learning agent discovering real-time
feedback control strategies for a quantum system [3.598535368045164]
我々は、フィールドプログラマブルゲートアレイ(FPGA)を用いた遅延最適化ディープニューラルネットワークを開発した。
超伝導量子ビットを標的状態に効率よく初期化する手法を実証する。
本研究では, エージェントの性能を, 強度, 弱い測定値, および3レベル読み出し値として検討し, しきい値に基づく簡単な手法との比較を行った。
論文 参考訳(メタデータ) (2022-10-30T01:31:20Z) - Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann
Machines [2.015864965523243]
我々は、より困難な問題を解決するために、オリジナルの概念の拡張を提案する。
我々は、経験的なリプレイバッファを追加し、ターゲットとポリシーの値を近似するために異なるネットワークを使用します。
量子サンプリングは、強化学習タスクには有望な方法であることが証明されているが、現在はQPUサイズによって制限されている。
論文 参考訳(メタデータ) (2021-09-22T17:59:24Z) - Information Scrambling in Computationally Complex Quantum Circuits [56.22772134614514]
53量子ビット量子プロセッサにおける量子スクランブルのダイナミクスを実験的に検討する。
演算子の拡散は効率的な古典的モデルによって捉えられるが、演算子の絡み合いは指数関数的にスケールされた計算資源を必要とする。
論文 参考訳(メタデータ) (2021-01-21T22:18:49Z) - Experimental Quantum Generative Adversarial Networks for Image
Generation [93.06926114985761]
超伝導量子プロセッサを用いた実世界の手書き桁画像の学習と生成を実験的に行う。
我々の研究は、短期量子デバイス上での高度な量子生成モデル開発のためのガイダンスを提供する。
論文 参考訳(メタデータ) (2020-10-13T06:57:17Z) - A Physical Quantum Agent [0.0]
我々は光を使って環境の成分を探索し学習する簡単な光学エージェントを提案する。
我々のシナリオでは、量子エージェントは単一光子パルスを用いて世界を探索し、古典的相手は平均光子数1の弱コヒーレントな状態を使用する。
両エージェントの熱力学的挙動を解析し, エージェントの世界の推定値を改善することは, アクチュエータパルスによるセンサ上で行う平均作業量の増加に対応することを示した。
論文 参考訳(メタデータ) (2020-07-08T20:49:03Z) - Expressibility and trainability of parameterized analog quantum systems
for machine learning applications [0.0]
システム内の外部駆動と障害の相互作用が、相互作用する量子システムのトレーニング可能性と表現可能性をどのように規定しているかを示す。
我々の研究は、量子多体物理学と機械学習への応用の基本的な関連性を示している。
論文 参考訳(メタデータ) (2020-05-22T14:59:42Z) - Machine learning transfer efficiencies for noisy quantum walks [62.997667081978825]
グラフ型と量子系コヒーレンスの両方の要件を見つけるプロセスは自動化可能であることを示す。
この自動化は、特定のタイプの畳み込みニューラルネットワークを使用して、どのネットワークで、どのコヒーレンス要求の量子優位性が可能かを学習する。
我々の結果は、量子実験における利点の実証と、科学的研究と発見の自動化への道を開くために重要である。
論文 参考訳(メタデータ) (2020-01-15T18:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。