Fugu-MT 論文翻訳(概要): Realizing a deep reinforcement learning agent discovering real-time feedback control strategies for a quantum system

論文の概要: Realizing a deep reinforcement learning agent discovering real-time feedback control strategies for a quantum system

arxiv url: http://arxiv.org/abs/2210.16715v1
Date: Sun, 30 Oct 2022 01:31:20 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-21 00:46:12.761565
Title: Realizing a deep reinforcement learning agent discovering real-time feedback control strategies for a quantum system
Title（参考訳）: 量子システムのリアルタイムフィードバック制御戦略を探索する深層強化学習エージェントの実現
Authors: Kevin Reuer, Jonas Landgraf, Thomas F\"osel, James O'Sullivan, Liberto Beltr\'an, Abdulkadir Akin, Graham J. Norris, Ants Remm, Michael Kerschbaum, Jean-Claude Besse, Florian Marquardt, Andreas Wallraff, Christopher Eichler
Abstract要約: 我々は、フィールドプログラマブルゲートアレイ(FPGA)を用いた遅延最適化ディープニューラルネットワークを開発した。超伝導量子ビットを標的状態に効率よく初期化する手法を実証する。本研究では, エージェントの性能を, 強度, 弱い測定値, および3レベル読み出し値として検討し, しきい値に基づく簡単な手法との比較を行った。
参考スコア（独自算出の注目度）: 3.598535368045164
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: To realize the full potential of quantum technologies, finding good strategies to control quantum information processing devices in real time becomes increasingly important. Usually these strategies require a precise understanding of the device itself, which is generally not available. Model-free reinforcement learning circumvents this need by discovering control strategies from scratch without relying on an accurate description of the quantum system. Furthermore, important tasks like state preparation, gate teleportation and error correction need feedback at time scales much shorter than the coherence time, which for superconducting circuits is in the microsecond range. Developing and training a deep reinforcement learning agent able to operate in this real-time feedback regime has been an open challenge. Here, we have implemented such an agent in the form of a latency-optimized deep neural network on a field-programmable gate array (FPGA). We demonstrate its use to efficiently initialize a superconducting qubit into a target state. To train the agent, we use model-free reinforcement learning that is based solely on measurement data. We study the agent's performance for strong and weak measurements, and for three-level readout, and compare with simple strategies based on thresholding. This demonstration motivates further research towards adoption of reinforcement learning for real-time feedback control of quantum devices and more generally any physical system requiring learnable low-latency feedback control.
Abstract（参考訳）: 量子技術の潜在能力を最大限に発揮するためには、量子情報処理装置をリアルタイムで制御するための優れた戦略を見つけることがますます重要である。通常これらの戦略はデバイス自体の正確な理解を必要とするが、一般には利用できない。モデルなし強化学習は、量子システムの正確な記述に頼ることなく、制御戦略をゼロから発見することで、このニーズを回避する。さらに、状態準備、ゲートテレポーテーション、誤り訂正といった重要なタスクは、超伝導回路がマイクロ秒の範囲にあるコヒーレンス時間よりもはるかに短い時間スケールでフィードバックを必要とする。このリアルタイムフィードバック体制で動作可能な深層強化学習エージェントの開発と訓練は、オープンな課題である。そこで我々は,フィールドプログラマブルゲートアレイ(FPGA)上に,遅延最適化ディープニューラルネットワークという形でエージェントを実装した。超伝導量子ビットを標的状態に効率よく初期化する手法を実証する。エージェントのトレーニングには,計測データのみに基づいたモデルフリー強化学習を使用する。エージェントの性能を,強い測定値と弱い測定値,および3レベル読み出し値について検討し,しきい値に基づく単純な戦略と比較した。この実証は、量子デバイスのリアルタイムフィードバック制御や、より一般的には学習可能な低遅延フィードバック制御を必要とする物理システムのための強化学習の採用に向けたさらなる研究を動機付ける。

関連論文リスト

From Easy to Hard: Tackling Quantum Problems with Learned Gadgets For Real Hardware [0.0]
強化学習は強力なアプローチであることが証明されているが、量子ビット上の可能な操作の空間の指数的スケーリングによって、多くの制限が残っている。本稿では,合成ゲートを自動的に学習するアルゴリズム($gadgets$)を開発し,探索を容易にするための強化学習エージェントに追加のアクションとして追加する。 GRLでは,TFIMの基底状態を最大107ドルの折り畳みで推定する際の誤差を改善する,非常にコンパクトなPQCが見つかる。
論文参考訳（メタデータ） (2024-10-31T22:02:32Z)
Controlling nonergodicity in quantum many-body systems by reinforcement learning [0.0]
量子非エルゴディティ制御のためのモデルフリー・ディープ強化学習フレームワークを開発した。我々は, DRLエージェントが量子多体系を効率的に学習できることを実証するために, パラダイム的一次元傾斜Fermi-Hubbardシステムを用いた。連続制御プロトコルと観測は実験的に実現可能である。
論文参考訳（メタデータ） (2024-08-21T20:55:44Z)
Rethinking Robustness Assessment: Adversarial Attacks on Learning-based Quadrupedal Locomotion Controllers [33.50779001548997]
Legged locomotionは最近、機械学習技術の進歩で顕著な成功を収めた。学習した移動制御器の弱点を識別するために,逐次的敵攻撃を利用する計算手法を提案する。我々の研究は、最先端のロバストコントローラーでさえ、十分に設計された低マグニチュード逆数列の下では著しく失敗することを示した。
論文参考訳（メタデータ） (2024-05-21T00:26:11Z)
Reaction dynamics with qubit-efficient momentum-space mapping [42.408991654684876]
線形応答によって支配される異なる反応を記述することに関連する応答関数の量子アルゴリズムについて検討する。我々は、運動量空間基底状態を用いて効率的に実行できる格子上の量子ビット効率の写像を考える。
論文参考訳（メタデータ） (2024-03-30T00:21:46Z)
ShadowNet for Data-Centric Quantum System Learning [188.683909185536]
本稿では,ニューラルネットワークプロトコルと古典的シャドウの強みを組み合わせたデータ中心学習パラダイムを提案する。ニューラルネットワークの一般化力に基づいて、このパラダイムはオフラインでトレーニングされ、これまで目に見えないシステムを予測できる。量子状態トモグラフィーおよび直接忠実度推定タスクにおいて、我々のパラダイムのインスタンス化を示し、60量子ビットまでの数値解析を行う。
論文参考訳（メタデータ） (2023-08-22T09:11:53Z)
Quantum Control based on Deep Reinforcement Learning [1.8710230264817362]
本論では,2つの単純な制御問題を考察し,それらを深層強化学習に適用する。本稿では,強化学習が2次ケースの最適制御に匹敵する性能を達成することを示す。量子制御問題に深層強化学習を適用するのはこれが初めてである。
論文参考訳（メタデータ） (2022-12-14T18:12:26Z)
Self-Correcting Quantum Many-Body Control using Reinforcement Learning with Tensor Networks [0.0]
本稿では、強化学習(RL)に基づく量子多体系を効率的に制御するための新しい枠組みを提案する。我々は、RLエージェントが普遍的な制御を見出すことができ、多くの身体状態を最適に制御する方法を学ぶことができ、量子力学が摂動を受けるとき、制御プロトコルをオンザフライで適用できることを示した。
論文参考訳（メタデータ） (2022-01-27T20:14:09Z)
Quantum Annealing Formulation for Binary Neural Networks [40.99969857118534]
本研究では、リソース制約のあるデバイスを意図した軽量で強力なモデルであるバイナリニューラルネットワークについて検討する。トレーニング問題に対する2次非制約バイナリ最適化の定式化を考案する。問題は難解であり、すなわち、二分重みを推定するコストはネットワークサイズと指数関数的にスケールするが、どのようにして問題を量子アニール器に直接最適化できるかを示す。
論文参考訳（メタデータ） (2021-07-05T03:20:54Z)
On exploring the potential of quantum auto-encoder for learning quantum systems [60.909817434753315]
そこで我々は,古典的な3つのハードラーニング問題に対処するために,QAEに基づく効果的な3つの学習プロトコルを考案した。私たちの研究は、ハード量子物理学と量子情報処理タスクを達成するための高度な量子学習アルゴリズムの開発に新たな光を当てています。
論文参考訳（メタデータ） (2021-06-29T14:01:40Z)
Quantum-tailored machine-learning characterization of a superconducting qubit [50.591267188664666]
我々は,量子デバイスのダイナミクスを特徴付ける手法を開発し,デバイスパラメータを学習する。このアプローチは、数値的に生成された実験データに基づいてトレーニングされた物理に依存しないリカレントニューラルネットワークより優れている。このデモンストレーションは、ドメイン知識を活用することで、この特徴付けタスクの正確性と効率が向上することを示す。
論文参考訳（メタデータ） (2021-06-24T15:58:57Z)
Weakly-Supervised Domain Adaptation of Deep Regression Trackers via Reinforced Knowledge Distillation [27.00282405409842]
このようなトラッカーのクラスをドメイン適応するための最初の方法論を示す。本研究では,強化学習を弱監督の表現に用いる,弱監督型適応戦略を提案する。 5つの異なるロボットビジョン領域の実験は、我々の方法論の妥当性を実証している。
論文参考訳（メタデータ） (2021-03-26T14:37:33Z)
Experimental quantum speed-up in reinforcement learning agents [0.17849902073068336]
強化学習(RL)は人工知能(AI)の重要なパラダイムである本稿では,エージェントの学習を環境との量子通信チャネルを利用して促進するRL実験について述べる。我々は,この学習プロトコルを,コンパクトで完全に調整可能な集積ナノフォトニックプロセッサ上に実装する。
論文参考訳（メタデータ） (2021-03-10T19:01:12Z)
Probing quantum information propagation with out-of-time-ordered correlators [41.12790913835594]
小型の量子情報プロセッサは、多体量子システムを効率的にエミュレートする約束を持っている。ここでは、時間外順序付き相関器(OTOC)の測定を実演する。我々の実験における中心的な要件は、時間進化をコヒーレントに逆転させる能力である。
論文参考訳（メタデータ） (2021-02-23T15:29:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。