論文の概要: Learning feedback control strategies for quantum metrology
- arxiv url: http://arxiv.org/abs/2110.15080v2
- Date: Mon, 18 Apr 2022 08:37:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-10 01:06:54.349380
- Title: Learning feedback control strategies for quantum metrology
- Title(参考訳): 量子メソロジーのための学習フィードバック制御戦略
- Authors: Alessio Fallani, Matteo A. C. Rossi, Dario Tamascelli, Marco G. Genoni
- Abstract要約: 評価精度の向上を実現するために,強化学習手法を利用してフィードバック制御戦略を考案する。
ニューラルネットワークによって決定されるフィードバック制御は、"no-control"戦略と標準の"open-loop control"戦略の両方のパフォーマンスを長時間の制限で大幅に上回っていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of frequency estimation for a single bosonic field
evolving under a squeezing Hamiltonian and continuously monitored via homodyne
detection. In particular, we exploit reinforcement learning techniques to
devise feedback control strategies achieving increased estimation precision. We
show that the feedback control determined by the neural network greatly
surpasses in the long-time limit the performances of both the "no-control"
strategy and the standard "open-loop control" strategy, which we considered as
benchmarks. We indeed observe how the devised strategy is able to optimize the
nontrivial estimation problem by preparing a large fraction of trajectories
corresponding to more sensitive quantum conditional states.
- Abstract(参考訳): スクイーズ・ハミルトニアンの下で進化し、ホモダイン検出によって連続的に観測される単一のボソニック場の周波数推定の問題を考える。
特に,強化学習技術を用いて,推定精度の向上を実現するフィードバック制御戦略を考案する。
ニューラルネットワークによって決定されるフィードバック制御は、"no-control"戦略と標準の"open-loop control"戦略の両方のパフォーマンスを長時間の制限で大幅に上回っていることを示す。
我々は,より高感度な量子条件状態に対応する軌道を多数用意することで,非自明な推定問題を最適化する方法を実際に観察する。
関連論文リスト
- Robust Quantum Control via a Model Predictive Control Strategy [4.197316670989004]
本稿では,有界不確実性を考慮した2レベル量子系のロバスト制御戦略を提案する。
TOMPCアルゴリズムの安定性を保証するための理論的結果を示す。
数値シミュレーションにより、不確実性が存在する場合、我々の量子TOMPCアルゴリズムはロバスト性を高め、その状態を高い忠実度で所望の状態に導出することを示した。
論文 参考訳(メタデータ) (2024-02-12T04:05:54Z) - The Quantum Cartpole: A benchmark environment for non-linear
reinforcement learning [0.0]
状態推定と制御可能性のトレードオフがどのように生じるかを示す。
本稿では、転送学習を用いて強化学習を通して訓練された量子制御エージェントを開発する可能性を示す。
論文 参考訳(メタデータ) (2023-11-01T18:02:42Z) - No-Collapse Accurate Quantum Feedback Control via Conditional State
Tomography [0.0]
測定ベースフィードバック制御(MBFC)プロトコルの有効性は,測定ノイズの存在によって阻害される。
本研究は、条件力学のノイズフリーモニタリングを可能にするリアルタイム連続状態推定手法について検討する。
このアプローチは強化学習(RL)に基づく制御において特に有用であり、RLエージェントは任意の条件付き観測値でトレーニングすることができる。
論文 参考訳(メタデータ) (2023-01-18T01:28:23Z) - Critical quantum metrology assisted by real-time feedback control [0.0]
まず、適応的でない測定戦略が量子臨界エンハンスメントの活用に失敗する、というノーゴーの結果を導出する。
そして、このノーゴーの結果を克服できる様々な適応戦略を考えます。
この結果から,リアルタイムフィードバック制御による適応戦略は,サブショットノイズスケーリングを実現することができることがわかった。
論文 参考訳(メタデータ) (2022-11-14T19:06:14Z) - Gradient Ascent Pulse Engineering with Feedback [0.0]
本稿では,モデルなし強化学習の概念を取り入れたフィードバック-GRAPEを提案する。
本手法は,ノイズの存在下での状態調整と安定化のための解釈可能なフィードバック戦略を導出する。
論文 参考訳(メタデータ) (2022-03-08T18:46:09Z) - Surveillance Evasion Through Bayesian Reinforcement Learning [78.79938727251594]
ランダム終端の強度が全く不明な2次元連続経路計画問題を考える。
これらのオブザーバーの監視強度は未知であり、反復的な経路計画を通じて学ぶ必要がある。
論文 参考訳(メタデータ) (2021-09-30T02:29:21Z) - Balancing detectability and performance of attacks on the control
channel of Markov Decision Processes [77.66954176188426]
マルコフ決定過程(MDPs)の制御チャネルにおける最適ステルス毒素攻撃の設計問題について検討する。
この研究は、MDPに適用された敵国・毒殺攻撃や強化学習(RL)手法に対する研究コミュニティの最近の関心に動機づけられている。
論文 参考訳(メタデータ) (2021-09-15T09:13:10Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Point-Level Temporal Action Localization: Bridging Fully-supervised
Proposals to Weakly-supervised Losses [84.2964408497058]
point-level temporal action localization (ptal) は、各アクションインスタンスに対して1つのタイムスタンプアノテーションで、未トリミングビデオ内のアクションをローカライズすることを目的としている。
既存の手法ではフレームレベルの予測パラダイムを採用し、スパース単一フレームラベルから学習する。
本稿では,ポイントレベルアノテーションの提案に基づく予測パラダイムを検討する。
論文 参考訳(メタデータ) (2020-12-15T12:11:48Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。