論文の概要: Learning feedback control strategies for quantum metrology
- arxiv url: http://arxiv.org/abs/2110.15080v2
- Date: Mon, 18 Apr 2022 08:37:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-10 01:06:54.349380
- Title: Learning feedback control strategies for quantum metrology
- Title(参考訳): 量子メソロジーのための学習フィードバック制御戦略
- Authors: Alessio Fallani, Matteo A. C. Rossi, Dario Tamascelli, Marco G. Genoni
- Abstract要約: 評価精度の向上を実現するために,強化学習手法を利用してフィードバック制御戦略を考案する。
ニューラルネットワークによって決定されるフィードバック制御は、"no-control"戦略と標準の"open-loop control"戦略の両方のパフォーマンスを長時間の制限で大幅に上回っていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of frequency estimation for a single bosonic field
evolving under a squeezing Hamiltonian and continuously monitored via homodyne
detection. In particular, we exploit reinforcement learning techniques to
devise feedback control strategies achieving increased estimation precision. We
show that the feedback control determined by the neural network greatly
surpasses in the long-time limit the performances of both the "no-control"
strategy and the standard "open-loop control" strategy, which we considered as
benchmarks. We indeed observe how the devised strategy is able to optimize the
nontrivial estimation problem by preparing a large fraction of trajectories
corresponding to more sensitive quantum conditional states.
- Abstract(参考訳): スクイーズ・ハミルトニアンの下で進化し、ホモダイン検出によって連続的に観測される単一のボソニック場の周波数推定の問題を考える。
特に,強化学習技術を用いて,推定精度の向上を実現するフィードバック制御戦略を考案する。
ニューラルネットワークによって決定されるフィードバック制御は、"no-control"戦略と標準の"open-loop control"戦略の両方のパフォーマンスを長時間の制限で大幅に上回っていることを示す。
我々は,より高感度な量子条件状態に対応する軌道を多数用意することで,非自明な推定問題を最適化する方法を実際に観察する。
関連論文リスト
- FOCQS: Feedback Optimally Controlled Quantum States [0.0]
FALQONのようなフィードバックベースの量子アルゴリズムは微調整の問題を避けるが、回路深度の追加と収束保証の欠如を犠牲にしている。
我々は、従来の制御層を摂動的に更新するためにそれを利用する分析フレームワークを開発した。
この摂動的手法は、フィードバックに基づくアルゴリズムの結果を改善するために、フィードバック最適化量子状態(FOCQS)と呼ぶ。
論文 参考訳(メタデータ) (2024-09-23T18:00:06Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Robust Quantum Control via a Model Predictive Control Strategy [4.197316670989004]
本稿では,有界不確実性を考慮した2レベル量子系のロバスト制御戦略を提案する。
TOMPCアルゴリズムの安定性を保証するための理論的結果を示す。
数値シミュレーションにより、不確実性が存在する場合、我々の量子TOMPCアルゴリズムはロバスト性を高め、その状態を高い忠実度で所望の状態に導出することを示した。
論文 参考訳(メタデータ) (2024-02-12T04:05:54Z) - The Quantum Cartpole: A benchmark environment for non-linear
reinforcement learning [0.0]
状態推定と制御可能性のトレードオフがどのように生じるかを示す。
本稿では、転送学習を用いて強化学習を通して訓練された量子制御エージェントを開発する可能性を示す。
論文 参考訳(メタデータ) (2023-11-01T18:02:42Z) - No-Collapse Accurate Quantum Feedback Control via Conditional State
Tomography [0.0]
測定ベースフィードバック制御(MBFC)プロトコルの有効性は,測定ノイズの存在によって阻害される。
本研究は、条件力学のノイズフリーモニタリングを可能にするリアルタイム連続状態推定手法について検討する。
このアプローチは強化学習(RL)に基づく制御において特に有用であり、RLエージェントは任意の条件付き観測値でトレーニングすることができる。
論文 参考訳(メタデータ) (2023-01-18T01:28:23Z) - Gradient Ascent Pulse Engineering with Feedback [0.0]
本稿では,モデルなし強化学習の概念を取り入れたフィードバック-GRAPEを提案する。
本手法は,ノイズの存在下での状態調整と安定化のための解釈可能なフィードバック戦略を導出する。
論文 参考訳(メタデータ) (2022-03-08T18:46:09Z) - Surveillance Evasion Through Bayesian Reinforcement Learning [78.79938727251594]
ランダム終端の強度が全く不明な2次元連続経路計画問題を考える。
これらのオブザーバーの監視強度は未知であり、反復的な経路計画を通じて学ぶ必要がある。
論文 参考訳(メタデータ) (2021-09-30T02:29:21Z) - Balancing detectability and performance of attacks on the control
channel of Markov Decision Processes [77.66954176188426]
マルコフ決定過程(MDPs)の制御チャネルにおける最適ステルス毒素攻撃の設計問題について検討する。
この研究は、MDPに適用された敵国・毒殺攻撃や強化学習(RL)手法に対する研究コミュニティの最近の関心に動機づけられている。
論文 参考訳(メタデータ) (2021-09-15T09:13:10Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Point-Level Temporal Action Localization: Bridging Fully-supervised
Proposals to Weakly-supervised Losses [84.2964408497058]
point-level temporal action localization (ptal) は、各アクションインスタンスに対して1つのタイムスタンプアノテーションで、未トリミングビデオ内のアクションをローカライズすることを目的としている。
既存の手法ではフレームレベルの予測パラダイムを採用し、スパース単一フレームラベルから学習する。
本稿では,ポイントレベルアノテーションの提案に基づく予測パラダイムを検討する。
論文 参考訳(メタデータ) (2020-12-15T12:11:48Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。