論文の概要: Maximum entropy optimal density control of discrete-time linear systems
and Schr\"odinger bridges
- arxiv url: http://arxiv.org/abs/2204.05263v1
- Date: Mon, 11 Apr 2022 17:06:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 18:57:58.156414
- Title: Maximum entropy optimal density control of discrete-time linear systems
and Schr\"odinger bridges
- Title(参考訳): 離散時間線形系の最大エントロピー最適密度制御とschr\"odinger橋
- Authors: Kaito Ito, Kenji Kashima
- Abstract要約: 決定論的離散時間線形系の最適密度制御のエントロピー正規化版を考える。
これらの利点にもかかわらず、高エントロピー制御ポリシーはシステムに確率的不確実性をもたらす。
我々は、MaxEntの最適密度制御が、離散時間線形系に付随するいわゆるSchr"odingerブリッジを誘導することを明らかにした。
- 参考スコア(独自算出の注目度): 0.24366811507669117
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider an entropy-regularized version of optimal density control of
deterministic discrete-time linear systems. Entropy regularization, or a
maximum entropy (MaxEnt) method for optimal control has attracted much
attention especially in reinforcement learning due to its many advantages such
as a natural exploration strategy. Despite the merits, high-entropy control
policies introduce probabilistic uncertainty into systems, which severely
limits the applicability of MaxEnt optimal control to safety-critical systems.
To remedy this situation, we impose a Gaussian density constraint at a
specified time on the MaxEnt optimal control to directly control state
uncertainty. Specifically, we derive the explicit form of the MaxEnt optimal
density control. In addition, we also consider the case where a density
constraint is replaced by a fixed point constraint. Then, we characterize the
associated state process as a pinned process, which is a generalization of the
Brownian bridge to linear systems. Finally, we reveal that the MaxEnt optimal
density control induces the so-called Schr\"odinger bridge associated to a
discrete-time linear system.
- Abstract(参考訳): 決定論的離散時間線形系の最適密度制御のエントロピー正規化版を考える。
最適制御のためのエントロピー正則化あるいは最大エントロピー法(MaxEnt)は、特に自然探査戦略のような多くの利点のために強化学習において多くの注目を集めている。
これらのメリットにもかかわらず、高エントロピー制御政策はシステムに確率的不確実性をもたらし、安全クリティカルなシステムに対する最大最適制御の適用性を厳しく制限している。
この状況を改善するために、状態不確実性を直接制御するMaxEnt最適制御にガウス密度制約を所定時間で課す。
具体的には、MaxEnt最適密度制御の明示的な形式を導出する。
さらに,密度制約が不動点制約に置き換えられる場合についても考察する。
次に、関連する状態過程を、ブラウン橋の線形系への一般化であるピン付き過程として特徴づける。
最後に,最大最適密度制御は離散時間線形系に付随するいわゆるschr\"odinger橋を誘導することを明らかにした。
関連論文リスト
- Krotov Type Optimization of Coherent and Incoherent Controls for Open
Two-Qubit Systems [77.34726150561087]
この研究は、コヒーレントかつ非コヒーレントな制御によって駆動される2量子ビットオープン量子系を考える。
インコヒーレント制御は、環境の時間依存スペクトル密度を介して時間依存のデコヒーレンス率を誘導する。
システムは、時間依存係数を持つゴリーニ・コサコフスキー・スダルシャン・リンドブラッド・マスター方程式に従って進化する。
論文 参考訳(メタデータ) (2023-08-11T13:17:19Z) - Optimal State Manipulation for a Two-Qubit System Driven by Coherent and
Incoherent Controls [77.34726150561087]
2量子ビット量子系の最適制御には状態準備が重要である。
物理的に異なる2つのコヒーレント制御を利用し、ヒルベルト・シュミット目標密度行列を最適化する。
論文 参考訳(メタデータ) (2023-04-03T10:22:35Z) - Optimal control for state preparation in two-qubit open quantum systems
driven by coherent and incoherent controls via GRAPE approach [77.34726150561087]
我々は、コヒーレントかつ非コヒーレントな時間依存制御によって駆動される2つの量子ビットのモデルを考える。
系の力学はゴリーニ=コサコフスキー=スダルシャン=リンドブラッドのマスター方程式によって支配される。
最適化制御の下で, フォン・ノイマンエントロピー, 純度, および1ビット還元密度行列の進化について検討した。
論文 参考訳(メタデータ) (2022-11-04T15:20:18Z) - A Physics-informed Deep Learning Approach for Minimum Effort Stochastic
Control of Colloidal Self-Assembly [9.791617215182598]
制御目的は、所定の初期確率尺度から最小制御労力で所定の終端確率尺度へ状態PDFを操る観点から定式化される。
我々は、関連する最適制御問題に対する最適性の条件を導出する。
提案手法の性能は, ベンチマークコロイド自己集合問題に対する数値シミュレーションにより検証した。
論文 参考訳(メタデータ) (2022-08-19T07:01:57Z) - On optimization of coherent and incoherent controls for two-level
quantum systems [77.34726150561087]
本稿では、閉かつオープンな2レベル量子系の制御問題について考察する。
閉系の力学は、コヒーレント制御を持つシュリンガー方程式によって支配される。
開系の力学はゴリーニ=コサコフスキー=スダルシャン=リンドブラッドのマスター方程式によって支配される。
論文 参考訳(メタデータ) (2022-05-05T09:08:03Z) - Application of Pontryagin's Maximum Principle to Quantum Metrology in
Dissipative Systems [8.920103626492315]
我々は「ツイスト・アンド・ターン」問題に対して量子フィッシャー情報を最大化する最適制御を求める。
最適制御は散逸することなく特異であるが、量子デコヒーレンスを導入すると非有界となる。
論文 参考訳(メタデータ) (2022-04-30T00:02:57Z) - A Quantum Optimal Control Problem with State Constrained Preserving
Coherence [68.8204255655161]
非単体脱コヒーレンスチャネルを特徴とするマルコフ脱コヒーレンスを受ける3レベル$Lambda$型原子を考える。
我々は、デコヒーレンスレベルが予め定義された境界内にある状態制約で量子最適制御問題を定式化する。
論文 参考訳(メタデータ) (2022-03-24T21:31:34Z) - Density Constrained Reinforcement Learning [9.23225507471139]
状態密度関数に制約を直接設定することで,新しい視点から制約付き強化学習を研究する。
我々は密度関数とQ関数の双対性を利用して、密度制約されたRL問題を最適に解く効果的なアルゴリズムを開発する。
提案アルゴリズムは, ポリシー更新が不完全である場合でも, 境界誤差のある準最適解に収束することを示す。
論文 参考訳(メタデータ) (2021-06-24T04:22:03Z) - Numerical estimation of reachable and controllability sets for a
two-level open quantum system driven by coherent and incoherent controls [77.34726150561087]
この記事では、ゴリーニ-コサコフスキー--リンドブラッド--スダルシャンマスター方程式によって支配される2段階の開量子系を考える。
系の密度行列のブロッホパラメトリゼーションを用いて解析する。
論文 参考訳(メタデータ) (2021-06-18T14:23:29Z) - Stochastic optimal control formalism for an open quantum system [15.076862040458124]
散逸量子系に対するポントリャーギンの最大原理を表現できる手順が開発されている。
時間最適計算制御は密度行列を使わずに効率的に計算できる。
論文 参考訳(メタデータ) (2020-11-06T15:37:51Z) - Time-optimal control of a dissipative qubit [9.035958018596155]
時間-最適プロトコルを決定するためにポントリャーギンの最大原理に基づく形式主義を適用する。
散逸は通常、システムを最大混合状態に駆動する。
しかし、ある特定の散逸チャネルでは、最適制御はシステムを無限に長いエントロピー状態から遠ざけることができる。
論文 参考訳(メタデータ) (2020-02-18T15:43:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。