論文の概要: Mutual Information Optimal Density Control of Linear Systems and Generalized Schrödinger Bridges with Reference Refinement
- arxiv url: http://arxiv.org/abs/2605.09349v1
- Date: Sun, 10 May 2026 06:02:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.205841
- Title: Mutual Information Optimal Density Control of Linear Systems and Generalized Schrödinger Bridges with Reference Refinement
- Title(参考訳): リニアシステムと参照リファインメント付き一般化シュレーディンガー橋の相互情報最適密度制御
- Authors: Shoju Enami, Kenji Kashima,
- Abstract要約: 離散時間線形系の最適密度制御の相互情報(MI)正規化バージョンを考える。
MI規則化はポリシーの正当性を誘導し、安全クリティカルなシナリオにおけるMI最適制御の適用に課題をもたらす。
本稿では,アルゴリズムにおける各ステップのクローズドな形状を導出する交互最適化アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a mutual information (MI) regularized version of optimal density control of a discrete-time linear system. MI optimal control has been proposed as an extension of maximum entropy optimal control to trade off between control performance and benefits provided by stochastic inputs. MI regularization induces stochasticity in the policy, which poses challenges for applications of MI optimal control in safety-critical scenarios. To remedy this situation, we impose Gaussian density constraints at specified times to directly control state uncertainty. For this MI optimal density control problem, we propose an alternating optimization algorithm and derive the closed form of each step in the algorithm. In addition, we reveal that the alternating optimization of the MI optimal density control problem coincides with that of the so-called generalized Schrödinger bridge problem associated with the discrete-time linear system.
- Abstract(参考訳): 離散時間線形系の最適密度制御の相互情報(MI)正規化バージョンを考える。
MI最適制御は、制御性能と確率入力による利点をトレードオフする最大エントロピー最適制御の拡張として提案されている。
MI正規化はポリシーの確率性を誘導し、安全クリティカルなシナリオにおけるMI最適制御の適用に挑戦する。
この状況を改善するため, ガウス密度制約を一定時間に課し, 状態の不確実性を直接制御する。
このMI最適密度制御問題に対して、交代最適化アルゴリズムを提案し、アルゴリズムの各ステップの閉形式を導出する。
さらに、MI最適密度制御問題の交互最適化は、離散時間線形系に関連するいわゆる一般化シュレーディンガー橋問題と一致することを明らかにした。
関連論文リスト
- Globally Solving Unbalanced Optimal Transport and Density Control for Gaussian Distributions [1.9116784879310027]
不均衡最適輸送(UOT)を研究し、制御理論の動的拡張を確立し、不均衡密度制御(UDC)と呼ぶ。
静的な環境では、所定のガウス測度に対する2次輸送コストとクルバック-リーブルの罰則を考慮する。
我々は、任意の実現可能な解が最適性を失うことなく、ガウスの初期測度とアフィン・ガウス制御ポリシーによって置き換えられることを証明した。
論文 参考訳(メタデータ) (2026-05-05T19:32:03Z) - Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。
本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文 参考訳(メタデータ) (2025-07-12T17:11:06Z) - Mutual Information Optimal Control of Discrete-Time Linear Systems [0.07366405857677226]
離散時間線形システムに対する相互情報最適制御問題(MIOCP)を定式化する。
この問題は、最大エントロピー最適制御問題(MEOCP)の拡張と見なすことができる。
論文 参考訳(メタデータ) (2025-07-07T07:04:27Z) - Krotov Type Optimization of Coherent and Incoherent Controls for Open
Two-Qubit Systems [77.34726150561087]
この研究は、コヒーレントかつ非コヒーレントな制御によって駆動される2量子ビットオープン量子系を考える。
インコヒーレント制御は、環境の時間依存スペクトル密度を介して時間依存のデコヒーレンス率を誘導する。
システムは、時間依存係数を持つゴリーニ・コサコフスキー・スダルシャン・リンドブラッド・マスター方程式に従って進化する。
論文 参考訳(メタデータ) (2023-08-11T13:17:19Z) - Optimal control for state preparation in two-qubit open quantum systems
driven by coherent and incoherent controls via GRAPE approach [77.34726150561087]
我々は、コヒーレントかつ非コヒーレントな時間依存制御によって駆動される2つの量子ビットのモデルを考える。
系の力学はゴリーニ=コサコフスキー=スダルシャン=リンドブラッドのマスター方程式によって支配される。
最適化制御の下で, フォン・ノイマンエントロピー, 純度, および1ビット還元密度行列の進化について検討した。
論文 参考訳(メタデータ) (2022-11-04T15:20:18Z) - Robustness of a universal gate set implementation in transmon systems
via Chopped Random Basis optimal control [50.591267188664666]
CNOT, Hadamard, phase と $pi/8$ gates から構成される汎用2量子ゲートセットのトランスモン系システムに対する実装を数値解析的に検討する。
このようなゲートを実装するための制御信号は、目標ゲート不忠実度が10-2$のチョッペランダムバス最適制御技術を用いて得られる。
論文 参考訳(メタデータ) (2022-07-27T10:55:15Z) - Maximum entropy optimal density control of discrete-time linear systems
and Schr\"odinger bridges [0.087024326813104]
決定論的離散時間線形系の最適密度制御のエントロピー正規化版を考える。
これらの利点にもかかわらず、規則化によって誘導される高エントロピー制御ポリシーはシステムに確率的不確実性をもたらす。
我々は、マックスエント最適密度制御が、離散時間線形系に付随するいわゆる「シュリンガー橋」を与えることを明らかにした。
論文 参考訳(メタデータ) (2022-04-11T17:06:23Z) - Advancing Trajectory Optimization with Approximate Inference:
Exploration, Covariance Control and Adaptive Risk [29.811633555275666]
制御(i2c)アルゴリズムの入力推論を検討し、高度な軌道最適化を可能にする3つの重要な特性を導出する。
非線形システムを最適化する際に、オープンループオプティマとクローズドループ分散低減の利点を組み合わせた専門家の線形ガウスコントローラ。
論文 参考訳(メタデータ) (2021-03-10T19:52:31Z) - Direct Optimal Control Approach to Laser-Driven Quantum Particle
Dynamics [77.34726150561087]
間接制御理論に対する頑健で柔軟な代替手段として, 直接最適制御を提案する。
この方法は、バイスタブルポテンシャルにおけるレーザー駆動のウェーブパレットダイナミクスの場合に説明される。
論文 参考訳(メタデータ) (2020-10-08T07:59:29Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。