論文の概要: Distributionally Robust Regret Optimal Control Under Moment-Based Ambiguity Sets
- arxiv url: http://arxiv.org/abs/2512.10906v1
- Date: Thu, 11 Dec 2025 18:36:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.529669
- Title: Distributionally Robust Regret Optimal Control Under Moment-Based Ambiguity Sets
- Title(参考訳): モーメントに基づく曖昧性集合における分布ロバスト回帰最適制御
- Authors: Feras Al Taha, Eilyan Bitar,
- Abstract要約: 雑音過程を管理する確率分布が未知な有限水平2次制御問題のクラスを考える。
因果アフィン制御ポリシは、与えられたあいまいさセットのすべての分布に対して最悪のケースで予想される後悔を最小限に抑えることができることを示す。
任意の精度で最適制御器を計算するために,スケーラブルな2重投影下次法を提案する。
- 参考スコア(独自算出の注目度): 0.3867363075280543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider a class of finite-horizon, linear-quadratic stochastic control problems, where the probability distribution governing the noise process is unknown but assumed to belong to an ambiguity set consisting of all distributions whose mean and covariance lie within norm balls centered at given nominal values. To address the distributional ambiguity, we explore the design of causal affine control policies to minimize the worst-case expected regret over all distributions in the given ambiguity set. The resulting minimax optimal control problem is shown to admit an equivalent reformulation as a tractable convex program that corresponds to a regularized version of the nominal linear-quadratic stochastic control problem. While this convex program can be recast as a semidefinite program, semidefinite programs are typically solved using primal-dual interior point methods that scale poorly with the problem size in practice. To address this limitation, we propose a scalable dual projected subgradient method to compute optimal controllers to an arbitrary accuracy. Numerical experiments are presented to benchmark the proposed method against state-of-the-art data-driven and distributionally robust control design approaches.
- Abstract(参考訳): 本稿では、雑音過程を管理する確率分布が未知であるが、与えられた名目値を中心とするノルム球内に平均と共分散が有する全ての分布からなるあいまい性集合に属すると仮定する有限水平2次確率確率制御問題のクラスについて考察する。
分布のあいまいさに対処するために、与えられたあいまいさ集合の全ての分布に対して最悪のケースで予想される後悔を最小限に抑えるために、因果アフィン制御ポリシーの設計を検討する。
得られたミニマックス最適制御問題は、名目線形四進法確率制御問題の正規化版に対応する、トラクタブル凸プログラムとして等価な再構成が認められる。
この凸プログラムは半定値プログラムとして再キャストできるが、半定値プログラムは通常、実際の問題サイズに劣る原始双対内点法を用いて解決される。
この制限に対処するため、最適制御器を任意の精度で演算するスケーラブルなデュアルプロジェクタ・サブ段階法を提案する。
提案手法を,最新のデータ駆動型および分散ロバストな制御設計手法に対して評価するために,数値実験を行った。
関連論文リスト
- Derivative-Free Sequential Quadratic Programming for Equality-Constrained Stochastic Optimization [3.2489082010225485]
我々は、客観的で決定論的な等式制約で非線形最適化問題を解くことを検討する。
本稿では,DF-SSQP法を提案する。
標準仮定では,提案したDF-SSQP法を大域的にほぼ収束させる。
論文 参考訳(メタデータ) (2025-10-25T23:51:20Z) - Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.52124921268249]
本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。
本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。
2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文 参考訳(メタデータ) (2024-09-24T04:39:47Z) - A Distributionally Robust Approach to Regret Optimal Control using the
Wasserstein Distance [1.8876415010297893]
因果線形乱れフィードバック制御器は最悪の場合の後悔を最小限に抑えるように設計されていることを示す。
トラクタブル半確定プログラムとしてミニマックス後悔最適制御問題の再構成を導出する。
我々は,ミニマックス・後悔最適制御設計法と分布論的にロバストな最適制御法との比較を行った。
論文 参考訳(メタデータ) (2023-04-13T19:10:06Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。