論文の概要: On Convex Data-Driven Inverse Optimal Control for Nonlinear,
Non-stationary and Stochastic Systems
- arxiv url: http://arxiv.org/abs/2306.13928v1
- Date: Sat, 24 Jun 2023 10:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 18:08:45.577424
- Title: On Convex Data-Driven Inverse Optimal Control for Nonlinear,
Non-stationary and Stochastic Systems
- Title(参考訳): 非線形・非定常・確率系の凸データ駆動逆最適制御について
- Authors: Emiland Garrabe, Hozefa Jesawada, Carmen Del Vecchio, Giovanni Russo
- Abstract要約: 本稿では,逆制御問題の解法によりコストを推定できる結果を提案する。
また,本手法の有効性を,実ハードウェアによる検証と実験の両方を通じて示す。
- 参考スコア(独自算出の注目度): 1.4830700792215845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper is concerned with a finite-horizon inverse control problem, which
has the goal of inferring, from observations, the possibly non-convex and
non-stationary cost driving the actions of an agent. In this context, we
present a result that enables cost estimation by solving an optimization
problem that is convex even when the agent cost is not and when the underlying
dynamics is nonlinear, non-stationary and stochastic. To obtain this result, we
also study a finite-horizon forward control problem that has randomized
policies as decision variables. For this problem, we give an explicit
expression for the optimal solution. Moreover, we turn our findings into
algorithmic procedures and we show the effectiveness of our approach via both
in-silico and experimental validations with real hardware. All the experiments
confirm the effectiveness of our approach.
- Abstract(参考訳): 本稿では,エージェントの動作を駆動する非凸性および非定常コストを観測から推定する目的を持つ有限水平逆制御問題について考察する。
本稿では,エージェントコストが存在しない場合や基礎となるダイナミクスが非線形で非定常で確率的であっても凸である最適化問題を解くことで,コスト推定を可能にする結果を示す。
この結果を得るために、決定変数としてポリシーをランダム化した有限水平前方制御問題についても検討する。
この問題に対して、最適解に対する明示的な表現を与える。
さらに,本研究の成果をアルゴリズム的手法に転換し,本手法の有効性を実ハードウェアで検証し,本手法の有効性を示す。
実験はすべて、我々のアプローチの有効性を確認します。
関連論文リスト
- OTClean: Data Cleaning for Conditional Independence Violations using
Optimal Transport [51.6416022358349]
sysは、条件付き独立性(CI)制約下でのデータ修復に最適な輸送理論を利用するフレームワークである。
我々はSinkhornの行列スケーリングアルゴリズムにインスパイアされた反復アルゴリズムを開発し、高次元および大規模データを効率的に処理する。
論文 参考訳(メタデータ) (2024-03-04T18:23:55Z) - Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous
Unobserved Confounders [16.193776814471768]
連続的に外生的でない共同設立者が存在する場合、ロバストな政策評価と政策最適化について検討する。
本研究は,敗血症治療のシミュレーションと実世界の縦断医療データの両方において,複雑性境界,洞察,有効性を示す。
論文 参考訳(メタデータ) (2023-02-01T18:40:53Z) - Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。
我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。
提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-14T21:54:31Z) - Efficient Online Linear Control with Stochastic Convex Costs and Unknown
Dynamics [0.0]
本稿では,最良安定化線形コントローラに対して,最適$sqrtT$後悔率を得る計算効率のよいアルゴリズムを提案する。
これまでの研究とは対照的に,我々のアルゴリズムは顔の不確実性パラダイムにおける最適化に基づいている。
論文 参考訳(メタデータ) (2022-03-02T15:19:20Z) - Distributionally Robust Optimization with Markovian Data [8.126833795693699]
本研究では,不確実な問題パラメータの確率分布が不明なプログラムについて検討する。
本稿では,問題の目的関数と最適解を推定するために,データ駆動型分布法を提案する。
論文 参考訳(メタデータ) (2021-06-12T10:59:02Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Proximal Causal Learning with Kernels: Two-Stage Estimation and Moment
Restriction [39.51144507601913]
我々は近位因果学習の設定に焦点をあてるが、本手法はフレドホルム積分方程式によって特徴づけられるより広い逆問題のクラスを解くのに使うことができる。
我々は,各アルゴリズムに一貫性の保証を提供し,これらの手法が合成データと実世界のタスクをシミュレートしたデータにおいて競争的な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2021-05-10T17:52:48Z) - A sampling criterion for constrained Bayesian optimization with
uncertainties [0.0]
本稿では,関数を最適化し,制約を満たす確率制約最適化の問題について考察する。
このような問題に対処するために,新しいベイズ最適化法を提案する。
これは、不確実性が入力の一部から生じる状況に適用され、共同制御された制御されていない入力空間における取得基準を定義することができる。
論文 参考訳(メタデータ) (2021-03-09T20:35:56Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Differentiable Causal Discovery from Interventional Data [141.41931444927184]
本稿では、介入データを活用可能なニューラルネットワークに基づく理論的基盤化手法を提案する。
提案手法は,様々な環境下での美術品の状態と良好に比較できることを示す。
論文 参考訳(メタデータ) (2020-07-03T15:19:17Z) - High-Dimensional Robust Mean Estimation via Gradient Descent [73.61354272612752]
一定対向分数の存在下でのロバスト平均推定の問題は勾配降下によって解けることを示す。
我々の研究は、近辺の非補題推定とロバスト統計の間の興味深い関係を確立する。
論文 参考訳(メタデータ) (2020-05-04T10:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。