論文の概要: Kernel-Based Optimal Control: An Infinitesimal Generator Approach
- arxiv url: http://arxiv.org/abs/2412.01591v2
- Date: Thu, 05 Dec 2024 10:22:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-06 11:19:33.464308
- Title: Kernel-Based Optimal Control: An Infinitesimal Generator Approach
- Title(参考訳): カーネルベース最適制御:無限小発電機アプローチ
- Authors: Petar Bevanda, Nicolas Hoischen, Tobias Wittmann, Jan Brüdigam, Sandra Hirche, Boris Houska,
- Abstract要約: 無限次元再生ヒルベルト核空間内での無限小生成学習を用いた非線形システムの最適制御手法を提案する。
我々の学習フレームワークは、システム力学とステージコスト関数のデータサンプルを利用しており、制御のペナルティと制約しか提供されていない。
このアプローチが現代的な凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを示し、最適制御問題に対するデータ駆動解を可能にする。
- 参考スコア(独自算出の注目度): 3.7411439050030393
- License:
- Abstract: This paper presents a novel approach for optimal control of nonlinear stochastic systems using infinitesimal generator learning within infinite-dimensional reproducing kernel Hilbert spaces. Our learning framework leverages data samples of system dynamics and stage cost functions, with only control penalties and constraints provided. The proposed method directly learns the diffusion operator of a controlled Fokker-Planck-Kolmogorov equation in an infinite-dimensional hypothesis space. This operator models the continuous-time evolution of the probability measure of the control system's state. We demonstrate that this approach seamlessly integrates with modern convex operator-theoretic Hamilton-Jacobi-Bellman recursions, enabling a data-driven solution to the optimal control problem. Furthermore, our statistical learning framework includes nonparametric estimators for uncontrolled forward infinitesimal generators as a special case. Numerical experiments, ranging from synthetic differential equations to simulated robotic systems, showcase the advantages of our approach compared to both modern data-driven and classical nonlinear programming methods for optimal control.
- Abstract(参考訳): 本稿では,無限次元再生カーネルヒルベルト空間内での無限小生成学習を用いた非線形確率系の最適制御手法を提案する。
我々の学習フレームワークは、システム力学とステージコスト関数のデータサンプルを利用しており、制御のペナルティと制約しか提供されていない。
提案手法は,無限次元仮説空間における制御されたフォッカー・プランク・コルモゴロフ方程式の拡散作用素を直接学習する。
この演算子は、制御系の状態の確率測度の連続時間進化をモデル化する。
このアプローチが現代的な凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを示し、最適制御問題に対するデータ駆動解を可能にする。
さらに, 統計的学習フレームワークには, 非制御前方無限小発電機の非パラメトリック推定器が特例として含まれている。
数値実験は、合成微分方程式からシミュレーションロボットシステムまで、現代のデータ駆動型および古典的非線形プログラミング手法による最適制御と比較して、我々のアプローチの利点を実証している。
関連論文リスト
- Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。
我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。
当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文 参考訳(メタデータ) (2024-11-04T11:09:58Z) - Data-Driven Optimal Feedback Laws via Kernel Mean Embeddings [3.007066256364399]
制御拡散過程に関連するマルコフ遷移作用素を特定するためにカーネル平均埋め込み(KME)を導入する。
従来の動的プログラミング手法とは異なり、我々の手法はカーネルトリックを利用して次元の呪いを破る。
本手法の有効性を数値的な例で示し, 非線形最適制御問題を解く能力を強調した。
論文 参考訳(メタデータ) (2024-07-23T11:53:03Z) - Random Features Approximation for Control-Affine Systems [6.067043299145924]
制御アフィン構造をキャプチャする非線形特徴表現の2つの新しいクラスを提案する。
提案手法はランダムな特徴(RF)近似を用いて,より少ない計算コストでカーネル手法の表現性を継承する。
論文 参考訳(メタデータ) (2024-06-10T17:54:57Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Sample-efficient Model-based Reinforcement Learning for Quantum Control [0.2999888908665658]
ノイズの多い時間依存ゲート最適化のためのモデルベース強化学習(RL)手法を提案する。
標準モデルフリーRLに比べて,本手法のサンプル複雑性において,桁違いの優位性を示す。
提案アルゴリズムは,部分的特徴付き1量子ビット系と2量子ビット系の制御に適している。
論文 参考訳(メタデータ) (2023-04-19T15:05:19Z) - Physics-Informed Kernel Embeddings: Integrating Prior System Knowledge
with Data-Driven Control [22.549914935697366]
カーネル埋め込みを用いたデータ駆動制御アルゴリズムに事前知識を組み込む手法を提案する。
提案手法は,カーネル学習問題におけるバイアス項として,システムダイナミクスの事前知識を取り入れたものである。
純粋にデータ駆動ベースライン上でのサンプル効率の向上と,我々のアプローチのアウト・オブ・サンプル一般化を実証する。
論文 参考訳(メタデータ) (2023-01-09T18:35:32Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Technical Report: Adaptive Control for Linearizable Systems Using
On-Policy Reinforcement Learning [41.24484153212002]
本稿では,未知システムに対するフィードバック線形化に基づくトラッキング制御系を適応的に学習するフレームワークを提案する。
学習した逆モデルがすべての時点において可逆である必要はない。
二重振り子の模擬例は、提案された理論の有用性を示している。
論文 参考訳(メタデータ) (2020-04-06T15:50:31Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。