Fugu-MT 論文翻訳(概要): Data-Driven Optimal Feedback Laws via Kernel Mean Embeddings

論文の概要: Data-Driven Optimal Feedback Laws via Kernel Mean Embeddings

arxiv url: http://arxiv.org/abs/2407.16407v1
Date: Tue, 23 Jul 2024 11:53:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-24 17:26:03.788100
Title: Data-Driven Optimal Feedback Laws via Kernel Mean Embeddings
Title（参考訳）: カーネル平均埋め込みによるデータ駆動フィードバック法則
Authors: Petar Bevanda, Nicolas Hoischen, Stefan Sosnowski, Sandra Hirche, Boris Houska,
Abstract要約: 制御拡散過程に関連するマルコフ遷移作用素を特定するためにカーネル平均埋め込み(KME)を導入する。従来の動的プログラミング手法とは異なり、我々の手法はカーネルトリックを利用して次元の呪いを破る。本手法の有効性を数値的な例で示し, 非線形最適制御問題を解く能力を強調した。
参考スコア（独自算出の注目度）: 3.007066256364399
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper proposes a fully data-driven approach for optimal control of nonlinear control-affine systems represented by a stochastic diffusion. The focus is on the scenario where both the nonlinear dynamics and stage cost functions are unknown, while only control penalty function and constraints are provided. Leveraging the theory of reproducing kernel Hilbert spaces, we introduce novel kernel mean embeddings (KMEs) to identify the Markov transition operators associated with controlled diffusion processes. The KME learning approach seamlessly integrates with modern convex operator-theoretic Hamilton-Jacobi-Bellman recursions. Thus, unlike traditional dynamic programming methods, our approach exploits the ``kernel trick'' to break the curse of dimensionality. We demonstrate the effectiveness of our method through numerical examples, highlighting its ability to solve a large class of nonlinear optimal control problems.
Abstract（参考訳）: 本稿では,確率拡散に代表される非線形制御-アフィン系の最適制御のための,完全なデータ駆動型アプローチを提案する。制御ペナルティ関数と制約のみを提供しながら、非線形ダイナミクスとステージコスト関数の両方が未知のシナリオに焦点を当てている。カーネルヒルベルト空間の再生理論を応用し、制御拡散過程に関連するマルコフ遷移作用素を特定するために、新しいカーネル平均埋め込み(KME)を導入する。 KME学習アプローチは、現代的な凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合される。したがって、従来の動的プログラミング手法とは異なり、我々の手法は'カーネルトリック'を利用して次元の呪いを破る。本手法の有効性を数値的な例で示し, 非線形最適制御問題を解く能力を強調した。

関連論文リスト

Verifying Closed-Loop Contractivity of Learning-Based Controllers via Partitioning [52.23804865017831]
本稿では,ニューラルネットワークによるパラメータ化を行う非線形制御系における閉ループ収縮の検証問題に対処する。我々は、対称メッツラー行列の優越的固有値が非正であることを確かめるために、閉ループの縮約性に対するトラクタブルでスケーラブルな十分条件を導出する。
論文参考訳（メタデータ） (2025-12-01T23:06:56Z)
Equation-Free Coarse Control of Distributed Parameter Systems via Local Neural Operators [1.5484595752241122]
本稿では,局所的ニューロ演算子を顕微鏡・メソスコピックデータで訓練し,効率的な短時間解演算子を得るデータ駆動型代替手法を提案する。その後、Krylov-Arnoldi は支配的な固有スペクトルを近似し、ヤコビアン集合を明示せずに開ループのスローダイナミクスを捕捉する縮小モデルを生成する。
論文参考訳（メタデータ） (2025-09-28T17:01:53Z)
Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。 ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文参考訳（メタデータ） (2025-03-24T03:19:45Z)
Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergence [11.400431211239958]
拡散モデルは生成モデリングの強力なツールとして登場してきた。微調整拡散モデルのための制御フレームワークを提案する。 PI-FTは線形速度で大域収束することを示す。
論文参考訳（メタデータ） (2024-12-24T04:55:46Z)
Kernel-Based Optimal Control: An Infinitesimal Generator Approach [3.7411439050030393]
本稿では,非線形システムの最適制御のための演算子理論的手法を提案する。我々の学習フレームワークは,システムダイナミクスとステージコスト関数のデータサンプルを活用する。我々は、我々のアプローチが現代の凸作用素-理論的ハミルトン・ヤコビ・ベルマン再帰とシームレスに統合されることを実証する。
論文参考訳（メタデータ） (2024-12-02T15:08:55Z)
Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文参考訳（メタデータ） (2024-11-04T11:09:58Z)
A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文参考訳（メタデータ） (2024-10-07T16:16:53Z)
Random Features Approximation for Control-Affine Systems [6.067043299145924]
制御アフィン構造をキャプチャする非線形特徴表現の2つの新しいクラスを提案する。提案手法はランダムな特徴(RF)近似を用いて,より少ない計算コストでカーネル手法の表現性を継承する。
論文参考訳（メタデータ） (2024-06-10T17:54:57Z)
Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文参考訳（メタデータ） (2024-05-01T21:11:29Z)
Physics-Informed Kernel Embeddings: Integrating Prior System Knowledge with Data-Driven Control [22.549914935697366]
カーネル埋め込みを用いたデータ駆動制御アルゴリズムに事前知識を組み込む手法を提案する。提案手法は,カーネル学習問題におけるバイアス項として,システムダイナミクスの事前知識を取り入れたものである。純粋にデータ駆動ベースライン上でのサンプル効率の向上と,我々のアプローチのアウト・オブ・サンプル一般化を実証する。
論文参考訳（メタデータ） (2023-01-09T18:35:32Z)
Learning to Optimize with Stochastic Dominance Constraints [103.26714928625582]
本稿では,不確実量を比較する問題に対して,単純かつ効率的なアプローチを開発する。我々はラグランジアンの内部最適化をサロゲート近似の学習問題として再考した。提案したライト-SDは、ファイナンスからサプライチェーン管理に至るまで、いくつかの代表的な問題において優れた性能を示す。
論文参考訳（メタデータ） (2022-11-14T21:54:31Z)
Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文参考訳（メタデータ） (2022-02-16T11:40:36Z)
Learning over All Stabilizing Nonlinear Controllers for a Partially-Observed Linear System [4.3012765978447565]
線形力学系に対する非線形出力フィードバックコントローラのパラメータ化を提案する。提案手法は, 制約を満たすことなく, 部分的に観測可能な線形力学系の閉ループ安定性を保証する。
論文参考訳（メタデータ） (2021-12-08T10:43:47Z)
Deep Learning Approximation of Diffeomorphisms via Linear-Control Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文参考訳（メタデータ） (2021-10-24T08:57:46Z)
Optimization on manifolds: A symplectic approach [127.54402681305629]
本稿では、最適化問題を解くための一般的な枠組みとして、ディラックの制約付きハミルトン系理論の散逸拡張を提案する。我々の(加速された)アルゴリズムのクラスは単純で効率的なだけでなく、幅広い文脈にも適用できる。
論文参考訳（メタデータ） (2021-07-23T13:43:34Z)
Control Occupation Kernel Regression for Nonlinear Control-Affine Systems [6.308539010172309]
非線形高次制御アフィン力学系の近似を求めるアルゴリズムを提案する。ヒルベルト空間のベクトル値構造は、ドリフトと制御アフィン系の制御有効成分の同時近似を可能にする。
論文参考訳（メタデータ） (2021-05-31T21:14:30Z)
Estimating Koopman operators for nonlinear dynamical systems: a nonparametric approach [77.77696851397539]
Koopman演算子は非線形系の線形記述を可能にする数学的ツールである。本稿では,その核となる部分を同一フレームワークのデュアルバージョンとして捉え,それらをカーネルフレームワークに組み込む。カーネルメソッドとKoopman演算子との強力なリンクを確立し、Kernel関数を通じて後者を推定する。
論文参考訳（メタデータ） (2021-03-25T11:08:26Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Information Theoretic Regret Bounds for Online Nonlinear Control [35.534829914047336]
未知の非線形力学系における逐次制御の問題について検討する。この枠組みは、離散的かつ連続的な制御入力と非滑らかで微分不可能な力学を許容する一般的な設定を与える。実験により, 非線形制御タスクへの応用を実証し, モデル力学の学習における探索の利点を実証する。
論文参考訳（メタデータ） (2020-06-22T17:46:48Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。