Fugu-MT 論文翻訳(概要): SafEDMD: A certified learning architecture tailored to data-driven control of nonlinear dynamical systems

論文の概要: SafEDMD: A certified learning architecture tailored to data-driven control of nonlinear dynamical systems

arxiv url: http://arxiv.org/abs/2402.03145v1
Date: Mon, 5 Feb 2024 16:12:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-06 15:06:43.541132
Title: SafEDMD: A certified learning architecture tailored to data-driven control of nonlinear dynamical systems
Title（参考訳）: SafEDMD:非線形力学系のデータ駆動制御に適した認定学習アーキテクチャ
Authors: Robin Str\"asser, Manuel Schaller, Karl Worthmann, Julian Berberich, Frank Allg\"ower
Abstract要約: クープマン作用素は動的制御系の機械学習の理論的バックボーンとして機能する。本稿では,厳密な証明とともに提供されるEDMDベースの新しい学習アーキテクチャであるSafEDMDを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The Koopman operator serves as the theoretical backbone for machine learning of dynamical control systems, where the operator is heuristically approximated by extended dynamic mode decomposition (EDMD). In this paper, we propose Stability- and certificate-oriented EDMD (SafEDMD): a novel EDMD-based learning architecture which comes along with rigorous certificates, resulting in a reliable surrogate model generated in a data-driven fashion. To ensure trustworthiness of SafEDMD, we derive proportional error bounds, which vanish at the origin and are tailored for control tasks, leading to certified controller design based on semi-definite programming. We illustrate the developed machinery by means of several benchmark examples and highlight the advantages over state-of-the-art methods.
Abstract（参考訳）: クープマン作用素は動的制御系の機械学習の理論的バックボーンとして機能し、演算子は拡張動的モード分解(EDMD)によってヒューリスティックに近似される。本稿では,厳密な証明書とともに,データ駆動方式で生成された信頼性の高いサロゲートモデルを実現する,新しいedmdベースの学習アーキテクチャである,安定性と証明書指向のedmd(safedmd)を提案する。 SafEDMDの信頼性を確保するために、原点から消え、制御タスクに適した比例誤差境界を導出し、半定値プログラミングに基づく認証制御設計を実現する。本稿では,いくつかのベンチマーク例を用いて開発機械を説明し,最先端手法の利点を強調した。

関連論文リスト

Optimal Derivative Feedback Control for an Active Magnetic Levitation System: An Experimental Study on Data-Driven Approaches [0.0]
本稿では,アクティブ磁気浮上システムのためのデータ駆動型最適微分フィードバックコントローラの設計と実装について述べる。直接モデルフリーなアプローチでは、複数のプロセスデータを集めるためにエポックループと呼ばれる反復層を追加するポリシーの反復手順が提案されている。以上の結果から, 両制御器は名目モデルから設計した制御器と比較して, 磁気浮上系の性能を安定させ, 向上させることができるが, 直接モデルフリーアプローチは複数のエポックが許容された場合, 間接解よりも常に優れることがわかった。
論文参考訳（メタデータ） (2026-02-06T18:42:01Z)
Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。 i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文参考訳（メタデータ） (2025-12-09T06:26:02Z)
MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems [5.760286686122843]
メタアダプティブ・クープマン演算子 (MAKO) と呼ばれる適応型メタラーニングに基づくモデリング手法を提案する。提案手法は, モデル精度と制御効率の両面において, 競合するベースラインと比較して優れた性能を示す。
論文参考訳（メタデータ） (2025-10-10T06:23:36Z)
Learning Noise-Robust Stable Koopman Operator for Control with Hankel DMD [1.0742675209112622]
非線形力学系のクープマン演算子に対するノイズロスト学習フレームワークを提案する。システム力学が既知のとき, システム力学によって生成される可観測性は, ハンケル行列を通して利用することができる。離散的なPolyflowと構造的類似性を保ちながら、ニューラルネットワークで近似する。
論文参考訳（メタデータ） (2024-08-13T03:39:34Z)
Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文参考訳（メタデータ） (2024-01-09T11:54:54Z)
Learning Exactly Linearizable Deep Dynamics Models [0.07366405857677226]
本稿では, 安定度, 信頼性, 信頼性を確保するために, 様々な制御理論を容易に適用可能な, 線形化可能な動的モデルの学習法を提案する。提案手法は, 自動車エンジンのリアルタイム制御に応用され, 予測性能と制約下での安定制御が良好であることを示す。
論文参考訳（メタデータ） (2023-11-30T05:40:55Z)
Promises of Deep Kernel Learning for Control Synthesis [14.401542690028554]
ディープラーニング(DKL)は、ニューラルネットワークの表現力とガウス過程の不確実性を組み合わせたものだ。動的システムの制御にDKLを用いることが可能な,スケーラブルな抽象化ベースのフレームワークを開発した。
論文参考訳（メタデータ） (2023-09-12T20:04:16Z)
Diffusion Model as Representation Learner [86.09969334071478]
Diffusion Probabilistic Models (DPMs) は、最近、様々な生成タスクにおいて顕著な結果を示した。本稿では,DPMが獲得した知識を認識タスクに活用する新しい知識伝達手法を提案する。
論文参考訳（メタデータ） (2023-08-21T00:38:39Z)
A modular framework for stabilizing deep reinforcement learning control [3.3598755777055374]
本稿では,深層強化学習の最適化駆動とモデルフリーの利点と安定性の保証を組み合わせたフィードバックコントローラ設計のためのフレームワークを提案する。近年の行動システムの発展により,データ駆動型内部モデルの構築が可能となった。これにより、入力出力探索データに基づくYoula-Kuceraパラメータ化の代替実現が可能になる。
論文参考訳（メタデータ） (2023-04-07T00:09:17Z)
In-Distribution Barrier Functions: Self-Supervised Policy Filters that Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文参考訳（メタデータ） (2023-01-27T22:28:19Z)
EmbedDistill: A Geometric Knowledge Distillation for Information Retrieval [83.79667141681418]
大規模なニューラルモデル(トランスフォーマーなど)は、情報検索(IR)のための最先端のパフォーマンスを達成する本研究では,大規模教師モデルで学習したクエリとドキュメント間の相対的幾何を利用した新しい蒸留手法を提案する。提案手法は, 両エンコーダ (DE) とクロスエンコーダ (CE) の2種類の教師モデルから, 95～97%の教師性能を維持できる1/10の非対称な学生への蒸留に成功した。
論文参考訳（メタデータ） (2023-01-27T22:04:37Z)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (2021-11-18T23:21:00Z)
Transferring Reinforcement Learning for DC-DC Buck Converter Control via Duty Ratio Mapping: From Simulation to Implementation [0.0]
本稿では,DC-DCコンバータ用のデリケートに設計されたデューティ比マッピング(DRM)を用いた転送手法を提案する。モデルフリー深部強化学習(DRL)コントローラの実装を可能にするために,詳細なsim-to-realプロセスを提案する。
論文参考訳（メタデータ） (2021-10-20T11:08:17Z)
Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。最適制御には無関係な状態変数を特徴付ける。
論文参考訳（メタデータ） (2021-10-12T16:41:47Z)
Is Disentanglement enough? On Latent Representations for Controllable Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。 VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文参考訳（メタデータ） (2021-08-01T18:37:43Z)
Deep Learning Explicit Differentiable Predictive Control Laws for Buildings [1.4121977037543585]
未知の非線形システムに対する制約付き制御法を学習するための微分予測制御(DPC)手法を提案する。 DPCは、明示的非線形モデル予測制御(MPC)から生じるマルチパラメトリックプログラミング問題に対する近似解を提供する
論文参考訳（メタデータ） (2021-07-25T16:47:57Z)
Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文参考訳（メタデータ） (2021-05-17T08:36:18Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Imposing Robust Structured Control Constraint on Reinforcement Learning of Linear Quadratic Regulator [0.0]
本稿では,分散学習制御の手法を編み出した汎用構造の設計について述べる。方法論の開発には、強化学習(RL)と制御理論による十分な安定性と性能保証を併用した考え方を用いる。 6エージェントのマルチエージェントネットワーク上でのシミュレーションによる理論的結果の検証を行った。
論文参考訳（メタデータ） (2020-11-12T00:31:39Z)
Extended Radial Basis Function Controller for Reinforcement Learning [3.42658286826597]
本稿では,モデルベース線形コントローラと任意の微分可能なポリシを動的に補間するハイブリッド強化学習コントローラを提案する。線形制御器は、局所線形化モデル知識に基づいて設計され、運転点付近のシステムを安定化する。学習はモデルベース(PILCO)とモデルフリー(DDPG)の両方のフレームワークで行われている。
論文参考訳（メタデータ） (2020-09-12T20:56:48Z)
How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文参考訳（メタデータ） (2020-05-25T12:13:49Z)
Guided Variational Autoencoder for Disentanglement Learning [79.02010588207416]
本稿では,潜在表現非絡み合い学習を行うことで,制御可能な生成モデルを学習できるアルゴリズム,Guided-VAEを提案する。我々は、ガイド-VAEにおける教師なし戦略と教師なし戦略を設計し、バニラVAE上でのモデリングと制御能力の強化を観察する。
論文参考訳（メタデータ） (2020-04-02T20:49:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。