論文の概要: ASACK : Adaptive Safe Active Continual Koopman Learning for Uncertain Systems with Contractive Guarantees
- arxiv url: http://arxiv.org/abs/2605.09659v1
- Date: Sun, 10 May 2026 17:11:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.35499
- Title: ASACK : Adaptive Safe Active Continual Koopman Learning for Uncertain Systems with Contractive Guarantees
- Title(参考訳): ASACK : 契約保証付き不確かさシステムのための適応型安全なアクティブ・アクティブ・コンティニュアル・クープマン学習
- Authors: Chandan Kumar Sah, Rajpal Singh, Jishnu Keshavan,
- Abstract要約: クープマン作用素論 (Koopman operator theory) は、持ち上げ可観測物に作用する線型作用素を通して非線形力学を表現するための枠組みを提供する。
本稿では,学習モデルの安全かつ効率的なオンライン改善を可能にする,継続的適応型クープマン学習のための統合フレームワークを提案する。
提案したアプローチは、リアルタイム効率を犠牲にすることなく、コントロールフレームワーク内の学習、デプロイメント、安全性を統一する。
- 参考スコア(独自算出の注目度): 0.38887448816036313
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Koopman operator theory provides a powerful framework for representing nonlinear dynamics through a linear operator acting on lifted observables, enabling the use of linear control techniques for nonlinear systems. However, Koopman models are typically learned from data and often degrade in performance under model uncertainty and distributional shifts between training and deployment. Although several works have explored online adaptation to address this issue, many rely on neural network-based updates that introduce significant computational overhead and lack formal safety guarantees, limiting their suitability for real-time and safety-critical robotic applications. In this work, we propose a unified framework for continual adaptive Koopman learning that enables safe and efficient online refinement of learned models during task execution. An autoencoder-based Koopman model is first learned offline and subsequently refined online through a contractive adaptation law, which provides theoretical convergence guarantees under distributional shifts and model uncertainty. To improve data efficiency and accelerate model refinement, the adaptation mechanism is integrated with an active learning strategy that drives the system to collect informative data while accomplishing task objectives. The resulting control problem is formulated as a nonconvex optimization problem incorporating both active learning objectives and safety constraints. We further derive theoretical bounds on model approximation error and show how these bounds can be incorporated within a robust Model Predictive Control (MPC) framework to provide formal safety guarantees. The proposed approach unifies learning, excitation, and safety within a single control framework without sacrificing real-time feasibility. Extensive simulation and experimental studies demonstrate superior performance compared to state-of-the-art baselines.
- Abstract(参考訳): クープマン作用素理論は、持ち上げ可観測物に作用する線形作用素を通して非線形力学を表現するための強力なフレームワークを提供し、非線形系に線形制御技術を利用することができる。
しかしながら、Koopmanモデルは一般的にデータから学習され、モデルの不確実性とトレーニングとデプロイメントの間の分散シフトの下で、しばしばパフォーマンスが低下する。
この問題に対処するためにオンライン適応を探索する研究はいくつかあるが、多くはニューラルネットワークベースの更新に依存しており、計算オーバーヘッドが大きく、正式な安全性保証が欠如しており、リアルタイムおよび安全クリティカルなロボットアプリケーションに対する適合性が制限されている。
本研究では,タスク実行中の学習モデルの安全かつ効率的なオンライン改善を可能にする,継続的適応型クープマン学習のための統合フレームワークを提案する。
オートエンコーダをベースとしたクープマンモデルは、まずオフラインで学習され、その後、決定的適応法によりオンラインで洗練され、分散シフトの下で理論的収束保証とモデルの不確実性を提供する。
データ効率の向上とモデル改良の促進を目的として,タスク目標達成時に情報収集を行う能動的学習戦略に適応機構を組み込む。
得られた制御問題は、アクティブな学習目標と安全制約の両方を取り入れた非凸最適化問題として定式化される。
さらに、モデル近似誤差に関する理論的境界を導出し、これらの境界をモデル予測制御(MPC)フレームワークに組み込んで、正式な安全性を保証する方法を示す。
提案手法は、リアルタイムの実現性を犠牲にすることなく、単一の制御フレームワーク内での学習、励起、安全性を統一する。
大規模なシミュレーションと実験的研究は、最先端のベースラインよりも優れた性能を示した。
関連論文リスト
- Certified Neural Approximations of Nonlinear Dynamics [51.01318247729693]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T13:22:20Z) - Deep autoregressive density nets vs neural ensembles for model-based
offline reinforcement learning [2.9158689853305693]
本稿では、利用可能なデータからシステムダイナミクスを推定し、仮想モデルロールアウトにおけるポリシー最適化を行うモデルベース強化学習アルゴリズムについて考察する。
このアプローチは、実際のシステムで破滅的な失敗を引き起こす可能性のあるモデルエラーを悪用することに対して脆弱である。
D4RLベンチマークの1つのよく校正された自己回帰モデルにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2024-02-05T10:18:15Z) - Learning Exactly Linearizable Deep Dynamics Models [0.06554326244334867]
本稿では, 安定度, 信頼性, 信頼性を確保するために, 様々な制御理論を容易に適用可能な, 線形化可能な動的モデルの学習法を提案する。
提案手法は, 自動車エンジンのリアルタイム制御に応用され, 予測性能と制約下での安定制御が良好であることを示す。
論文 参考訳(メタデータ) (2023-11-30T05:40:55Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - COMBO: Conservative Offline Model-Based Policy Optimization [120.55713363569845]
ディープニューラルネットワークのような複雑なモデルによる不確実性推定は困難であり、信頼性が低い。
我々は,サポート外状態動作の値関数を正規化するモデルベースオフラインRLアルゴリズムCOMBOを開発した。
従来のオフラインモデルフリーメソッドやモデルベースメソッドと比べて、comboは一貫してパフォーマンスが良いことが分かりました。
論文 参考訳(メタデータ) (2021-02-16T18:50:32Z) - Safe Active Dynamics Learning and Control: A Sequential
Exploration-Exploitation Framework [30.58186749790728]
本研究では,力学の不確実性の存在下での安全性を維持するための理論的に正当なアプローチを提案する。
我々のフレームワークは、常に全ての制約の高確率満足度を保証します。
この理論解析は、オンライン適応能力を改善する最終層メタラーニングモデルの2つの正則化を動機付けている。
論文 参考訳(メタデータ) (2020-08-26T17:39:58Z) - Neural Lyapunov Model Predictive Control: Learning Safe Global
Controllers from Sub-optimal Examples [4.777323087050061]
多くの実世界の産業アプリケーションでは、例えば人間の操作者による実行など、既存の制御戦略を持つことが典型的である。
この研究の目的は、安全と安定性を維持する新しいコントローラを学習することで、この未知の、安全だが、最適でないポリシーを改善することである。
提案アルゴリズムは、端末コストを学習し、安定性基準に従ってMPCパラメータを更新する。
論文 参考訳(メタデータ) (2020-02-21T16:57:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。