論文の概要: Scalable Data-Driven Reachability Analysis and Control via Koopman Operators with Conformal Coverage Guarantees
- arxiv url: http://arxiv.org/abs/2601.01076v1
- Date: Sat, 03 Jan 2026 05:31:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.001291
- Title: Scalable Data-Driven Reachability Analysis and Control via Koopman Operators with Conformal Coverage Guarantees
- Title(参考訳): コンフォーマルカバレッジ保証付きクープマン演算子によるスケーラブルデータ駆動の到達可能性解析と制御
- Authors: Devesh Nath, Haoran Yin, Glen Chou,
- Abstract要約: 我々は、ニューラルネットワーク(NN)リフト関数でクープマン理論を用いて、力学の近似線形表現を学習する。
我々は、NN検証ツールを介して、クローズドループ到達可能なセットを元の状態空間にマップする。
高次元MuJoCoタスクの結果、既存の手法よりも到達可能な設定カバレッジ率、計算効率、保守性が向上した。
- 参考スコア(独自算出の注目度): 8.09931279904483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a scalable reachability-based framework for probabilistic, data-driven safety verification of unknown nonlinear dynamics. We use Koopman theory with a neural network (NN) lifting function to learn an approximate linear representation of the dynamics and design linear controllers in this space to enable closed-loop tracking of a reference trajectory distribution. Closed-loop reachable sets are efficiently computed in the lifted space and mapped back to the original state space via NN verification tools. To capture model mismatch between the Koopman dynamics and the true system, we apply conformal prediction to produce statistically-valid error bounds that inflate the reachable sets to ensure the true trajectories are contained with a user-specified probability. These bounds generalize across references, enabling reuse without recomputation. Results on high-dimensional MuJoCo tasks (11D Hopper, 28D Swimmer) and 12D quadcopters show improved reachable set coverage rate, computational efficiency, and conservativeness over existing methods.
- Abstract(参考訳): 本稿では,未知の非線形力学の確率的,データ駆動型安全性検証のための拡張性に基づくフレームワークを提案する。
我々は、ニューラルネットワーク(NN)リフト機能を用いて、この空間における力学の近似線形表現と設計線形コントローラを学習し、基準軌道分布の閉ループ追跡を可能にする。
閉ループ到達可能な集合は、持ち上げられた空間で効率的に計算され、NN検証ツールを介して元の状態空間にマップされる。
コープマン力学と真の系とのモデルミスマッチを捉えるために、共形予測を適用して、到達可能な集合をインフレさせ、真の軌道がユーザ特定確率に含まれることを保証する統計的に有意な誤差境界を生成する。
これらの境界は参照をまたいで一般化され、再計算なしで再利用が可能である。
高次元MuJoCoタスク(11Dホッパー,28Dスイマー)と12Dクワッドコプターの結果,既存の手法よりも到達率,計算効率,保守性が向上した。
関連論文リスト
- KoopCast: Trajectory Forecasting via Koopman Operators [12.103961182264037]
一般的な動的環境における軌跡予測のための軽量モデルKoopCastを提案する。
我々は、高次元空間に軌道を持ち上げることによって非線形力学の線型表現を可能にするクープマン作用素理論を用いる。
我々のモデルは,競争精度,(ii)クープマン理論に基づく解釈可能性,(iii)低遅延展開の3つの主要な利点を提供する。
論文 参考訳(メタデータ) (2025-09-19T01:27:53Z) - Deep Bilinear Koopman Model for Real-Time Vehicle Control in Frenet Frame [0.0]
本稿では,カービリニアFrenetフレーム内の車両力学のモデリングと制御のための深いクープマン手法を提案する。
提案フレームワークは、深層ニューラルネットワークアーキテクチャを使用して、データからクープマン演算子とその関連する不変部分空間を同時に学習する。
提案した制御器は, ベースライン制御器と比較して追従誤差を著しく低減し, 組込み自動運転車システムにおけるリアルタイム実装に適していることを確認した。
論文 参考訳(メタデータ) (2025-07-16T18:49:44Z) - Certified Neural Approximations of Nonlinear Dynamics [51.01318247729693]
安全クリティカルな文脈では、神経近似の使用は、基礎となるシステムとの密接性に公式な境界を必要とする。
本稿では,認証された一階述語モデルに基づく新しい,適応的で並列化可能な検証手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T13:22:20Z) - Data-Driven Stochastic Optimal Control in Reproducing Kernel Hilbert Spaces [4.722936792899906]
本稿では拡散に代表される非線形制御-アフィン系の最適制御のための完全データ駆動方式を提案する。
非線形力学とステージコスト関数の両方が未知であり、制御ペナルティ関数と制約のみを提供するシナリオに焦点が当てられている。
数値計算の結果,自律型水中車両の深度制御など,多様な非線形制御タスクに対処できることが示されている。
論文 参考訳(メタデータ) (2024-07-23T11:53:03Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Kalman Filter for Online Classification of Non-Stationary Data [101.26838049872651]
オンライン連続学習(OCL)では、学習システムはデータのストリームを受け取り、予測とトレーニングの手順を順次実行する。
本稿では,線形予測量に対するニューラル表現と状態空間モデルを用いた確率ベイズオンライン学習モデルを提案する。
多クラス分類の実験では、モデルの予測能力と非定常性を捉える柔軟性を示す。
論文 参考訳(メタデータ) (2023-06-14T11:41:42Z) - Stochastic Deep Model Reference Adaptive Control [9.594432031144715]
本稿では,ディープニューラルネットワークを用いたモデル参照適応制御を提案する。
Deep Model Reference Adaptive Controlは、DNNモデルの出力層重みをリアルタイムに適応させるために、リアプノフ法を用いる。
データ駆動型教師付き学習アルゴリズムは、内部層パラメータの更新に使用される。
論文 参考訳(メタデータ) (2021-08-04T14:05:09Z) - Model Error Propagation via Learned Contraction Metrics for Safe
Feedback Motion Planning of Unknown Systems [4.702729080310267]
本稿では,局所的に安定化可能な動的システムの収縮に基づくフィードバック動作計画法を提案する。
動的データセットが与えられたとき、本手法はダイナミクスの深い制御親和近似を学習する。
4dカー,6dクワッドローター,22d変形可能なオブジェクト操作タスクにおいて,高次元不動システムの学習モデルを用いて,提案手法を安全に提示する。
論文 参考訳(メタデータ) (2021-04-18T03:34:00Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。