論文の概要: Safely Learning Dynamical Systems from Short Trajectories
- arxiv url: http://arxiv.org/abs/2011.12257v1
- Date: Tue, 24 Nov 2020 18:06:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 14:40:25.950980
- Title: Safely Learning Dynamical Systems from Short Trajectories
- Title(参考訳): 短い軌道から動的システムを安全に学習する
- Authors: Amir Ali Ahmadi, Abraar Chaudhry, Vikas Sindhwani, Stephen Tu
- Abstract要約: 未知の力学系を制御することの学習における根本的な課題は、安全を維持しながら測定を行うことによってモデルの不確実性を減少させることである。
我々は,次の軌道の始点を逐次決定することで,力学系を安全に学習することの意味の数学的定義を定式化する。
本稿では,長さ1の軌跡から真の力学を安全に復元するか,安全な学習が不可能であることを証明した線形プログラミングに基づくアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 12.184674552836414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A fundamental challenge in learning to control an unknown dynamical system is
to reduce model uncertainty by making measurements while maintaining safety. In
this work, we formulate a mathematical definition of what it means to safely
learn a dynamical system by sequentially deciding where to initialize the next
trajectory. In our framework, the state of the system is required to stay
within a given safety region under the (possibly repeated) action of all
dynamical systems that are consistent with the information gathered so far. For
our first two results, we consider the setting of safely learning linear
dynamics. We present a linear programming-based algorithm that either safely
recovers the true dynamics from trajectories of length one, or certifies that
safe learning is impossible. We also give an efficient semidefinite
representation of the set of initial conditions whose resulting trajectories of
length two are guaranteed to stay in the safety region. For our final result,
we study the problem of safely learning a nonlinear dynamical system. We give a
second-order cone programming based representation of the set of initial
conditions that are guaranteed to remain in the safety region after one
application of the system dynamics.
- Abstract(参考訳): 未知力学系の制御を学ぶ上での基本的な課題は、安全性を維持しながら測定を行うことによるモデルの不確かさを減らすことである。
本研究では,次の軌道の始点を逐次決定することで,力学系を安全に学習することの意味を数学的に定義する。
本フレームワークでは,これまでに収集した情報と整合性のあるすべての力学系の(おそらく繰り返される)動作の下で,システム状態が所定の安全領域内に留まることが要求される。
最初の2つの結果について、線形力学を安全に学習するための設定を検討する。
本稿では,長さ1の軌跡から真の力学を安全に復元するか,安全な学習が不可能であることを証明した線形プログラミングに基づくアルゴリズムを提案する。
また,長さ2の軌道が安全領域に留まることを保証した初期条件の集合の効率的な半定値表現を与える。
最後に,非線形力学系を安全に学習する問題について検討する。
システムダイナミクスの1つの応用後に安全領域に留まることが保証される初期条件の集合の2次コーンプログラミングに基づく表現を与える。
関連論文リスト
- Amortized Safe Active Learning for Real-Time Decision-Making: Pretrained Neural Policies from Simulated Nonparametric Functions [23.406516455945653]
アクティブラーニング(英: Active Learning, AL)は、モデルトレーニングにおいて最も情報性の高いデータを選択することを目的とした、シーケンシャルな学習手法である。
ALの主な課題は、繰り返しモデルトレーニングとデータ選択に必要な取得最適化である。
トレーニング済みのニューラルネットワークポリシを活用することで,モデルの繰り返しトレーニングや取得最適化の必要性を解消する。
論文 参考訳(メタデータ) (2025-01-26T09:05:52Z) - Neural Contractive Dynamical Systems [13.046426079291376]
完全自律型ロボットが望ましくない、あるいは潜在的に有害な行動を起こさないためには、安定性の保証が不可欠である。
本稿では,ニューラルアーキテクチャが収縮を保証するニューラル収縮力学系を学習するための新しい手法を提案する。
提案手法は, 現状技術よりも所望の力学を正確に符号化し, 安定性の保証がより少ないことを示す。
論文 参考訳(メタデータ) (2024-01-17T17:18:21Z) - Safely Learning Dynamical Systems [13.598953823625472]
未知の力学系を学ぶ上での根本的な課題は、安全を維持しながら測定を行うことによってモデルの不確実性を減少させることである。
我々は、軌道の初期化の場所を逐次決定することで、力学系を安全に学習することの意味の数学的定義を定式化する。
トラジェクトリを安全に収集し、初期不確実性集合と整合した非線形力学のモデルに適合させる方法を示す。
論文 参考訳(メタデータ) (2023-05-20T21:35:29Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Learning Barrier Certificates: Towards Safe Reinforcement Learning with
Zero Training-time Violations [64.39401322671803]
本稿では、トレーニング時安全違反をゼロとした安全RLアルゴリズムの可能性について検討する。
本稿では、バリア証明書、動的モデル、ポリシーを反復的に学習する、CRABS(Co-trained Barrier Certificate for Safe RL)を提案する。
論文 参考訳(メタデータ) (2021-08-04T04:59:05Z) - Safe Active Dynamics Learning and Control: A Sequential
Exploration-Exploitation Framework [30.58186749790728]
本研究では,力学の不確実性の存在下での安全性を維持するための理論的に正当なアプローチを提案する。
我々のフレームワークは、常に全ての制約の高確率満足度を保証します。
この理論解析は、オンライン適応能力を改善する最終層メタラーニングモデルの2つの正則化を動機付けている。
論文 参考訳(メタデータ) (2020-08-26T17:39:58Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Neural Certificates for Safe Control Policies [108.4560749465701]
本稿では,安全かつ目標達成の両立が保証される動的システムの方針を学習するためのアプローチを開発する。
本手法の有効性は, 振り子, カートポール, UAVなどの各種システムにおいて, 安全かつ目標達成的な政策を学習するための手法の有効性を示す。
論文 参考訳(メタデータ) (2020-06-15T15:14:18Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。