論文の概要: Learning Stability Certificates from Data
- arxiv url: http://arxiv.org/abs/2008.05952v2
- Date: Mon, 14 Sep 2020 17:47:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 22:56:06.729453
- Title: Learning Stability Certificates from Data
- Title(参考訳): データから安定証明書を学習する
- Authors: Nicholas M. Boffi and Stephen Tu and Nikolai Matni and Jean-Jacques E.
Slotine and Vikas Sindhwani
- Abstract要約: 我々は,軌道データのみから認証関数を学習するアルゴリズムを開発した。
このような一般化誤差境界を大域的安定性保証に変換する。
複雑な力学の証明を効率的に学習できることを実証的に実証する。
- 参考スコア(独自算出の注目度): 19.381365606166725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many existing tools in nonlinear control theory for establishing stability or
safety of a dynamical system can be distilled to the construction of a
certificate function that guarantees a desired property. However, algorithms
for synthesizing certificate functions typically require a closed-form
analytical expression of the underlying dynamics, which rules out their use on
many modern robotic platforms. To circumvent this issue, we develop algorithms
for learning certificate functions only from trajectory data. We establish
bounds on the generalization error - the probability that a certificate will
not certify a new, unseen trajectory - when learning from trajectories, and we
convert such generalization error bounds into global stability guarantees. We
demonstrate empirically that certificates for complex dynamics can be
efficiently learned, and that the learned certificates can be used for
downstream tasks such as adaptive control.
- Abstract(参考訳): 力学系の安定性や安全性を確立するための非線形制御理論の既存の多くのツールは、望ましい性質を保証する証明関数を構築するために蒸留することができる。
しかし、証明関数を合成するアルゴリズムは通常、基礎となる力学のクローズドフォームな解析式を必要とし、現代の多くのロボットプラットフォームでの使用を規定している。
この問題を回避するため,軌道データのみから認証関数を学習するアルゴリズムを開発した。
一般化誤差 - トラジェクトリから学ぶとき、証明書が新しい未知の軌道を証明しない確率 - に境界を設定し、そのような一般化誤差境界をグローバルな安定性保証に変換する。
我々は,複雑なダイナミクスのための証明書を効率的に学習し,学習した証明書を適応制御などの下流タスクに使用できることを示す。
関連論文リスト
- Towards Certified Unlearning for Deep Neural Networks [50.816473152067104]
認定されていない未学習は、凸機械学習モデルで広く研究されている。
認定アンラーニングとディープニューラルネットワーク(DNN)のギャップを埋める手法をいくつか提案する。
論文 参考訳(メタデータ) (2024-08-01T21:22:10Z) - FullCert: Deterministic End-to-End Certification for Training and Inference of Neural Networks [62.897993591443594]
FullCertは、音と決定論的境界を持つ最初のエンドツーエンドの認証器である。
2つのデータセットに対してFullCertの有効性を実験的に示す。
論文 参考訳(メタデータ) (2024-06-17T13:23:52Z) - Self-consistent Validation for Machine Learning Electronic Structure [81.54661501506185]
機械学習と自己整合フィールド法を統合して,検証コストの低減と解釈可能性の両立を実現する。
これにより、積極的学習によるモデルの能力の探索が可能となり、実際の研究への統合への信頼がもたらされる。
論文 参考訳(メタデータ) (2024-02-15T18:41:35Z) - Adaptive Hierarchical Certification for Segmentation using Randomized Smoothing [87.48628403354351]
機械学習の認証は、特定の条件下では、敵対的なサンプルが特定の範囲内でモデルを回避できないことを証明している。
セグメンテーションの一般的な認証方法は、平らな粒度のクラスを使い、モデルの不確実性による高い断続率をもたらす。
本稿では,複数レベルの階層内で画素を認証し,不安定なコンポーネントに対して粗いレベルに適応的に認証を緩和する,新しい,より実用的な設定を提案する。
論文 参考訳(メタデータ) (2024-02-13T11:59:43Z) - Safe Online Dynamics Learning with Initially Unknown Models and
Infeasible Safety Certificates [45.72598064481916]
本稿では、制御バリア関数(CBF)2次コーンプログラムに基づく、堅牢な安全証明書を備えた学習ベースの設定について考察する。
制御バリア関数証明書が実現可能ならば,その安全性を確保するため,本手法では,データ収集と制御バリア関数制約の実現可能性の回復のために,システムダイナミクスを探索する。
論文 参考訳(メタデータ) (2023-11-03T14:23:57Z) - A General Framework for Verification and Control of Dynamical Models via Certificate Synthesis [54.959571890098786]
システム仕様を符号化し、対応する証明書を定義するためのフレームワークを提供する。
コントローラと証明書を形式的に合成する自動化手法を提案する。
我々のアプローチは、ニューラルネットワークの柔軟性を利用して、制御のための安全な学習の幅広い分野に寄与する。
論文 参考訳(メタデータ) (2023-09-12T09:37:26Z) - Certifying Out-of-Domain Generalization for Blackbox Functions [20.997611019445657]
本稿では,2つの分布の平均距離と分散距離を限定した新しい認証フレームワークを提案する。
我々は、ImageNetを含む複数のデータセットに対して、認証手法を実験的に検証した。
論文 参考訳(メタデータ) (2022-02-03T16:47:50Z) - Joint Differentiable Optimization and Verification for Certified
Reinforcement Learning [91.93635157885055]
安全クリティカル制御システムのためのモデルベース強化学習では,システム特性を正式に認定することが重要である。
本稿では,強化学習と形式検証を共同で行う枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-28T16:53:56Z) - Adversarially Robust Stability Certificates can be Sample-Efficient [14.658040519472646]
未知の非線形力学系に対する逆向きに頑健な安定性証明について考察する。
敵安定証明書を学習する統計的コストは,定型的安定性証明書を学習するのと同程度であることを示す。
論文 参考訳(メタデータ) (2021-12-20T17:23:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。