論文の概要: BURNS: Backward Underapproximate Reachability for Neural-Feedback-Loop Systems
- arxiv url: http://arxiv.org/abs/2505.03643v1
- Date: Tue, 06 May 2025 15:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-07 18:50:11.456461
- Title: BURNS: Backward Underapproximate Reachability for Neural-Feedback-Loop Systems
- Title(参考訳): BURNS:Neural-Feedback-Loopシステムに対する後方不適応性
- Authors: Chelsea Sidrane, Jana Tumova,
- Abstract要約: 本稿では,非線形離散時間ニューラルフィードバックループの下位到達可能な集合を計算するためのアルゴリズムを提案する。
次に、後方到達可能なセットを使用してゴール到達特性をチェックします。
私たちの研究は、学習可能なシステムで検証可能なプロパティのクラスを拡張します。
- 参考スコア(独自算出の注目度): 8.696305200911455
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Learning-enabled planning and control algorithms are increasingly popular, but they often lack rigorous guarantees of performance or safety. We introduce an algorithm for computing underapproximate backward reachable sets of nonlinear discrete time neural feedback loops. We then use the backward reachable sets to check goal-reaching properties. Our algorithm is based on overapproximating the system dynamics function to enable computation of underapproximate backward reachable sets through solutions of mixed-integer linear programs. We rigorously analyze the soundness of our algorithm and demonstrate it on a numerical example. Our work expands the class of properties that can be verified for learning-enabled systems.
- Abstract(参考訳): 学習可能な計画と制御アルゴリズムはますます人気があるが、パフォーマンスや安全性の厳格な保証が欠けていることが多い。
本稿では,非線形離散時間ニューラルフィードバックループの下位到達可能な集合を計算するためのアルゴリズムを提案する。
次に、後方到達可能なセットを使用してゴール到達特性をチェックします。
本アルゴリズムは,混合整数線形プログラムの解を用いて,不適応な後方到達集合の計算を可能にするために,システムダイナミクス関数の過剰近似に基づく。
我々はアルゴリズムの音質を厳密に分析し、数値的な例でそれを実証する。
私たちの研究は、学習可能なシステムで検証可能なプロパティのクラスを拡張します。
関連論文リスト
- A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文 参考訳(メタデータ) (2024-09-18T14:57:13Z) - The Clock and the Pizza: Two Stories in Mechanistic Explanation of
Neural Networks [59.26515696183751]
ニューラルネットワークにおけるアルゴリズム発見は、時としてより複雑であることを示す。
単純な学習問題でさえ、驚くほど多様なソリューションを許容できることが示されています。
論文 参考訳(メタデータ) (2023-06-30T17:59:13Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Interval Reachability of Nonlinear Dynamical Systems with Neural Network
Controllers [5.543220407902113]
本稿では、ニューラルネットワークコントローラを用いた非線形連続時間力学系の厳密な検証のための区間解析に基づく計算効率の良いフレームワークを提案する。
混合単調理論に着想を得て,ニューラルネットワークの包摂関数と開ループシステムの分解関数を用いて,閉ループ力学をより大きなシステムに組み込む。
埋め込みシステムの単一軌跡を用いて、到達可能な集合の超矩形超近似を効率的に計算できることが示される。
論文 参考訳(メタデータ) (2023-01-19T06:46:36Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Tree-Based Adaptive Model Learning [62.997667081978825]
我々はKearns-Vazirani学習アルゴリズムを拡張し、時間とともに変化するシステムを扱う。
本稿では,学習前の動作を再利用し,更新し,LearnerLibライブラリに実装し,大規模な実例で評価する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T21:24:22Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Reachable Polyhedral Marching (RPM): A Safety Verification Algorithm for
Robotic Systems with Deep Neural Network Components [20.595032143044506]
本稿では,線形整列ユニット(ReLU)アクティベーションを用いたディープニューラルネットワークの精度の高いリーチ可能集合の計算法を提案する。
我々のアルゴリズムは、複数の時間ステップで反復されたReLUネットワークに対して、前方および後方の両方の到達可能な集合を計算できる。
本稿では,ACAS Xu航空機アドバイザリーシステムの安全性検証に関するアルゴリズムを実証する。
論文 参考訳(メタデータ) (2020-11-23T18:35:53Z) - Active Learning for Identification of Linear Dynamical Systems [12.056495277232118]
アルゴリズムが達成した有限時間境界推定率を示す。
そこで本研究では,ノイズを発生させることによって得られるオーバレートを,アルゴリズムが確実に改善する事例をいくつか分析する。
論文 参考訳(メタデータ) (2020-02-02T21:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。