論文の概要: NExG: Provable and Guided State Space Exploration of Neural Network
Control Systems using Sensitivity Approximation
- arxiv url: http://arxiv.org/abs/2207.03884v1
- Date: Fri, 8 Jul 2022 13:17:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-11 18:11:55.753982
- Title: NExG: Provable and Guided State Space Exploration of Neural Network
Control Systems using Sensitivity Approximation
- Title(参考訳): NExG: 感度近似を用いたニューラルネットワーク制御系の確率的かつガイド付き状態空間探索
- Authors: Manish Goyal and Miheer Dewaskar and Parasara Sridhar Duggirala
- Abstract要約: ニューラルネットワークフィードバックコントローラを用いた閉ループ制御系の状態空間探索を行う新しい手法を提案する。
本手法は閉ループ力学の軌跡の感度を近似することを含む。
- 参考スコア(独自算出の注目度): 2.3204178451683264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a new technique for performing state space exploration of closed
loop control systems with neural network feedback controllers. Our approach
involves approximating the sensitivity of the trajectories of the closed loop
dynamics. Using such an approximator and the system simulator, we present a
guided state space exploration method that can generate trajectories visiting
the neighborhood of a target state at a specified time. We present a
theoretical framework which establishes that our method will produce a sequence
of trajectories that will reach a suitable neighborhood of the target state. We
provide thorough evaluation of our approach on various systems with neural
network feedback controllers of different configurations. We outperform earlier
state space exploration techniques and achieve significant improvement in both
the quality (explainability) and performance (convergence rate). Finally, we
adopt our algorithm for the falsification of a class of temporal logic
specification, assess its performance against a state-of-the-art falsification
tool, and show its potential in supplementing existing falsification
algorithms.
- Abstract(参考訳): 本稿では,ニューラルネットワークフィードバックコントローラを用いた閉ループ制御系の状態空間探索を行う新しい手法を提案する。
この手法は閉ループダイナミクスの軌道の感度を近似するものである。
このような近似器とシステムシミュレータを用いて、特定の時刻に目標状態の近傍を訪問する軌跡を生成できる誘導状態空間探索法を提案する。
本稿では,提案手法が対象状態の適切な近傍に到達する一連の軌跡を生成するという理論的枠組みを提案する。
我々は,様々な構成のニューラルネットワークフィードバックコントローラを用いて,様々なシステムに対するアプローチを徹底的に評価する。
我々は、以前の状態空間探索技術より優れており、品質(説明可能性)と性能(収束率)の両方において大幅に改善されている。
最後に、時間論理仕様のクラスを改ざんするためにアルゴリズムを適用し、最先端の改ざんツールに対する性能を評価し、既存の改ざんアルゴリズムを補完する可能性を示す。
関連論文リスト
- Convolutional Neural Network Design and Evaluation for Real-Time Multivariate Time Series Fault Detection in Spacecraft Attitude Sensors [41.94295877935867]
本稿では,ドローンのような宇宙船の加速度計および慣性測定ユニット内のスタンプ値を検出するための新しい手法を提案する。
マルチチャネル畳み込みニューラルネットワーク(CNN)は、マルチターゲット分類を実行し、センサ内の障害を独立に検出するために使用される。
ネットワークの異常を効果的に検出し,システムレベルでの回復動作をトリガーする統合手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T09:36:38Z) - Learning-Based Verification of Stochastic Dynamical Systems with Neural Network Policies [7.9898826915621965]
我々は、他のニューラルネットワークをトレーニングする検証手順を使用し、ポリシーがタスクを満足することを示す証明書として機能する。
リーチ回避タスクでは、この証明ネットワークがリーチ回避スーパーマーチンゲール(RASM)であることを示すのに十分である。
論文 参考訳(メタデータ) (2024-06-02T18:19:19Z) - Uncovering the Missing Pattern: Unified Framework Towards Trajectory
Imputation and Prediction [60.60223171143206]
軌道予測は、観測されたシーケンスから実体運動や人間の行動を理解する上で重要な作業である。
現在の方法では、観測されたシーケンスが完了したと仮定し、欠落した値の可能性を無視する。
本稿では,グラフに基づく条件変動リカレントニューラルネットワーク (GC-VRNN) の統一フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-28T14:27:27Z) - On the Effective Usage of Priors in RSS-based Localization [56.68864078417909]
本稿では、受信信号強度(RSS)指紋と畳み込みニューラルネットワークに基づくアルゴリズムLocUNetを提案する。
本稿では,密集市街地における局所化問題について検討する。
まず,LocUNetがRx位置やRxの事前分布を学習し,トレーニングデータから送信者(Tx)アソシエーションの好みを学習し,その性能を評価できることを示す。
論文 参考訳(メタデータ) (2022-11-28T00:31:02Z) - Large-Scale Sequential Learning for Recommender and Engineering Systems [91.3755431537592]
本稿では,現在の状況に適応してパーソナライズされたランキングを提供する自動アルゴリズムの設計に焦点を当てる。
前者はSAROSと呼ばれる新しいアルゴリズムを提案し,インタラクションの順序を学習するためのフィードバックの種類を考慮に入れている。
提案手法は, 電力網の故障検出に対する初期アプローチと比較して, 統計的に有意な結果を示す。
論文 参考訳(メタデータ) (2022-05-13T21:09:41Z) - Learning-based Localizability Estimation for Robust LiDAR Localization [13.298113481670038]
LiDARベースのローカライゼーションとマッピングは、多くの現代のロボットシステムにおける中核的なコンポーネントの1つである。
本研究では,ロボット動作中の(非)局所性を検出するニューラルネットワークに基づく推定手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T01:12:00Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。