論文の概要: Reachable Polyhedral Marching (RPM): An Exact Analysis Tool for
Deep-Learned Control Systems
- arxiv url: http://arxiv.org/abs/2210.08339v1
- Date: Sat, 15 Oct 2022 17:15:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 17:41:06.988492
- Title: Reachable Polyhedral Marching (RPM): An Exact Analysis Tool for
Deep-Learned Control Systems
- Title(参考訳): Reachable Polyhedral Marching (RPM):Deep-Learned Control Systemのための厳密な解析ツール
- Authors: Joseph A. Vincent and Mac Schwager
- Abstract要約: 本稿では,直列線形ユニット(ReLU)をアクティベートしたディープニューラルネットワークの,前方および後方到達可能な正確な集合を計算するためのツールを提案する。
このツールを用いてアルゴリズムを開発し、フィードバックループ内のニューラルネットワークを持つ制御系に対する不変集合とアトラクション領域(ROA)を計算する。
- 参考スコア(独自算出の注目度): 20.595032143044506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a tool for computing exact forward and backward reachable sets of
deep neural networks with rectified linear unit (ReLU) activation. We then
develop algorithms using this tool to compute invariant sets and regions of
attraction (ROAs) for control systems with neural networks in the feedback
loop. Our algorithm is unique in that it builds the reachable sets by
incrementally enumerating polyhedral regions in the input space, rather than
iterating layer-by-layer through the network as in other methods. When
performing safety verification, if an unsafe region is found, our algorithm can
return this result without completing the full reachability computation, thus
giving an anytime property that accelerates safety verification. Furthermore,
we introduce a method to accelerate the computation of ROAs in the case that
deep learned components are homeomorphisms, which we find is surprisingly
common in practice. We demonstrate our tool in several test cases. We compute a
ROA for a learned van der Pol oscillator model. We find a control invariant set
for a learned torque-controlled pendulum model. We also verify specific safety
properties for multiple deep networks related to the ACAS Xu aircraft collision
advisory system. Finally, we apply our algorithm to find ROAs for an
image-based aircraft runway taxi problem. Algorithm source code:
https://github.com/StanfordMSL/Neural-Network-Reach .
- Abstract(参考訳): 本稿では,直交線形単位(relu)アクティベーションを持つ深層ニューラルネットワークの正確な前方および後方到達可能な集合を計算するためのツールを提案する。
このツールを用いてアルゴリズムを開発し、フィードバックループ内のニューラルネットワークを持つ制御系に対する不変集合とアトラクション領域(ROA)を計算する。
本アルゴリズムは,入力空間内の多面体領域を段階的に列挙することで到達可能な集合を構築することができる。
安全性検証を行う場合、もし安全でない領域が見つかった場合、我々のアルゴリズムは完全な到達性計算を完了せずにこの結果を返すことができる。
さらに,深層学習成分が準同型である場合に,ROAsの計算を高速化する手法を提案する。
私たちはいくつかのテストケースでツールを示します。
学習したファンデルポル振動子モデルに対するROAを計算する。
学習したトルク制御振子モデルに対する制御不変集合を求める。
また,ACAS Xu航空機衝突諮問システムに関連する複数の深層ネットワークの安全性を検証した。
最後に,画像に基づく滑走路タクシー問題に対するROAを求めるアルゴリズムを適用した。
アルゴリズムのソースコード:https://github.com/StanfordMSL/Neural-Network-Reach
関連論文リスト
- Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - Attribution Patching Outperforms Automated Circuit Discovery [3.8695554579762814]
帰属パッチに基づく単純な手法が,既存の手法よりも優れていることを示す。
演算サブグラフにおける各エッジの重要性を推定するために、線形近似をアクティベーションパッチに適用する。
論文 参考訳(メタデータ) (2023-10-16T12:34:43Z) - Pathfinding Neural Cellular Automata [23.831530224401575]
Pathfindingは、ロボットパス計画、トランスポートルーティング、ゲームプレイなど、幅広い複雑なAIタスクの重要なサブコンポーネントである。
我々は, Breadth-First Search (BFS) のモデル,すなわち最短経路探索のハンドコードと学習を行う。
本稿では、Depth-First Search(DFS)のニューラル実装を提案し、グラフの直径を計算するためのNAAを生成するために、ニューラルネットワークBFSと組み合わせる方法について概説する。
我々は,これらの手書きNCAに触発されたアーキテクチャ変更を実験し,グリッド迷路の直径問題を解くためにゼロからネットワークをトレーニングし,高い能力の一般化を示した。
論文 参考訳(メタデータ) (2023-01-17T11:45:51Z) - Backdoor Attack Detection in Computer Vision by Applying Matrix
Factorization on the Weights of Deep Networks [6.44397009982949]
本稿では,事前訓練したDNNの重みから特徴を抽出するバックドア検出手法を提案する。
他の検出技術と比較して、これはトレーニングデータを必要としないなど、多くのメリットがある。
提案手法は, 競合するアルゴリズムよりも効率性が高く, より正確であり, 深層学習とAIの安全な適用を確実にするのに役立つ。
論文 参考訳(メタデータ) (2022-12-15T20:20:18Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Reachable Polyhedral Marching (RPM): A Safety Verification Algorithm for
Robotic Systems with Deep Neural Network Components [20.595032143044506]
本稿では,線形整列ユニット(ReLU)アクティベーションを用いたディープニューラルネットワークの精度の高いリーチ可能集合の計算法を提案する。
我々のアルゴリズムは、複数の時間ステップで反復されたReLUネットワークに対して、前方および後方の両方の到達可能な集合を計算できる。
本稿では,ACAS Xu航空機アドバイザリーシステムの安全性検証に関するアルゴリズムを実証する。
論文 参考訳(メタデータ) (2020-11-23T18:35:53Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z) - DHP: Differentiable Meta Pruning via HyperNetworks [158.69345612783198]
本稿では,ネットワークの自動プルーニングのためのハイパーネットによる識別可能なプルーニング手法を提案する。
遅延ベクトルは、バックボーンネットワーク内の畳み込み層の出力チャネルを制御し、レイヤのプルーニングのハンドルとして機能する。
画像分類、単一画像超解像、復調のための様々なネットワークで実験が行われた。
論文 参考訳(メタデータ) (2020-03-30T17:59:18Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z) - Automatic Perturbation Analysis for Scalable Certified Robustness and
Beyond [171.07853346630057]
ニューラルネットワークに対する線形緩和に基づく摂動解析(LiRPA)は、堅牢性検証と認証防御のコアコンポーネントとなっている。
我々は任意のニューラルネットワーク構造上で摂動解析を可能にするための自動フレームワークを開発する。
我々は、Tiny ImageNetとDownscaled ImageNetのLiRPAベースの認証防御を実証する。
論文 参考訳(メタデータ) (2020-02-28T18:47:43Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。