論文の概要: Bridging Dimensions: Confident Reachability for High-Dimensional
Controllers
- arxiv url: http://arxiv.org/abs/2311.04843v1
- Date: Wed, 8 Nov 2023 17:26:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 14:58:49.435110
- Title: Bridging Dimensions: Confident Reachability for High-Dimensional
Controllers
- Title(参考訳): ブリッジ次元:高次元制御器の信頼性
- Authors: Yuang Geng, Souradeep Dutta, Ivan Ruchkin
- Abstract要約: 本稿では,高次元制御器と全閉ループ検証を接続するための一歩を踏み出した。
我々は、最新の検証知識蒸留を利用して近似と妥当性のバランスをとる。
2つのOpenAIジムベンチマークで説得力のあるパフォーマンスを示す2つのインフレーション手法(軌道と行動に基づく)について検討する。
- 参考スコア(独自算出の注目度): 0.1534667887016089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous systems are increasingly implemented using end-end-end trained
controllers. Such controllers make decisions that are executed on the real
system with images as one of the primary sensing modalities. Deep neural
networks form a fundamental building block of such controllers. Unfortunately,
the existing neural-network verification tools do not scale to inputs with
thousands of dimensions. Especially when the individual inputs (such as pixels)
are devoid of clear physical meaning. This paper takes a step towards
connecting exhaustive closed-loop verification with high-dimensional
controllers. Our key insight is that the behavior of a high-dimensional
controller can be approximated with several low-dimensional controllers in
different regions of the state space. To balance approximation and
verifiability, we leverage the latest verification-aware knowledge
distillation. Then, if low-dimensional reachability results are inflated with
statistical approximation errors, they yield a high-confidence reachability
guarantee for the high-dimensional controller. We investigate two inflation
techniques -- based on trajectories and actions -- both of which show
convincing performance in two OpenAI gym benchmarks.
- Abstract(参考訳): 自律システムは、エンドエンドのトレーニングされたコントローラを使ってますます実装される。
このようなコントローラは、イメージを主要なセンシングモードの1つとして、実システムで実行される決定を行う。
ディープニューラルネットワークは、そのようなコントローラの基本的なビルディングブロックを形成する。
残念ながら、既存のニューラルネットワーク検証ツールは数千の次元を持つ入力にスケールしない。
特に個々の入力(ピクセルなど)が明確な物理的意味を持たない場合。
本稿では,高次元制御器と全閉ループ検証を接続するための一歩を踏み出した。
我々の重要な洞察は、高次元コントローラの挙動が状態空間の異なる領域におけるいくつかの低次元コントローラと近似できるということである。
近似と検証可能性のバランスをとるために,最新の検証認識知識蒸留法を利用する。
そして、低次元到達可能性結果が統計的近似誤差で膨らむと、高次元コントローラに対する高信頼到達可能性保証が得られる。
トラジェクトリとアクションに基づく2つのインフレーション手法を調査し、どちらも2つのOpenAIジムベンチマークで説得力のあるパフォーマンスを示している。
関連論文リスト
- Scalable Surrogate Verification of Image-based Neural Network Control Systems using Composition and Unrolling [9.633494094538017]
本研究では,実世界に代わって条件付き生成逆数ネットワーク(cGAN)をイメージジェネレータとして訓練し,サロゲート検証手法を提案する。
我々は、cGANとニューラルネットワークコントローラとともにシステムのダイナミクスを構成することで、一段階のエラーを克服する。
単一ステップの合成を繰り返し、制御ループの複数のステップを大規模ニューラルネットワークに展開することで、マルチステップエラーを低減する。
論文 参考訳(メタデータ) (2024-05-28T19:56:53Z) - Rethinking Robustness Assessment: Adversarial Attacks on Learning-based Quadrupedal Locomotion Controllers [33.50779001548997]
Legged locomotionは最近、機械学習技術の進歩で顕著な成功を収めた。
学習した移動制御器の弱点を識別するために,逐次的敵攻撃を利用する計算手法を提案する。
我々の研究は、最先端のロバストコントローラーでさえ、十分に設計された低マグニチュード逆数列の下では著しく失敗することを示した。
論文 参考訳(メタデータ) (2024-05-21T00:26:11Z) - A comparison of RL-based and PID controllers for 6-DOF swimming robots:
hybrid underwater object tracking [8.362739554991073]
本稿では,PIDコントローラの代替として,集中型深層Q-network(DQN)コントローラを用いた調査と評価を行う。
我々の主な焦点は、この遷移を水中物体追跡の特定のケースで説明することに集中している。
本実験は,Unityをベースとしたシミュレータで実施し,分離したPIDコントローラ上での集中型RLエージェントの有効性を検証した。
論文 参考訳(メタデータ) (2024-01-29T23:14:15Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Efficient and Robust LiDAR-Based End-to-End Navigation [132.52661670308606]
我々は,LiDARをベースとした効率的なエンドツーエンドナビゲーションフレームワークを提案する。
本稿では,スパース畳み込みカーネル最適化とハードウェア対応モデル設計に基づくFast-LiDARNetを提案する。
次に,単一の前方通過のみから予測の不確かさを直接推定するハイブリッド・エビデンシャル・フュージョンを提案する。
論文 参考訳(メタデータ) (2021-05-20T17:52:37Z) - How Are Learned Perception-Based Controllers Impacted by the Limits of
Robust Control? [17.775878968489852]
制御性/可観測性グラムの最小固有値のようなシステム特性の観点から、最適制御問題の難しさを再考する。
データ駆動コントローラのパフォーマンスとサンプルの複雑さを予測するタスクの定量化可能な制御と知覚的難易度メトリクスはどの程度ですか?
その結果,頑健な制御の基本的限界は,学習した知覚に基づく制御器のサンプル効率と性能に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-02T00:31:31Z) - Machine Learning for Mechanical Ventilation Control [52.65490904484772]
圧制御換気における侵襲的機械式換気装置の制御の問題点を考察する。
PIDコントローラは、臨床医が指定する気道圧の軌跡に従って、鎮静患者の肺の空気を入出させる必要があります。
制御器は、PID制御器よりも目標圧力波形をかなりよく追跡できることを示す。
論文 参考訳(メタデータ) (2021-02-12T21:23:33Z) - Learning of Long-Horizon Sparse-Reward Robotic Manipulator Tasks with
Base Controllers [26.807673929816026]
本稿では,1つ以上の従来型ベースコントローラを用いた長軸スパース・リワードタスクの学習手法を提案する。
提案アルゴリズムは,既存のベースコントローラを探索,価値学習,ポリシー更新の段階に組み込む。
我々の方法は、既存の産業用ロボット操作システムを利用して、より柔軟でインテリジェントなコントローラを構築する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-24T14:23:57Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Graph Neural Networks for Decentralized Controllers [171.6642679604005]
自律エージェントで構成される動的システムは、ロボット工学、スマートグリッド、スマートシティなど、多くの関連する問題に現れる。
最適な集中型コントローラは容易に利用できるが、スケーラビリティと実用的な実装の面で制限に直面している。
グラフニューラルネットワーク(GNN)を用いて,データから分散制御系を学習するフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-23T13:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。