論文の概要: Bridging Dimensions: Confident Reachability for High-Dimensional
Controllers
- arxiv url: http://arxiv.org/abs/2311.04843v2
- Date: Thu, 1 Feb 2024 23:17:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 19:30:48.303932
- Title: Bridging Dimensions: Confident Reachability for High-Dimensional
Controllers
- Title(参考訳): ブリッジ次元:高次元制御器の信頼性
- Authors: Yuang Geng, Souradeep Dutta, Ivan Ruchkin
- Abstract要約: 本稿では,高次元制御器と全閉ループ検証を接続するための一歩を踏み出した。
低次元制御器の近似精度と妥当性のバランスをとるために, 最新の検証知識蒸留を活用している。
軌道と制御行動に基づく2つのインフレーション手法について検討し、2つのOpenAIジムベンチマークで説得力のある性能を示す。
- 参考スコア(独自算出の注目度): 0.1534667887016089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous systems are increasingly implemented using end-to-end
learning-based controllers. Such controllers make decisions that are executed
on the real system with images as one of the primary sensing modalities. Deep
neural networks form a fundamental building block of such controllers.
Unfortunately, the existing neural-network verification tools do not scale to
inputs with thousands of dimensions -- especially when the individual inputs
(such as pixels) are devoid of clear physical meaning. This paper takes a step
towards connecting exhaustive closed-loop verification with high-dimensional
controllers. Our key insight is that the behavior of a high-dimensional
controller can be approximated with several low-dimensional controllers in
different regions of the state space. To balance the approximation accuracy and
verifiability of our low-dimensional controllers, we leverage the latest
verification-aware knowledge distillation. Then, if low-dimensional
reachability results are inflated with statistical approximation errors, they
yield a high-confidence reachability guarantee for the high-dimensional
controller. We investigate two inflation techniques -- based on trajectories
and control actions -- both of which show convincing performance in two OpenAI
gym benchmarks.
- Abstract(参考訳): 自律システムはエンド・ツー・エンドの学習ベースのコントローラを使ってますます実装されている。
このようなコントローラは、イメージを主要なセンシングモードの1つとして、実システムで実行される決定を行う。
ディープニューラルネットワークは、そのようなコントローラの基本的なビルディングブロックを形成する。
残念ながら、既存のニューラルネットワーク検証ツールは、特に個々の入力(ピクセルなど)が明確な物理的意味を持たない場合、数千次元の入力に対してスケールしない。
本稿では,高次元制御器と全閉ループ検証を接続するための一歩を踏み出した。
我々の重要な洞察は、高次元コントローラの挙動が状態空間の異なる領域におけるいくつかの低次元コントローラと近似できるということである。
低次元コントローラの近似精度と妥当性のバランスをとるために,我々は最新の検証認識知識蒸留を利用する。
そして、低次元到達可能性結果が統計的近似誤差で膨らむと、高次元コントローラに対する高信頼到達可能性保証が得られる。
トラジェクトリとコントロールアクションに基づく2つのインフレーション手法を調査し、どちらもOpenAIのジムベンチマークで説得力のあるパフォーマンスを示している。
関連論文リスト
- A comparison of RL-based and PID controllers for 6-DOF swimming robots:
hybrid underwater object tracking [8.362739554991073]
本稿では,PIDコントローラの代替として,集中型深層Q-network(DQN)コントローラを用いた調査と評価を行う。
我々の主な焦点は、この遷移を水中物体追跡の特定のケースで説明することに集中している。
本実験は,Unityをベースとしたシミュレータで実施し,分離したPIDコントローラ上での集中型RLエージェントの有効性を検証した。
論文 参考訳(メタデータ) (2024-01-29T23:14:15Z) - Exact and Cost-Effective Automated Transformation of Neural Network
Controllers to Decision Tree Controllers [7.5324684039928975]
NNベースのコントローラを等価なソフト決定木(SDT)に変換することとその妥当性への影響について検討する。
我々は、冗長な分岐を自動的に実行できるように、正確だが費用効率のよい変換アルゴリズムを考案する。
以上の結果から,SDT変換は,MountainCar-v0とCartPole-v0のランタイムを最大21倍,2倍改善したことを示す。
論文 参考訳(メタデータ) (2023-04-11T19:52:30Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Model-Agnostic Hierarchical Attention for 3D Object Detection [81.33112745926113]
変圧器を用いた3次元検出器のためのモジュラー化階層設計として,2つの新しい注意機構を提案する。
異なるスケールで機能学習を可能にするために,単一スケールの入力機能から複数スケールのトークンを構築するシンプルなマルチスケールアテンションを提案する。
局所的特徴集約のために,各バウンディングボックスの提案に対して適応的なアテンション範囲を持つサイズ適応型局所アテンションを提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - Visual-tactile sensing for Real-time liquid Volume Estimation in
Grasping [58.50342759993186]
変形性容器内の液体をリアルタイムに推定するためのビジュオ触覚モデルを提案する。
我々は、RGBカメラからの生の視覚入力と、特定の触覚センサーからの触覚手がかりの2つの感覚モードを融合する。
ロボットシステムは、推定モデルに基づいて、リアルタイムで適切に制御され、調整される。
論文 参考訳(メタデータ) (2022-02-23T13:38:31Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - How Are Learned Perception-Based Controllers Impacted by the Limits of
Robust Control? [17.775878968489852]
制御性/可観測性グラムの最小固有値のようなシステム特性の観点から、最適制御問題の難しさを再考する。
データ駆動コントローラのパフォーマンスとサンプルの複雑さを予測するタスクの定量化可能な制御と知覚的難易度メトリクスはどの程度ですか?
その結果,頑健な制御の基本的限界は,学習した知覚に基づく制御器のサンプル効率と性能に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-02T00:31:31Z) - A DCNN-based Arbitrarily-Oriented Object Detector for Quality Control
and Inspection Application [10.076629346147639]
軽量ニューラルネットワークを利用して回帰法を用いて指向性検出結果を得る。
提案手法の第1段階では,2つのシナリオで考慮される小型ターゲットを検出できる。
第2段階では、単純さにもかかわらず、高いランニング効率を維持しながら延長ターゲットを検出することが効率的です。
論文 参考訳(メタデータ) (2021-01-19T00:23:27Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Drawing together control landscape and tomography principles [0.2741266294612775]
形状のフィールドを用いて量子システムを制御したり、測定データからそのような制御されたシステムの状態を推測する能力は、量子デバイスの設計と運用における重要なタスクである。
システムの全状態を制御・再構築する能力と特異制御の欠如を関連付けるとともに、十分に長い進化期間において特異制御が発生することは滅多にないことを示す。
本稿では,システムに部分的にアクセスした測定データを利用した最適制御の学習アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-04-06T15:17:33Z) - Graph Neural Networks for Decentralized Controllers [171.6642679604005]
自律エージェントで構成される動的システムは、ロボット工学、スマートグリッド、スマートシティなど、多くの関連する問題に現れる。
最適な集中型コントローラは容易に利用できるが、スケーラビリティと実用的な実装の面で制限に直面している。
グラフニューラルネットワーク(GNN)を用いて,データから分散制御系を学習するフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-23T13:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。