論文の概要: How Are Learned Perception-Based Controllers Impacted by the Limits of
Robust Control?
- arxiv url: http://arxiv.org/abs/2104.00827v1
- Date: Fri, 2 Apr 2021 00:31:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 13:57:49.687191
- Title: How Are Learned Perception-Based Controllers Impacted by the Limits of
Robust Control?
- Title(参考訳): 学習された知覚に基づく制御はロバスト制御の限界にどのように影響するか?
- Authors: Jingxi Xu, Bruce Lee, Nikolai Matni, Dinesh Jayaraman
- Abstract要約: 制御性/可観測性グラムの最小固有値のようなシステム特性の観点から、最適制御問題の難しさを再考する。
データ駆動コントローラのパフォーマンスとサンプルの複雑さを予測するタスクの定量化可能な制御と知覚的難易度メトリクスはどの程度ですか?
その結果,頑健な制御の基本的限界は,学習した知覚に基づく制御器のサンプル効率と性能に影響を及ぼすことがわかった。
- 参考スコア(独自算出の注目度): 17.775878968489852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The difficulty of optimal control problems has classically been characterized
in terms of system properties such as minimum eigenvalues of
controllability/observability gramians. We revisit these characterizations in
the context of the increasing popularity of data-driven techniques like
reinforcement learning (RL), and in control settings where input observations
are high-dimensional images and transition dynamics are unknown. Specifically,
we ask: to what extent are quantifiable control and perceptual difficulty
metrics of a task predictive of the performance and sample complexity of
data-driven controllers? We modulate two different types of partial
observability in a cartpole "stick-balancing" problem -- (i) the height of one
visible fixation point on the cartpole, which can be used to tune fundamental
limits of performance achievable by any controller, and by (ii) the level of
perception noise in the fixation point position inferred from depth or RGB
images of the cartpole. In these settings, we empirically study two popular
families of controllers: RL and system identification-based $H_\infty$ control,
using visually estimated system state. Our results show that the fundamental
limits of robust control have corresponding implications for the
sample-efficiency and performance of learned perception-based controllers.
Visit our project website https://jxu.ai/rl-vs-control-web for more
information.
- Abstract(参考訳): 最適制御問題の難しさは、制御可能/可観測グミアンの最小固有値のようなシステム特性の点で古典的に特徴付けられる。
これらの特徴を,強化学習(rl)などのデータ駆動技術の普及と,入力観察が高次元画像であり,遷移ダイナミクスが未知である制御設定の文脈で再検討する。
具体的には、データ駆動型コントローラのパフォーマンスとサンプルの複雑さを予測するタスクの定量化制御と知覚的難易度は、どの程度あるのか?
筆者らは,cartpole "stick-balancing"問題における2つの異なる部分可観測性 -- (i)どのコントローラでも実現可能な性能の基本限界を調整できるcartpole上の1つの可視固定点の高さ,および(ii)cartpoleの深さやrgb画像から推定される固定点位置における知覚ノイズレベルを変調する。
これらの環境では, rl とシステム識別ベース $h_\infty$ の2種類の制御系を, 視覚的に推定したシステム状態を用いて実験的に検討した。
その結果,頑健な制御の基本的限界は,学習した知覚に基づく制御器のサンプル効率と性能に影響を及ぼすことがわかった。
詳細はプロジェクトのwebサイトhttps://jxu.ai/rl-vs-control-webをご覧ください。
関連論文リスト
- Fine-grained Controllable Video Generation via Object Appearance and
Context [74.23066823064575]
細粒度制御可能なビデオ生成法(FACTOR)を提案する。
FACTORは、オブジェクトの位置とカテゴリを含む、オブジェクトの外観とコンテキストを制御することを目的としている。
本手法は,オブジェクトの外観を微調整せずに制御し,オブジェクトごとの最適化作業を省く。
論文 参考訳(メタデータ) (2023-12-05T17:47:33Z) - Bridging Dimensions: Confident Reachability for High-Dimensional Controllers [3.202200341692044]
本稿では,高次元制御器と全閉ループ検証を接続するための一歩を踏み出した。
我々の重要な洞察は、高次元コントローラの挙動を複数の低次元コントローラで近似できるということである。
そして,低次元到達度を統計的近似誤差で改善し,高次元制御器に対する高信頼到達性保証を実現する。
論文 参考訳(メタデータ) (2023-11-08T17:26:38Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Deep Reinforcement Learning Aided Platoon Control Relying on V2X
Information [78.18186960475974]
車両間通信(V2X)が小隊制御性能に及ぼす影響について検討した。
我々の目的は、最も適切な状態空間を構築するために、車両間で共有されるべき特定の情報の集合を見つけることである。
状態空間に含めると、より高い状態次元を持つ負の効果を相殺する確率が高いため、より有益な情報が伝達においてより高い優先度で与えられる。
論文 参考訳(メタデータ) (2022-03-28T02:11:54Z) - Steady-State Error Compensation in Reference Tracking and Disturbance
Rejection Problems for Reinforcement Learning-Based Control [0.9023847175654602]
強化学習(Reinforcement Learning, RL)は、自動制御アプリケーションにおける将来的なトピックである。
アクター批判に基づくRLコントローラのためのイニシアティブアクション状態拡張(IASA)が導入される。
この拡張は専門家の知識を必要とせず、アプローチモデルを無償にしておく。
論文 参考訳(メタデータ) (2022-01-31T16:29:19Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Is Disentanglement enough? On Latent Representations for Controllable
Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文 参考訳(メタデータ) (2021-08-01T18:37:43Z) - Residual Feedback Learning for Contact-Rich Manipulation Tasks with
Uncertainty [22.276925045008788]
emphglsrplは強化学習(RL)で既存のコントローラを改善するための定式化を提供する
位置・方向の不確実性を考慮したコンタクトリッチペグ挿入作業において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2021-06-08T13:06:35Z) - Comparison of Model Predictive and Reinforcement Learning Methods for
Fault Tolerant Control [2.524528674141466]
階層的強化学習に基づく離散時間系に対する2つの適応型耐故障制御方式を提案する。
実験により、強化学習に基づく制御器は、故障下のモデル予測制御器、部分的に観測可能なシステムモデル、様々なセンサノイズレベルよりも堅牢に動作することが示されている。
論文 参考訳(メタデータ) (2020-08-10T20:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。