論文の概要: Data-efficient, Explainable and Safe Box Manipulation: Illustrating the Advantages of Physical Priors in Model-Predictive Control
- arxiv url: http://arxiv.org/abs/2303.01563v2
- Date: Thu, 28 Mar 2024 21:16:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 21:06:09.732370
- Title: Data-efficient, Explainable and Safe Box Manipulation: Illustrating the Advantages of Physical Priors in Model-Predictive Control
- Title(参考訳): データ効率,説明可能,安全なボックス操作:モデル予測制御における物理優先の利点を例証する
- Authors: Achkan Salehi, Stephane Doncieux,
- Abstract要約: MPCフレームワークにおける環境力学の事前知識が,説明可能性,安全性,データ効率の向上につながることを示す。
我々は,実際のロボットシステムに基づくペイロード操作問題をモデル化し,MPCフレームワークにおける環境のダイナミクスに関する事前知識を活用することにより,説明可能性,安全性,データ効率の向上につながることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Model-based RL/control have gained significant traction in robotics. Yet, these approaches often remain data-inefficient and lack the explainability of hand-engineered solutions. This makes them difficult to debug/integrate in safety-critical settings. However, in many systems, prior knowledge of environment kinematics/dynamics is available. Incorporating such priors can help address the aforementioned problems by reducing problem complexity and the need for exploration, while also facilitating the expression of the decisions taken by the agent in terms of physically meaningful entities. Our aim with this paper is to illustrate and support this point of view via a case-study. We model a payload manipulation problem based on a real robotic system, and show that leveraging prior knowledge about the dynamics of the environment in an MPC framework can lead to improvements in explainability, safety and data-efficiency, leading to satisfying generalization properties with less data.
- Abstract(参考訳): モデルベースのRL/コントロールは、ロボット工学において大きな牽引力を得ている。
しかし、これらのアプローチは、しばしばデータ非効率であり、手作業によるソリューションの説明可能性に欠ける。
これにより、セーフティクリティカルな設定でのデバッグや統合が困難になります。
しかし、多くのシステムでは、環境キネマティクス/力学の事前知識が利用可能である。
このような先入観を組み込むことは、上記の問題に対処し、問題の複雑さを減らし、探索の必要性を減らし、また、エージェントが物理的に意味のある実体で行う決定の表現を容易にする。
本論文の目的は,この視点をケーススタディで説明し,支援することである。
我々は、実際のロボットシステムに基づくペイロード操作問題をモデル化し、MPCフレームワークにおける環境のダイナミクスに関する事前知識を活用することにより、説明可能性、安全性、データ効率が改善され、より少ないデータで一般化特性を満足できることを示す。
関連論文リスト
- Learning Physics From Video: Unsupervised Physical Parameter Estimation for Continuous Dynamical Systems [49.11170948406405]
ビデオからの自動パラメータ推定の最先端は、大規模データセット上で教師付きディープネットワークをトレーニングすることによって解決される。
単一ビデオから, 既知, 連続制御方程式の物理パラメータを推定する手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T09:44:54Z) - Harnessing physics-informed operators for high-dimensional reliability analysis problems [0.8192907805418583]
信頼性分析(Reliability analysis)は、特に多数のパラメータを持つシステムにおいて、非常に難しいタスクである。
信頼性を定量化するための従来の手法は、しばしば広範なシミュレーションや実験データに依存している。
物理インフォームド演算子は,高次元信頼性解析問題を妥当な精度でシームレスに解くことができることを示す。
論文 参考訳(メタデータ) (2024-09-07T04:52:03Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Effective Communication with Dynamic Feature Compression [25.150266946722]
本研究では,タスクを制御するロボットに対して,観察者が知覚データを伝達しなければならないプロトタイパルシステムについて検討する。
本稿では, 量子化レベルを動的に適応させるために, アンサンブルベクトル量子化変分オートエンコーダ(VQ-VAE)を符号化し, 深層強化学習(DRL)エージェントを訓練する。
我々は、よく知られたCartPole参照制御問題に対して提案手法を検証し、大幅な性能向上を得た。
論文 参考訳(メタデータ) (2024-01-29T15:35:05Z) - A spectrum of physics-informed Gaussian processes for regression in
engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。
本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文 参考訳(メタデータ) (2023-09-19T14:39:03Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - How Can Subgroup Discovery Help AIOps? [0.0]
サブグループディスカバリがAIOpsにどのように役立つかを研究する。
このプロジェクトには、フランスのソフトウェアエディタであるInfologicalのデータマイニングの研究者と実践者の両方が含まれる。
論文 参考訳(メタデータ) (2021-09-10T14:41:02Z) - Counterfactual Explanations as Interventions in Latent Space [62.997667081978825]
反現実的な説明は、望ましい結果を達成するために変更が必要な機能のセットをエンドユーザに提供することを目的としています。
現在のアプローチでは、提案された説明を達成するために必要な行動の実現可能性を考慮することはめったにない。
本稿では,非現実的説明を生成する手法として,潜時空間における干渉としての対実的説明(CEILS)を提案する。
論文 参考訳(メタデータ) (2021-06-14T20:48:48Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Sufficiently Accurate Model Learning for Planning [119.80502738709937]
本稿では,制約付きSufficiently Accurateモデル学習手法を提案する。
これはそのような問題の例を示し、いくつかの近似解がいかに近いかという定理を提示する。
近似解の質は、関数のパラメータ化、損失と制約関数の滑らかさ、モデル学習におけるサンプルの数に依存する。
論文 参考訳(メタデータ) (2021-02-11T16:27:31Z) - Variational Autoencoding of PDE Inverse Problems [12.716429755564821]
現代の機械学習は、事前の知識と物理法則に関わる問題を回避できる。
この作業では、メカニスティックモデルをフレキシブルなデータ駆動サロゲートに折り畳み、物理的に構造化されたデコーダネットワークに到達する。
我々はPDE問題の変分形式を採用し,局所近似をモデルベースデータ拡張の形式として導入する。
論文 参考訳(メタデータ) (2020-06-28T16:17:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。