論文の概要: Data-efficient, Explainable and Safe Payload Manipulation: An
Illustration of the Advantages of Physical Priors in Model-Predictive Control
- arxiv url: http://arxiv.org/abs/2303.01563v1
- Date: Thu, 2 Mar 2023 20:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 17:06:11.009837
- Title: Data-efficient, Explainable and Safe Payload Manipulation: An
Illustration of the Advantages of Physical Priors in Model-Predictive Control
- Title(参考訳): データ効率、説明可能、そして安全なペイロード操作:モデル予測制御における物理プライオリティの利点の例
- Authors: Achkan Salehi, Stephane Doncieux
- Abstract要約: 環境のダイナミクスに関する事前の知識は、説明可能性の向上と、安全性とデータ効率の両面での増大につながることを示す。
実際のロボットシステムに基づくペイロード操作問題をモデル化し、環境のダイナミクスに関する事前知識を活用することにより、説明可能性の向上と安全性とデータ効率の向上につながることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning methods, such as those from the Reinforcement Learning (RL)
literature, have increasingly been applied to robot control problems. However,
such control methods, even when learning environment dynamics (e.g. as in
Model-Based RL/control) often remain data-inefficient. Furthermore, the
decisions made by learned policies or the estimations made by learned dynamic
models, unlike those made by their hand-designed counterparts, are not readily
interpretable by a human user without the use of Explainable AI techniques.
This has several disadvantages, such as increased difficulty both in debugging
and integration in safety-critical systems. On the other hand, in many robotic
systems, prior knowledge of environment kinematics and dynamics is at least
partially available (e.g. from classical mechanics). Arguably, incorporating
such priors to the environment model or decision process can help address the
aforementioned problems: it reduces problem complexity and the needs in terms
of exploration, while also facilitating the expression of the decisions taken
by the agent in terms of physically meaningful entities. Our aim with this
paper is to illustrate and support this point of view. We model a payload
manipulation problem based on a real robotic system, and show that leveraging
prior knowledge about the dynamics of the environment can lead to improved
explainability and an increase in both safety and data-efficiency,leading to
satisfying generalization properties with less data.
- Abstract(参考訳): 強化学習(Reinforcement Learning, RL)文学などの機械学習手法は、ロボット制御問題にますます応用されている。
しかし、そのような制御手法は、学習環境力学(例えば、モデルベースRL/制御など)がデータ非効率のままである場合であっても、しばしば存在する。
さらに、学習方針による決定や学習された動的モデルによる推定は、手作業で設計されたものとは異なり、説明可能なAI技術を使わずに人間のユーザによって容易に解釈できない。
これには、デバッグとセーフティクリティカルなシステムの統合の難しさの増加など、いくつかの欠点がある。
一方、多くのロボットシステムでは、環境運動学や力学の事前知識は少なくとも部分的に利用可能である(例えば古典力学)。
環境モデルや意思決定プロセスにそのような優先順位を組み込むことは、上記の問題に対処するのに役立ちます。
本稿の目的は,この視点を説明し,支持することである。
実際のロボットシステムに基づいてペイロード操作問題をモデル化し,環境のダイナミクスに関する事前知識を活用すれば,より少ないデータで一般化特性を満足できるため,説明可能性の向上と安全性とデータ効率の向上が期待できることを示した。
関連論文リスト
- Harnessing physics-informed operators for high-dimensional reliability analysis problems [0.8192907805418583]
信頼性分析(Reliability analysis)は、特に多数のパラメータを持つシステムにおいて、非常に難しいタスクである。
信頼性を定量化するための従来の手法は、しばしば広範なシミュレーションや実験データに依存している。
物理インフォームド演算子は,高次元信頼性解析問題を妥当な精度でシームレスに解くことができることを示す。
論文 参考訳(メタデータ) (2024-09-07T04:52:03Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Effective Communication with Dynamic Feature Compression [25.150266946722]
本研究では,タスクを制御するロボットに対して,観察者が知覚データを伝達しなければならないプロトタイパルシステムについて検討する。
本稿では, 量子化レベルを動的に適応させるために, アンサンブルベクトル量子化変分オートエンコーダ(VQ-VAE)を符号化し, 深層強化学習(DRL)エージェントを訓練する。
我々は、よく知られたCartPole参照制御問題に対して提案手法を検証し、大幅な性能向上を得た。
論文 参考訳(メタデータ) (2024-01-29T15:35:05Z) - A spectrum of physics-informed Gaussian processes for regression in
engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。
本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文 参考訳(メタデータ) (2023-09-19T14:39:03Z) - On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。
まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - How Can Subgroup Discovery Help AIOps? [0.0]
サブグループディスカバリがAIOpsにどのように役立つかを研究する。
このプロジェクトには、フランスのソフトウェアエディタであるInfologicalのデータマイニングの研究者と実践者の両方が含まれる。
論文 参考訳(メタデータ) (2021-09-10T14:41:02Z) - Counterfactual Explanations as Interventions in Latent Space [62.997667081978825]
反現実的な説明は、望ましい結果を達成するために変更が必要な機能のセットをエンドユーザに提供することを目的としています。
現在のアプローチでは、提案された説明を達成するために必要な行動の実現可能性を考慮することはめったにない。
本稿では,非現実的説明を生成する手法として,潜時空間における干渉としての対実的説明(CEILS)を提案する。
論文 参考訳(メタデータ) (2021-06-14T20:48:48Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Sufficiently Accurate Model Learning for Planning [119.80502738709937]
本稿では,制約付きSufficiently Accurateモデル学習手法を提案する。
これはそのような問題の例を示し、いくつかの近似解がいかに近いかという定理を提示する。
近似解の質は、関数のパラメータ化、損失と制約関数の滑らかさ、モデル学習におけるサンプルの数に依存する。
論文 参考訳(メタデータ) (2021-02-11T16:27:31Z) - Variational Autoencoding of PDE Inverse Problems [12.716429755564821]
現代の機械学習は、事前の知識と物理法則に関わる問題を回避できる。
この作業では、メカニスティックモデルをフレキシブルなデータ駆動サロゲートに折り畳み、物理的に構造化されたデコーダネットワークに到達する。
我々はPDE問題の変分形式を採用し,局所近似をモデルベースデータ拡張の形式として導入する。
論文 参考訳(メタデータ) (2020-06-28T16:17:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。