論文の概要: Data-efficient, Explainable and Safe Payload Manipulation: An
Illustration of the Advantages of Physical Priors in Model-Predictive Control
- arxiv url: http://arxiv.org/abs/2303.01563v1
- Date: Thu, 2 Mar 2023 20:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 17:06:11.009837
- Title: Data-efficient, Explainable and Safe Payload Manipulation: An
Illustration of the Advantages of Physical Priors in Model-Predictive Control
- Title(参考訳): データ効率、説明可能、そして安全なペイロード操作:モデル予測制御における物理プライオリティの利点の例
- Authors: Achkan Salehi, Stephane Doncieux
- Abstract要約: 環境のダイナミクスに関する事前の知識は、説明可能性の向上と、安全性とデータ効率の両面での増大につながることを示す。
実際のロボットシステムに基づくペイロード操作問題をモデル化し、環境のダイナミクスに関する事前知識を活用することにより、説明可能性の向上と安全性とデータ効率の向上につながることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning methods, such as those from the Reinforcement Learning (RL)
literature, have increasingly been applied to robot control problems. However,
such control methods, even when learning environment dynamics (e.g. as in
Model-Based RL/control) often remain data-inefficient. Furthermore, the
decisions made by learned policies or the estimations made by learned dynamic
models, unlike those made by their hand-designed counterparts, are not readily
interpretable by a human user without the use of Explainable AI techniques.
This has several disadvantages, such as increased difficulty both in debugging
and integration in safety-critical systems. On the other hand, in many robotic
systems, prior knowledge of environment kinematics and dynamics is at least
partially available (e.g. from classical mechanics). Arguably, incorporating
such priors to the environment model or decision process can help address the
aforementioned problems: it reduces problem complexity and the needs in terms
of exploration, while also facilitating the expression of the decisions taken
by the agent in terms of physically meaningful entities. Our aim with this
paper is to illustrate and support this point of view. We model a payload
manipulation problem based on a real robotic system, and show that leveraging
prior knowledge about the dynamics of the environment can lead to improved
explainability and an increase in both safety and data-efficiency,leading to
satisfying generalization properties with less data.
- Abstract(参考訳): 強化学習(Reinforcement Learning, RL)文学などの機械学習手法は、ロボット制御問題にますます応用されている。
しかし、そのような制御手法は、学習環境力学(例えば、モデルベースRL/制御など)がデータ非効率のままである場合であっても、しばしば存在する。
さらに、学習方針による決定や学習された動的モデルによる推定は、手作業で設計されたものとは異なり、説明可能なAI技術を使わずに人間のユーザによって容易に解釈できない。
これには、デバッグとセーフティクリティカルなシステムの統合の難しさの増加など、いくつかの欠点がある。
一方、多くのロボットシステムでは、環境運動学や力学の事前知識は少なくとも部分的に利用可能である(例えば古典力学)。
環境モデルや意思決定プロセスにそのような優先順位を組み込むことは、上記の問題に対処するのに役立ちます。
本稿の目的は,この視点を説明し,支持することである。
実際のロボットシステムに基づいてペイロード操作問題をモデル化し,環境のダイナミクスに関する事前知識を活用すれば,より少ないデータで一般化特性を満足できるため,説明可能性の向上と安全性とデータ効率の向上が期待できることを示した。
関連論文リスト
- Information theory for model reduction in stochastic dynamical systems [0.0]
我々は,関連変数を特定するために,情報ボトルネックに基づく体系的アプローチを開発する。
高圧縮の極限において、関連する変数は、最も遅い遅延固有関数によって直接決定されることを示す。
モデルリダクションを実行する解釈可能なディープラーニングツールを構築するための確固たる基盤を提供する。
論文 参考訳(メタデータ) (2023-12-11T18:39:05Z) - A spectrum of physics-informed Gaussian processes for regression in
engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。
本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文 参考訳(メタデータ) (2023-09-19T14:39:03Z) - On-Robot Bayesian Reinforcement Learning for POMDPs [16.667924736270415]
本稿では,ロボット工学におけるベイズ強化学習を,物理システムのための特殊フレームワークの提案により進める。
この知識を因子表現で捉え、後続の分解を同様の形で示し、最終的にベイズ的枠組みでモデルを定式化する。
次に,モンテカルロ木探索と粒子フィルタリングに基づくサンプルベースオンライン解法を提案する。
論文 参考訳(メタデータ) (2023-07-22T01:16:29Z) - Controlling dynamical systems to complex target states using machine
learning: next-generation vs. classical reservoir computing [68.8204255655161]
機械学習を用いた非線形力学系の制御は、システムを周期性のような単純な振る舞いに駆動するだけでなく、より複雑な任意の力学を駆動する。
まず, 従来の貯水池計算が優れていることを示す。
次のステップでは、これらの結果を異なるトレーニングデータに基づいて比較し、代わりに次世代貯水池コンピューティングを使用する別のセットアップと比較する。
その結果、通常のトレーニングデータに対して同等のパフォーマンスを提供する一方で、次世代RCは、非常に限られたデータしか利用できない状況において、著しくパフォーマンスが向上していることがわかった。
論文 参考訳(メタデータ) (2023-07-14T07:05:17Z) - Learning Environment Models with Continuous Stochastic Dynamics [0.0]
本研究では,エージェントの制御下での環境行動のオートマトンモデルを学ぶことによって,エージェントが直面する決定に対する洞察を提供することを目的とする。
本研究では,複雑で連続的な力学を持つ環境のモデルを学習できるように,自動学習の能力を高める。
我々は,LunarLander,CartPole,Mountain Car,Acrobotなど,OpenAI GymのRLベンチマーク環境に自動学習フレームワークを適用した。
論文 参考訳(メタデータ) (2023-06-29T12:47:28Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - On Robust Numerical Solver for ODE via Self-Attention Mechanism [82.95493796476767]
我々は,内在性雑音障害を緩和し,AIによって強化された数値解法を,データサイズを小さくする訓練について検討する。
まず,教師付き学習における雑音を制御するための自己認識機構の能力を解析し,さらに微分方程式の数値解に付加的な自己認識機構を導入し,簡便かつ有効な数値解法であるAttrを提案する。
論文 参考訳(メタデータ) (2023-02-05T01:39:21Z) - Interpreting Neural Policies with Disentangled Tree Representations [58.769048492254555]
本稿では,コンパクトなニューラルポリシーの解釈可能性について,不整合表現レンズを用いて検討する。
決定木を利用して,ロボット学習における絡み合いの要因を抽出する。
学習したニューラルダイナミクスの絡み合いを計測する解釈可能性指標を導入する。
論文 参考訳(メタデータ) (2022-10-13T01:10:41Z) - Don't Start From Scratch: Leveraging Prior Data to Automate Robotic
Reinforcement Learning [70.70104870417784]
強化学習(RL)アルゴリズムは、ロボットシステムの自律的なスキル獲得を可能にするという約束を持っている。
現実のロボットRLは、通常、環境をリセットするためにデータ収集と頻繁な人間の介入を必要とする。
本研究では,従来のタスクから収集した多様なオフラインデータセットを効果的に活用することで,これらの課題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2022-07-11T08:31:22Z) - IQ-Learn: Inverse soft-Q Learning for Imitation [95.06031307730245]
少数の専門家データからの模倣学習は、複雑な力学を持つ高次元環境では困難である。
行動クローニングは、実装の単純さと安定した収束性のために広く使われている単純な方法である。
本稿では,1つのQ-関数を学習することで,対向学習を回避する動的適応型ILを提案する。
論文 参考訳(メタデータ) (2021-06-23T03:43:10Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。