論文の概要: Adaptive Asynchronous Control Using Meta-learned Neural Ordinary
Differential Equations
- arxiv url: http://arxiv.org/abs/2207.12062v5
- Date: Mon, 23 Oct 2023 10:02:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 14:55:52.188479
- Title: Adaptive Asynchronous Control Using Meta-learned Neural Ordinary
Differential Equations
- Title(参考訳): メタ学習型ニューラルディファレンシャル方程式を用いた適応的非同期制御
- Authors: Achkan Salehi, Steffen R\"uhl, Stephane Doncieux
- Abstract要約: 実世界のロボティクスシステムは、モデルに基づく強化学習と制御の適用性を制限する課題をしばしば提示する。
本稿では,メタラーニング適応力学モデルを用いて連続時間予測と制御を行うことによって,これらの困難を克服する一般的なフレームワークを提案する。
本研究では,2つの異なるロボットシミュレーションと実産業ロボットの評価を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Model-based Reinforcement Learning and Control have demonstrated great
potential in various sequential decision making problem domains, including in
robotics settings. However, real-world robotics systems often present
challenges that limit the applicability of those methods. In particular, we
note two problems that jointly happen in many industrial systems: 1)
Irregular/asynchronous observations and actions and 2) Dramatic changes in
environment dynamics from an episode to another (e.g. varying payload inertial
properties). We propose a general framework that overcomes those difficulties
by meta-learning adaptive dynamics models for continuous-time prediction and
control. The proposed approach is task-agnostic and can be adapted to new tasks
in a straight-forward manner. We present evaluations in two different robot
simulations and on a real industrial robot.
- Abstract(参考訳): モデルに基づく強化学習と制御は、ロボット工学を含む様々な意思決定問題領域において大きな可能性を示している。
しかし、現実世界のロボットシステムは、その方法の適用性を制限する課題をしばしば提示する。
特に、多くの産業システムで共同で発生する2つの問題に留意する。
1)不規則/非同期観測と行動
2) あるエピソードから別のエピソード(例えば、様々なペイロード慣性特性)への環境ダイナミクスの劇的な変化。
本稿では,連続時間予測と制御のためのメタラーニング適応ダイナミクスモデルを用いて,それらの困難を克服する汎用フレームワークを提案する。
提案手法はタスク非依存であり, 直進的に新しいタスクに適応できる。
2つの異なるロボットシミュレーションと実際の産業用ロボットの評価を行った。
関連論文リスト
- Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [92.48012013825988]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - Avoiding Catastrophe: Active Dendrites Enable Multi-Task Learning in
Dynamic Environments [0.5277756703318046]
AIの鍵となる課題は、動的に変化する環境で動作する組み込みシステムを構築することだ。
標準的なディープラーニングシステムは、しばしば動的なシナリオで苦労する。
本稿では生物学的にインスパイアされたアーキテクチャをソリューションとして検討する。
論文 参考訳(メタデータ) (2021-12-31T19:52:42Z) - Learning Reactive and Predictive Differentiable Controllers for
Switching Linear Dynamical Models [7.653542219337937]
専門家による実証から複合ダイナミクス行動を学習するためのフレームワークを提示する。
システムダイナミクスの近接近似としてスイッチング条件にエンコードされた接点を持つスイッチング線形ダイナミクスモデルを学ぶ。
次に、データ効率のよい制御学習のための微分可能なポリシークラスとして離散時間LQRを使用し、制御戦略を開発する。
論文 参考訳(メタデータ) (2021-03-26T04:40:24Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot
Dynamics and Environments [3.5309638744466167]
この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。
提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
論文 参考訳(メタデータ) (2021-01-19T12:57:12Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - ADAIL: Adaptive Adversarial Imitation Learning [11.270858993502705]
本稿では,動的に変化する環境間で伝達可能な適応型ポリシーを学習するための適応型適応型適応模倣学習(ADAIL)アルゴリズムを提案する。
これはロボット学習において重要な問題であり,1)報酬関数の取得が困難であること,2)ドメイン統計を対象とするさまざまなソースによる学習方針の展開が困難であること,3)動的に知られ制御される複数の環境における専門家によるデモンストレーションの収集が不可能であること,などが挙げられる。
論文 参考訳(メタデータ) (2020-08-23T06:11:00Z) - Learning to Control PDEs with Differentiable Physics [102.36050646250871]
本稿では,ニューラルネットワークが長い時間をかけて複雑な非線形物理系の理解と制御を学べる新しい階層型予測器・相関器手法を提案する。
本手法は,複雑な物理系の理解に成功し,PDEに関わるタスクに対してそれらを制御できることを実証する。
論文 参考訳(メタデータ) (2020-01-21T11:58:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。