論文の概要: Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment
- arxiv url: http://arxiv.org/abs/2311.01059v1
- Date: Thu, 2 Nov 2023 08:22:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 14:14:06.986551
- Title: Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment
- Title(参考訳): オン・ザ・ゴー:単寿命ロボット展開のための行動変調
- Authors: Annie S. Chen, Govind Chada, Laura Smith, Archit Sharma, Zipeng Fu,
Sergey Levine, Chelsea Finn
- Abstract要約: 展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
- 参考スコア(独自算出の注目度): 92.48012013825988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To succeed in the real world, robots must cope with situations that differ
from those seen during training. We study the problem of adapting on-the-fly to
such novel scenarios during deployment, by drawing upon a diverse repertoire of
previously learned behaviors. Our approach, RObust Autonomous Modulation
(ROAM), introduces a mechanism based on the perceived value of pre-trained
behaviors to select and adapt pre-trained behaviors to the situation at hand.
Crucially, this adaptation process all happens within a single episode at test
time, without any human supervision. We provide theoretical analysis of our
selection mechanism and demonstrate that ROAM enables a robot to adapt rapidly
to changes in dynamics both in simulation and on a real Go1 quadruped, even
successfully moving forward with roller skates on its feet. Our approach adapts
over 2x as efficiently compared to existing methods when facing a variety of
out-of-distribution situations during deployment by effectively choosing and
adapting relevant behaviors on-the-fly.
- Abstract(参考訳): 現実世界で成功するためには、ロボットはトレーニング中に見られるものと異なる状況に対処する必要がある。
これまでに学習した行動の多様なレパートリーを描きながら,このような新しいシナリオにオンザフライで適応する問題を検討する。
提案手法であるロバスト自律変調(roam)は,事前学習行動の知覚的価値に基づくメカニズムを導入し,事前学習行動の選択と適応を行う。
重要なことに、この適応プロセスはすべて、人間の監督なしに、テスト時に1回以内に行われます。
我々は選択機構を理論的に解析し、roamがシミュレーションと実際のgo1の四足歩行の両方で動的変化に素早く適応できることを示し、さらにはローラースケートを足に乗せて前進させることも可能であることを示した。
本手法は,展開中の様々なアウト・オブ・ディストリビューション状況に直面する場合と比較して2倍の効率で適応する。
関連論文リスト
- Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - ROSO: Improving Robotic Policy Inference via Synthetic Observations [0.0]
本稿では、事前訓練されたポリシーのゼロショット性能を改善するために、生成人工知能の利用を提案する。
我々の実験は、生成AIをロボット推論に組み込むことで、成果が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-11-28T10:52:35Z) - Adaptive Asynchronous Control Using Meta-learned Neural Ordinary
Differential Equations [0.0]
実世界のロボティクスシステムは、モデルに基づく強化学習と制御の適用性を制限する課題をしばしば提示する。
本稿では,メタラーニング適応力学モデルを用いて連続時間予測と制御を行うことによって,これらの困難を克服する一般的なフレームワークを提案する。
本研究では,2つの異なるロボットシミュレーションと実産業ロボットの評価を行った。
論文 参考訳(メタデータ) (2022-07-25T11:07:29Z) - Training and Evaluation of Deep Policies using Reinforcement Learning
and Generative Models [67.78935378952146]
GenRLはシーケンシャルな意思決定問題を解決するためのフレームワークである。
強化学習と潜在変数生成モデルの組み合わせを利用する。
最終方針訓練の性能に最も影響を与える生成モデルの特徴を実験的に決定する。
論文 参考訳(メタデータ) (2022-04-18T22:02:32Z) - Adversarial Training is Not Ready for Robot Learning [55.493354071227174]
対人訓練は,ノルム有界摂動に耐性のあるディープラーニングモデルを訓練する有効な方法である。
敵訓練により得られたニューラルコントローラが3種類の欠陥を受けることを理論的および実験的に示す。
この結果から, ロボット学習にはまだ対応できていないことが示唆された。
論文 参考訳(メタデータ) (2021-03-15T07:51:31Z) - Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot
Dynamics and Environments [3.5309638744466167]
この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。
提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
論文 参考訳(メタデータ) (2021-01-19T12:57:12Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z) - Environmental Adaptation of Robot Morphology and Control through
Real-world Evolution [5.08706161686979]
機械的に自己再構成された四足歩行ロボットに形態学と制御の組み合わせを得るために進化探索を適用した。
2つの異なる物理曲面上の解を進化させ、制御と形態の両方の観点から結果を解析する。
論文 参考訳(メタデータ) (2020-03-30T07:57:19Z) - Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning [65.88200578485316]
本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
提案手法は高雑音環境における動的変化への適応性を著しく改善する。
我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-03-02T22:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。