Fugu-MT 論文翻訳(概要): ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation

論文の概要: ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation

arxiv url: http://arxiv.org/abs/2008.07792v2
Date: Fri, 26 Mar 2021 04:44:22 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-27 20:37:17.125571
Title: ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation
Title（参考訳）: ReLMoGen: モバイル操作のための強化学習における動き生成の活用
Authors: Fei Xia, Chengshu Li, Roberto Mart\'in-Mart\'in, Or Litany, Alexander Toshev, Silvio Savarese
Abstract要約: ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。 ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
参考スコア（独自算出の注目度）: 99.2543521972137
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Many Reinforcement Learning (RL) approaches use joint control signals (positions, velocities, torques) as action space for continuous control tasks. We propose to lift the action space to a higher level in the form of subgoals for a motion generator (a combination of motion planner and trajectory executor). We argue that, by lifting the action space and by leveraging sampling-based motion planners, we can efficiently use RL to solve complex, long-horizon tasks that could not be solved with existing RL methods in the original action space. We propose ReLMoGen -- a framework that combines a learned policy to predict subgoals and a motion generator to plan and execute the motion needed to reach these subgoals. To validate our method, we apply ReLMoGen to two types of tasks: 1) Interactive Navigation tasks, navigation problems where interactions with the environment are required to reach the destination, and 2) Mobile Manipulation tasks, manipulation tasks that require moving the robot base. These problems are challenging because they are usually long-horizon, hard to explore during training, and comprise alternating phases of navigation and interaction. Our method is benchmarked on a diverse set of seven robotics tasks in photo-realistic simulation environments. In all settings, ReLMoGen outperforms state-of-the-art Reinforcement Learning and Hierarchical Reinforcement Learning baselines. ReLMoGen also shows outstanding transferability between different motion generators at test time, indicating a great potential to transfer to real robots.
Abstract（参考訳）: 多くの強化学習(RL)アプローチでは、連続制御タスクのアクション空間として共同制御信号(位置、速度、トルク)を使用する。本研究では,運動生成器(運動プランナと軌道実行器の組み合わせ)のサブゴールの形で,動作空間をより高いレベルに上げることを提案する。我々は、アクション空間を持ち上げ、サンプリングベースのモーションプランナーを利用することで、従来のアクション空間における既存のRL法では解けない複雑な長い水平タスクを効率的に解決できると主張している。サブゴールを予測するための学習ポリシと,これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークであるReLMoGenを提案する。提案手法を検証するために,ReLMoGenを2種類のタスクに適用する。 1) 対話型ナビゲーションタスク, 目的地に到達するために環境とのインタラクションが必要となるナビゲーション問題, および 2)移動操作タスク,ロボット基盤の移動を必要とする操作タスク。これらの問題は、通常長い水平であり、訓練中は探索が困難であり、ナビゲーションと相互作用の交互フェーズを構成するため、難しい。本手法は,フォトリアリスティックシミュレーション環境における7つのロボットタスクの多種多様なセットでベンチマークを行う。あらゆる設定において、ReLMoGenは最先端の強化学習と階層的強化学習のベースラインを上回ります。 relmogenはまた、テスト時に異なるモーションジェネレータ間の優れた転送可能性を示しており、実際のロボットに転送する大きな可能性を示している。

関連論文リスト

Adaptive Interactive Navigation of Quadruped Robots using Large Language Models [14.14967096139099]
大規模言語モデル(LLM)を用いたタスク計画のための原始木を提案する。動作計画のための多目的移動と相互作用行動を含む総合的なスキルライブラリを事前学習するために強化学習を採用する。ツリー構造に統合されたリプランニングメカニズムにより、便利なノードの追加とプルーニングが可能になる。
論文参考訳（メタデータ） (2025-03-29T02:17:52Z)
Dynamic Path Navigation for Motion Agents with LLM Reasoning [69.5875073447454]
大規模言語モデル(LLM)は、強力な一般化可能な推論と計画能力を示している。本研究では,LLMのゼロショットナビゲーションと経路生成機能について,データセットの構築と評価プロトコルの提案により検討する。このようなタスクが適切に構成されている場合、現代のLCMは、目標に到達するために生成された動きでナビゲーションを自律的に精錬しながら障害を回避するためのかなりの計画能力を示す。
論文参考訳（メタデータ） (2025-03-10T13:39:09Z)
A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文参考訳（メタデータ） (2024-08-11T14:57:57Z)
HYPERmotion: Learning Hybrid Behavior Planning for Autonomous Loco-manipulation [7.01404330241523]
HYPERmotionは、異なるシナリオのタスクに基づいて行動を学び、選択し、計画するフレームワークである。強化学習と全身最適化を組み合わせることで,38関節の運動を生成する。シミュレーションと実世界の実験では、学習した動きが新しいタスクに効率的に適応できることが示されている。
論文参考訳（メタデータ） (2024-06-20T18:21:24Z)
Guided Decoding for Robot On-line Motion Generation and Adaption [44.959409835754634]
本稿では,ロボットアームに高い自由度を持つ新たな動作生成手法を提案する。本研究では,実演として使用する擬似軌道の大規模データセットに基づいて,条件付き変分オートエンコーダに基づくトランスフォーマーアーキテクチャを訓練する。本モデルでは, 異なる初期点と目標点からの運動をうまく生成し, 異なるロボットプラットフォームを横断する複雑なタスクをナビゲートする軌道を生成可能であることを示す。
論文参考訳（メタデータ） (2024-03-22T14:32:27Z)
RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文参考訳（メタデータ） (2023-11-02T17:59:21Z)
Generalizable Long-Horizon Manipulations with Large Language Models [91.740084601715]
本研究は,Large Language Models (LLMs) の機能を活用して,汎用可能な長距離操作のための原始的なタスク条件を生成するフレームワークを導入する。我々は,Pybulletに基づくロボット操作タスクスイートを作成し,長期作業評価を行う。
論文参考訳（メタデータ） (2023-10-03T17:59:46Z)
Nonprehensile Planar Manipulation through Reinforcement Learning with Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。分類分布を用いたマルチモーダル探索手法を提案する。学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文参考訳（メタデータ） (2023-08-04T16:55:00Z)
Causal Policy Gradient for Whole-Body Mobile Manipulation [39.3461626518495]
我々は、典型的なMoMaタスクのポリシーをトレーニングする新しい強化学習フレームワークであるCausal MoMaを紹介する。異なるタスクを対象とした3種類の模擬ロボットにおけるCausal MoMaの性能評価を行った。
論文参考訳（メタデータ） (2023-05-04T23:23:47Z)
Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文参考訳（メタデータ） (2023-04-19T17:37:54Z)
Simultaneous Navigation and Construction Benchmarking Environments [73.0706832393065]
モバイル構築のためのインテリジェントなロボット、環境をナビゲートし、幾何学的設計に従ってその構造を変更するプロセスが必要です。このタスクでは、ロボットのビジョンと学習の大きな課題は、GPSなしでデザインを正確に達成する方法です。我々は,手工芸政策の性能を,基礎的なローカライゼーションと計画,最先端の深層強化学習手法を用いて評価した。
論文参考訳（メタデータ） (2021-03-31T00:05:54Z)
Motion Planner Augmented Reinforcement Learning for Robot Manipulation in Obstructed Environments [22.20810568845499]
本稿では,RLエージェントの動作空間を移動プランナの長期計画能力で拡張する動きプランナ拡張RL(MoPA-RL)を提案する。動作の大きさに基づいて,動作を直接実行し,動作プランナを起動するアプローチを円滑に移行する。実験により、MoPA-RLは学習効率を高め、より高速な探索をもたらし、より安全なポリシーをもたらすことが示されている。
論文参考訳（メタデータ） (2020-10-22T17:59:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。